你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
微软借磁力一号(Magnetic-One)加入多代理之争
作者:CIO&睿观 来源:CIOCDO 发布时间:2024年11月08日 点击数:

【睿观:磁力一号(Magnetic-One)的核心特点与优势

  • 多智能体协作: 通过多个AI代理的协同工作,实现复杂任务的自动化。

  • 开放性: 基于开源框架AutoGen,具有较高的可扩展性。

  • 通用性: 能够处理多种任务,如网络浏览、文件处理、代码编写等。

  • 强大推理能力: 基于GPT-4o等大型语言模型,具备强大的语言理解和生成能力。

  • 灵活的架构: 可以根据不同任务需求,灵活组合和配置代理。】


与竞争对手的对比



从上表可以看出,Magnetic-One在多智能体协作和通用性方面具有较强的竞争力。相比之下,Salesforce Agentforce更专注于客户关系管理领域,而IBM Bee Agent Framework则侧重于大规模代理工作流的构建。

Magnetic-One的潜在应用场景

  • 自动化办公: 自动化处理邮件、文档、表格等任务,提高办公效率。

  • 软件开发: 自动生成代码、测试代码,加速软件开发过程。

  • 数据分析: 自动收集、整理、分析数据,生成报告。

  • 客户服务: 自动化回答客户问题,提供个性化服务。



Magnetic-One是由微软研究团队开发的一种新型多智能体系统,旨在通过多个智能体的协同工作来提升个人和企业的工作效率。该系统允许一个AI模型驱动多个助手智能体,共同完成复杂的多步骤任务。)Salesforce(创建于1999年3月的一家客户关系管理/CRM软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台)Agentforce是由Salesforce推出的一套开创性的自主AI代理套件,旨在增强员工能力并处理服务、销售、营销和商务中的任务,从而提高工作效率和客户满意度。其通过几次点击即可按需扩展员工队伍,其无限数字AI代理团队可以分析数据、做出决策,并在回答客户服务咨询、确定销售线索和优化营销活动等任务上采取行动。)IBM(国际商业机器公司或万国商业机器公司,总公司在纽约州阿蒙克市。IT公司-国际商业机器公司。1911年托马斯·约翰·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 31万多人,业务遍及160多个国家和地区。)Bee Agent Framework(是一个由IBM开发人员发布的开源框架,主要用于大规模构建、深入和服务代理工作流程。)multi-agent frameworks多智能体框架,‌是一种将复杂的系统分解为多个独立的智能体,这些智能体通过相互通信和协作来共同完成复杂任务的系统架构。每个智能体具有独立的目标和行为,通过竞争和磋商等手段解决相互之间的矛盾和冲突,从而实现系统的整体目标。)的竞争对手,它们面向希望让AI完成目前由人类处理的复杂任务的企业。


图源:Andrey_Popov / Shutterstock



Microsoft(微软,是一家美国跨国科技企业,1975年4月4日创立。公司总部设立在华盛顿州雷德蒙德/Redmond,邻近西雅图,以研发、制造、授权和提供广泛的电脑软件服务业务为主。最为著名和畅销的产品为Windows操作系统和Office系列软件,是全球最大的电脑软件提供商、世界PC/Personal Computer/个人计算机,软件开发的先导。)希望企业相信其multi-AI agent多智能体系统,‌是由多个自主的AI智能体组成的系统,这些智能体共同协作以完成特定任务或解决复杂问题。与单个独立运行的AI智能体不同,多智能体系统通过多个智能体的协同工作,利用各自的独特能力来提高性能和效率。)将使他们能够自动化以前需要人工干预的复杂任务。


作为最近几个月进入市场的众多Agentic AI(代理人工智能,是一种高级的人工智能系统,它能够自主规划和采取行动以实现用户定义的目标。核心特点包括自主设定目标、做出决策和根据对复杂环境的理解采取行动。产品之一,Magnetic-One建立在微软先前发布的开源代理开发框架AutoGen(‌是一个由微软发布的工具,旨在帮助开发者创建基于LLM的复杂应用程序。其通过多代理对话框架,简化了复杂LLM工作流程的编排、自动化和优化,从而提高了LLM模型的性能并克服了它们的弱点。)之上。


微软预计,这种通用多代理系统也将是开放的,目前将用于开放式的基于网络和文件的任务,但它的目标是创建一个能够处理涉及推理的复杂任务的多代理系统,如自动订餐或安排产品交付。


新的多代理系统将在一定程度上回应Salesforce的首席执行官Marc Benioff马克·贝尼奥夫对微软现有AI产品的批评:Copilot是微软在Windows 11中加入的AI助手,该AI助手是一个集成了在操作系统中的侧边栏工具,可以帮助用户完成各种任务。更像是Clippy 2.0,他指的是曾经在Microsoft Office(是一套由微软公司开发的办公软件集合,旨在提高办公工作的效率和便捷性。它包括多种应用程序,如Microsoft Word、Excel、PowerPoint和Outlook等,广泛应用于文字处理、电子表格、幻灯片演示和电子邮件管理等领域。)那个提供写作帮助但命运多舛且令人恼火的动画回形针。


Magnetic-One具有多代理架构,其中一个代理,即Orchestrator(‌是一个自动化解决方案,主要用于IT环境中的流程自动化。它通过图形用户界面Runbook Designer将不同的任务和过程捆绑在一起,创建可靠、灵活且高效的端到端解决方案。其可以在数据中心中实现流程自动化,不考虑硬件或平台,并且能够连接来自不同供应商的系统,而无需知道如何使用脚本和编程语言。),指导其他四个代理解决给定任务。


该公司在博客文章中解释说:“Orchestrator计划、跟踪进度并重新计划以从错误中恢复,同时指导专业代理执行操作网络浏览器、导航本地文件或编写和执行Python(计算机编程语言,由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。Python解释器易于扩展,可以使用C语言或C++,或者其他可以通过C调用的语言,扩展新的功能和数据类型。Python也可用于可定制化软件中的扩展程序语言。Python丰富的标准库,提供了适用于各个主要系统平台的源码或机器码。)代码等任务。”


根据微软的解释来看,Orchestrator代理听起来与SalesforceAtlas推理引擎非常相似,后者控制着Agentforce中的代理循环。


Magnetic-One中的其他四个子代理包括WebSurferFileSurferCoderComputer Terminal


WebSurfer是基于LLM大型语言模型。是使用深度学习算法处理和理解自然语言的基础机器学习模型。这些模型在大量文本数据上进行训练,以学习语言中的模式和实体关系。LLM可以执行多种类型的语言任务,例如翻译语言、分析情绪、聊天机器人对话等。)的代理,可以在基于Chrome的网络浏览器上管理任务。FileSurfer可以命令一个基于Markdown的文件预览应用程序,以便读取大多数类型的本地文件。Coder专门负责编写代码、从其他代理收集信息、分析信息并创建新工件。与此同时,Computer Terminal代理为多代理系统能够访问控制台外壳,在其中可以执行Coder的程序并安装新的编程库。


鉴于架构和子代理,Magnetic-One似乎应该能够在计算机上完成任务,类似于Anthropic目前正在测试版本中展示的计算机使用能力——但有一个限制,即Magnetic-One的计算机访问仅限于浏览网络和查看文件。


Magnetic-One系统至少在微软当前的实现中,使用GPT-4o(GPT-4o的名称中“o”代表Omni,即全能的意思,凸显了其多功能的特性,GPT-4o是OpenAI为聊天机器人ChatGPT发布的语言模型,可以实时对音频、视觉和文本进行推理,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量,并能够读取人的情绪。可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。北京时间2024年5月14日凌晨,OpenAI宣布推出GPT-4o,GPT-4o在处理速度上提升了高达200%,同时在价格上也实现了50%的下降,GPT-4o所有功能包括视觉、联网、记忆、执行代码以及GPT Store等,将对所有用户免费开放。5月15日,OpenAI联合创始人兼首席执行官山姆·奥特曼就GPT-4o说明称,尽管GPT-4o的文本模式已经发布,但语音模式还未发布。)作为所有代理的底层LLM,但微软表示,任何其他LLM都可以用于各种代理,包括Orchestrator,并与专门为其他代理执行某些任务的小型语言模型结合使用。


然而,公司指出,企业或开发者应该使用具有强大推理能力的LLM,以充分利用多代理系统。


它还发布了一个代理评估工具AutoGenBench(是一个开源的智能体评估工具,由微软发布。它的主要目的是测试智能体系统的效果,基于之前发布的Autogen框架,支持多智能体之间的通信与合作。,帮助开发者借助基准测试测试任何Magnetic-One实现。


微软警告Magnetic-One的潜在用户要采取预防措施,包括在容器中运行代理以隔离它们并防止任何直接攻击,并密切监控日志以检测和减轻代理的风险行为。


此外,微软表示,代理的互联网访问应该受到限制,并且始终应该有碳基员工"碳基员工"这个术语通常用来指代传统的人类员工,与"硅基员工"相对。在AI和数字技术迅速发展的背景下,"硅基员工"指的是由人工智能和数字技术驱动的虚拟员工或机器人。这一概念反映了职场中人类劳动力与技术驱动劳动力之间的区别和潜在转变。)监督它们。


最后,它警告开发者不要给代理访问敏感数据或任何有可能被泄露的资源。


作者:Anirban Ghoshal(阿尼尔班·戈沙尔)

Anirban Ghoshal(阿尼尔班·戈沙尔)是CIO.com的高级撰稿人,负责报道企业软件,以及InfoWorld的数据库、云和人工智能基础设施。