人工智能代理将改变企业格局,从自动化日常任务到推动客户服务和创新。但建立强大的防护措施将是成功的关键。
图源:Gorodenkoff / Shutterstock
人工智能的下一次进化已经到来,那就是代理式人工智能(AI智能体)。人工智能代理由与聊天机器人相同的人工智能系统驱动,但可以独立行动,协作实现更大的目标,并接管整个业务工作流程。这项技术相对较新,但所有主要参与者都已经加入。 10 月,微软宣布包括 Standard Bank、Thomson Reuters、Virgin Money 和 Zurich Insurance 在内的 10 万家组织正在使用 Copilot Studio,仅几个月前,这一数字翻了一番。Copilot Studio 允许企业构建自主代理,以及将 CRM 系统、HR 系统和其他企业平台连接到 Copilot 的其他代理。 在 2024 年底,微软继续通过针对特定用例的专用代理扩展其代理产品。然后在 11 月,该公司推出了 Azure AI Agent Service,这是一项完全托管的服务,使企业能够快速构建、部署和扩展代理。在 AWS 上,Amazon Bedrock Agents 自 2023 年以来一直可用,但在 12 月,亚马逊增加了多代理协作功能。
主要的商业软件供应商也纷纷加入代理游戏。Salesforce 在 10 月推出了 Agentforce,几个月后又推出了 Agentforce 2.0。此次升级包括一个预构建技能和工作流集成库,对 Slack 的支持以及更好的推理能力。
在此之前,ServiceNow 在 9 月宣布了其 AI Agents 产品,其首批用例是客户服务管理和 IT 服务管理,于 11 月推出。 还有 CrewAI 等纯粹的代理式 AI 平台提供商以及 UiPath 等智能自动化提供商。而这仅仅是个开始。在 1 月初发布的一份报告中,埃森哲预测,到 2030 年,人工智能代理将取代人类,成为大多数企业系统的主要用户。在毕马威 1 月对大型企业 100 位高级管理人员进行的调查中,12% 的公司已经部署了人工智能代理,37% 的公司处于试点阶段,另有 51% 的公司正在探索其用途。但并非一帆风顺,因为生成式人工智能本身远非完美。
埃森哲首席负责任人工智能官 Arnab Chakraborty 表示:“幻觉和偏见存在风险。因此,这不仅关乎用例,还关乎防护措施。”代理也很难构建,而且规模化部署成本很高。 尽管如此,企业已经在几个用例中成功部署了人工智能代理。
1. 软件开发和 IT
Cognition 去年 3 月发布了 Devin,它被称为世界上第一个人工智能软件工程师。当时,最好的人工智能在 SWE-bench(一项旨在了解人工智能解决现实世界编码问题能力的具有挑战性的基准)上的通过率还不到 5%。Devin 的得分接近 14%。到 8 月,代理式人工智能系统的得分接近 40%,如今,它们已经超过了 60% 的里程碑。
与此同时,12 月,OpenAI 的新 O3 模型(一种尚未向公众提供的代理模型)在同一测试中获得了 72% 的分数。根据 Capgemini 在 2024 年中期发布的一项调查,大型公司 60% 的高管表示,人工智能代理将在三到五年内处理企业的大部分编码工作。
但是,软件开发生命周期中已经有一些工作岗位准备好接受人工智能代理的帮助。 Mitre 首席技术官 Charles Clancy 表示:“我们已经开发了自己的代码管理代理式人工智能。”“似乎效果最好的用例是存储库管理,它会遍历并修复代码存储库中的错误。”
例如,他说,10 年前的源代码可能无法在现代计算机上正确编译。 “人工智能代理会下载它,尝试构建它,如果它无法运行,它会修复构建脚本和必要的代码,将代码签回存储库,并标记它是由人工智能代理完成的,”他说。 Clancy 补充说,Mitre 不得不创建自己的系统,因为大多数现有工具都使用供应商管理的云基础设施进行人工智能推理。“出于安全原因,我们不能这样做,”他说。
还有一个独立的研究项目正在研究 50 年前的大型机代码,并使用人工智能提取业务逻辑并将其重写为云原生框架,他说。 “我们的目标是实现所有政府组织中复杂的、任务关键的遗留 IT 系统的现代化,”他说。 这些系统中有数百万行代码,它们是用 COBOL、MUMPS 甚至与原始硬件绑定的汇编语言编写的。“我们正在开发自己的定制人工智能模型,以提高对稀有平台的代码理解,”他补充道。
Mitre 还在 Mitre 管理的安全云环境中,使用 AWS Bedrock 测试了数十种商业人工智能模型。到目前为止,已经处理了超过 50 万行代码,但由于存在幻觉和其他质量问题的风险,因此需要人工监督。 Clancy 说:“我们还发现,代理式人工智能可以与为软件工程师开发的工具配合使用,从而大大提高验证和编译代码的成功率。”这为训练新的人工智能以减少监督需求提供了潜在途径。“即使考虑到必要的人工监督,这个过程每天都在加快。” 12 月,Langbase 基于来自高管和技术专业人士的 3,400 多份回复发布了一份人工智能代理状态报告。人工智能代理的首要用例是软件开发,87% 的受访者提到了这一点。此外,48% 的人表示他们正在 IT 和运营中使用 LLM。
2. 自动化和生产力
由于人工智能代理可以接触到许多系统,因此工作流自动化和生产力是企业的首要用例。根据毕马威的报告,管理职责是人工智能代理的主要用例,60% 的受访者提到了这一点。以全球律师事务所 Avantia 为例,该公司使用商业和开源生成式人工智能为其代理提供支持。“我们这个领域的关键挑战是,有数百个任务可能没有得到很好的自动化,”首席技术官 Paul Gaskell 说。“而且它们不太适合 SaaS 解决方案。在太多的地方有太多独立的任务。” 现在,借助微软,人工智能代理可以充当 Word 或 Outlook 中的助手,随时执行任务。 “如果客户要求我们执行交易或工作流,并且 Outlook 或 Word 已打开,人工智能代理可以访问所有公司数据,”他说。“而且由于这些是我们的律师处理我们的文件,我们有他们通常做什么的历史记录。”
其商业优势在于,律师可以比其他任何人更快地完成合同流程、更快地响应客户和更快地进行交易。 Gaskell 预计到 2025 年中期,利润率将提高 45%。“我们已经对我们已经完成的工作进行了时间和动作研究,”他说,“我很难想象这不会成为专业服务行业的未来。” Gaskell 说,他的公司对 LLM 持不可知态度,这意味着人工智能代理可以由不同的 LLM 提供支持,具体取决于哪个最适合。他说,这包括几个主要的开源模型,因为它们提供隐私、成本优势和更低的延迟。人工智能代理目前在超大规模企业中运行,但该公司正在考虑投资自己的 GPU 并在托管设施中租用空间以进一步降低成本。
另一家使用代理实现业务流程自动化的公司是金融服务和医疗保健技术公司 SS&C。 “我们从 20,000 个客户那里收到大量格式各异的文件,”公司自动化高级董事总经理 Brian Halpin 说。这些文件可以是 PDF、数字表单、电子邮件,关键信息可以位于任何地方,并以不同的方式呈现。这加起来每月需要处理数百万份文件。“理解文件的上下文的能力是根本,”他补充道,过去,这一直是阻碍自动化的最大因素,生成式人工智能可以提供帮助。 “因此,今天,我们有 20 个围绕人工智能代理处理文件的生产用例,”Halpin 说。“这是积极且强大的。”数据保存在私有云中以确保安全,LLM 也在内部托管。Halpin 说,SS&C 使用 Meta 的 Llama 以及其他模型。
该系统于 2024 年中期投入生产,11 月处理了 50,000 份文件。“我们将继续加大力度,”他说。 他说,使用传统的自动化,人类必须查看几乎每份文件。使用人工智能,这个百分比被颠倒了。例如,对于贷款文件类型,自动化百分比在 90% 左右,只有少数百分比的文件需要人工审核。
3. 客户服务和支持
在 Dun & Bradstreet,人工智能代理帮助客户与研究公司收集的关于全球 5 亿家企业的信息进行交互。
“我们为 95% 的财富 500 强企业提供服务,他们使用我们的数据做出一些最关键的决策,”公司首席数据和分析官 Gary Kotovets 说。他说,这包括信用决策和供应链决策。这些数据还用于销售和营销。 “对我们来说,代理对于与我们的数据交互至关重要,”他说。“它们允许客户提出
关于公司的问题,人工智能代理将确保与该公司相关的数据是最准确的信息。”这并不总是那么容易,因为许多公司的名称和地址都很相似。“这就是代理发挥作用的地方。我们的代理会说,‘让我确保这家公司是他们询问的实际公司。’他们能够理解所提出的问题。”4. 内容创作编写文本和创建图像是生成式人工智能最初的两个流行用例。现在,人工智能代理可以增强内容创建过程。根据 Langbase 的调查,文本生成和摘要是第二大最流行的用例,59% 的受访者提到了这一点,其次是营销和传播,占 50%。安永在其第三方风险管理服务中使用人工智能代理。
安永合伙人 Sinclair Schuller 说:“您聘请我们评估您引入的供应商。”“我们的风险评估员会完成这项工作,在一个供应商身上花费多达 50 个小时,仔细研究合同和其他文件,生成一份指出我们观察到的风险的报告。” 在生成式人工智能出现之前,通常是这样做的。 “现在我们可以将所有联系方式和公共文档提供给人工智能,它可以在几分钟而不是几天内生成一份具有极高准确性和详细程度的报告,”他说。然后人类专家会增强这些报告。“人工智能加上人类专业知识可以极大地提高质量,”他说。 现在,借助代理式人工智能,这个过程再次发生变化。
“我们将发布此过程的代理驱动版本,它将持续监控供应商,这在以前是不可能的,”他说。 他说,这是公司在考虑人工智能代理时经常忽略的事情。“很多人都专注于优化用例,”他说。“但真正的价值在于市场的扩张和收入机会的扩张。”
5. 人力资源和员工支持
人工智能代理的另一个相对低风险、高价值的用例是回答员工问题并代表他们处理简单的任务。事实上,IBM 1 月份关于生成式人工智能开发的调查得出结论,43% 的公司将人工智能代理用于人力资源。 例如,全球数据服务公司 Indicium 在 2024 年中期开始部署人工智能代理,当时该技术开始成熟。 “你会开始看到现成的应用程序——包括开源和专有的应用程序——使构建它们变得更容易,”公司首席数据官 Daniel Avancini 说。 他说,这些代理用于简化人力资源的工作,包括内部知识检索、标记和文档记录等任务,以及其他业务流程。每个代理都像一个微服务,专门处理一个特定的事情。“它们都在多代理系统中相互通信,”他说。这些基于提示的对话可能会很特殊。棘手的是,存在幻觉和生成式人工智能带来的所有其他问题的可能性。“因此,我们需要对模型进行大量调整,以确保它们不会做错事或访问错误的信息,”他说。 从积极的方面来看,人工智能代理可以自主处理许多问题,因此这具有商业优势。“我们还发现了一些没有正确记录的事情,因此它有助于我们改进流程,”他补充道。
6.信任但验证
从一开始,安全性就是人工智能代理开发的基石。事实上,最早的代理框架之一是 BabyAGI,它于 2023 年初发布,它将 ChatGPT 与用于内存的 Pinecone 向量数据库和用于编排的 LangChain 相结合。创建它的开发人员开玩笑地要求它尽可能多地创建回形针——这是指由不受控制的人工智能引起的假设的回形针末日——系统立即意识到潜在的问题,并首先为自己生成一个安全协议。但大多数代理式人工智能开发人员都不愿意对人工智能抱有如此大的信心。 在 LangChain 11 月对 1,300 多名专业人士进行的调查中,55% 的受访者表示,跟踪和可观察性工具是人工智能代理的必备控制措施,有助于他们了解代理的行为和性能。此外,44% 的人设置了防护措施,40% 的人使用了离线评估。 瑞典于默奥大学教授、计算机协会技术政策委员会主席 Virginia Dignum 说:“人工智能模型存在风险,会犯各种错误。” 但她说,可以创建系统来捕捉错误,因此如果代理无法完成任务,它会承认失败,而不是试图编造一些东西。 “关于这方面的研究很多,理论上是存在的,”她说。“但据我所知,目前还没有真正合适的代理式界面。一旦你开始开发这些系统,你就需要处理后果以及其中一个系统做错事会发生什么。” 这意味着需要治理和监管。代理框架不仅需要处理可能的人工智能错误带来的实际和商业影响,还需要处理法律影响。 “如果这些问题得不到解决,那么我认为企业代理就不会有太大的用处,”她说。 企业在部署人工智能代理时还需要应对另一个风险:人工智能代理实现的人工智能驱动的自动化规模可能造成的破坏和负面结果。Wipro Technologies 副总裁兼全球人工智能负责人 Pushpa Ramachandran 说,部署这些系统时,变更管理流程非常重要。“我看到很多客户在这方面花费了更多的时间,”他说。提前花费额外的时间意味着公司从长远来看可以走得更远。“对变更管理流程考虑周全的公司可以更快地扩展,”他说。
【睿观:AI 代理(AI 智能体)具有巨大的商业潜力,但企业需要谨慎部署,并充分考虑其带来的风险和挑战。通过建立强大的防护措施和进行有效的变更管理,企业可以充分利用 AI 代理的优势,提高效率、降低成本、并推动创新。
人工智能代理(AI agents)是人工智能的下一个进化阶段,它能够独立行动,协作完成复杂任务,并接管整个业务流程。
尽管存在幻觉、偏见和部署成本等挑战,但企业已经在多个领域成功部署了 AI 代理,并取得了显著成效。
建立强大的防护措施和进行有效的变更管理是成功部署 AI 代理的关键。
AI 智能体的 5 大商业用例:
软件开发和 IT:
AI 代理能够进行代码管理、bug 修复、遗留系统现代化等任务,提高软件开发效率。
例如,Mitre 使用 AI 代理进行代码仓库管理和遗留大型机代码的现代化。
自动化和生产力:
AI 代理能够自动化行政任务、处理文档、优化工作流程,提高员工生产力。
例如,Avantia 使用 AI 代理处理合同流程,SS&C 使用 AI 代理处理大量文档。
客户服务和支持:
AI 代理能够回答客户问题、提供个性化服务、提高客户满意度。
例如,Dun & Bradstreet 使用 AI 代理帮助客户查询企业信息。
内容创作:
AI 代理能够生成文本、图像、报告等内容,提高内容创作效率和质量。
例如,EY 使用 AI 代理进行第三方风险评估。
人力资源和员工支持:
AI 代理能够回答员工问题、处理简单任务、提高 HR 效率。
Indicium使用AI代理进行内部知识检索,文档记录等。
部署 AI 代理的注意事项:
安全性和可靠性:
AI 模型存在幻觉和错误的风险,需要建立系统进行错误检测和纠正。
需要加强治理和监管,处理 AI 代理可能带来的法律和伦理问题。
变更管理:
AI 代理的部署可能对企业造成颠覆性影响,需要进行有效的变更管理。
需要对员工进行培训,使其适应 AI 驱动的工作环境。
防护措施:
追踪和可观察性工具,是必须的控制措施。
离线评估,和防护栏的设立,能有效降低风险。】