将AI代理集成到现有系统中是一项复杂而艰巨的任务,它涉及到技术、业务、组织等多个方面的挑战。传统企业在进行AI转型时,需要仔细评估自身的IT基础设施、业务流程以及组织文化,制定一个切实可行的AI战略。尽管供应商表示他们目前基于代理人工智能的产品很容易实现,但分析师表示这远非事实。
来源:Gorodenkoff / Shutterstock
软件供应商的宣传正在不断演变,代理型人工智能(AI agent)开始在营销信息中取代生成型人工智能。他们表示,代理型人工智能不仅仅是生成代码或内容供人类审核,它还会像人类一样遵循指令、做出决策并采取行动,而无需人工干预。
一、它不仅仅是一个更智能的 RPA
Agentic AI不仅仅是机器人流程自动化 (RPA)的更好版本:它有望帮助企业实现 RPA 无法实现的目标。
“将 RPA 想象成轨道上的火车——它只能沿着轨道行驶。Agentic AI 更像是一辆自动驾驶汽车——它可以自适应地导航不同的路线和情况,”基于 Agentic AI 的软件提供商初创公司 Doozer AI 的联合创始人 Paul Chada 说道。
Nucleus研究公司高级分析师卡梅伦·马什 (Cameron Marsh) 表示,代理 AI 之所以能够自主或独立采取行动,是因为它能够解释数据、预测结果并做出决策,从新数据中学习,而不像传统的 RPA,在遇到意外数据时就会失败。
Chada表示,代理 AI 的这种自适应特性可以帮助企业提高效率,处理传统 RPA 无法管理的复杂多变的任务,例如理赔员、贷款员或案件工作者的角色,前提是它可以访问完成任务所需的必要数据、工作流程和工具。
软件供应商已经在宣传可以访问这些资源的代理AI 产品,其中包括Salesforce 的 Agentforce、微软基于 Copilot 的自主代理、ServiceNow 的 AI 代理、谷歌的 Vertex AI Agent Builder、亚马逊 Bedrock Agents和IBM 的 watsonx Agent Builder,并且可能会有更多产品效仿。
那么,CIO是否应该投资这项技术呢,还是应该等待呢?
二、一名优秀经纪人的早期历程
Agentic AI承诺实现无需人工干预的自动化,供应商表示,这很容易实现,但行业分析师和其他专家表示,对于当今新兴的 Agentic AI 技术来说,这与事实相去甚远。
Gartner 分析师汤姆·科绍 (Tom Coshow) 在 10 月初的一篇博客文章中写道:“目前基于法学硕士学位的人类助理与成熟的人工智能代理之间存在很大差距。”他指出,为了缩小这一差距,企业必须学会构建、管理和信任它们。
Coshow预测,即使到 2028 年,也只有三分之一的企业应用能够采用代理人工智能,从而实现“15% 的日常工作决策自主做出”。
对于Dev Consult Canada 首席顾问 Martin Bechard 来说,“Agentic [AI] 处于早期采用阶段,初始产品存在缺陷。”
企业软件初创公司投资者Tola Capital 的 Greg Ceccarelli 表示,衡量代理式 AI 何时能够得到更广泛应用也是一个棘手的问题。“目前行业面临的最大障碍之一是缺乏针对特定工作流的基准”,用于比较代理和人类在某项任务上的表现,他说,而现有的少数基准,如OSWorld,本质上非常学术。“目前,业界对这个话题的讨论还处于起步阶段。”
【睿观:OSWorld 是一个用于衡量人工智能代理在执行特定任务时表现的基准测试框架。该框架的基本要求包括:
多样化任务:OSWorld 提供包括自然语言处理、图像识别、决策制定等多个领域的任务,以便全面评估代理的能力。
标准化数据集:为保证评估的公平性与一致性,OSWorld 提供统一、经过验证的数据集和任务标准。
可重复性:测试框架设计确保任何实验都可以被重复,以验证结果的可靠性。
开放性:OSWorld 是开放的,这意味着研究者和从业者可以根据实际需求添加新的任务或修改现有任务。
学术性与实际应用:虽然它具有学术性质,但也强调其结果能够在现实环境中应用,以验证代理的实际效用。
OSWorld 的工作原理通常涉及以下几个步骤:
任务设定:明确需评估的任务或能力领域。
数据收集与处理:通过标准化的数据集来训练和测试人工智能模型。
基准测试:运行代理模型,并记录其在各种任务中的表现。
结果分析:通过比较人类和代理的表现,分析模型的能力与不足之处。
自然语言处理:评估AI在翻译、摘要提取、语义分析等任务上的表现,帮助开发更智能的对话系统。
图像识别:用于测试AI在图像分类、对象检测等任务中的表现,应用于自动驾驶、安防监控等领域。
自动化决策系统:在金融分析、推荐系统等领域验证AI的决策能力,优化商业决策流程。
在国际上,AI基准测试仍处于快速演变与发展阶段:
多元基准的增加:越来越多的新测试基准被开发出来,以涵盖更多样化的应用场景,如医疗AI、环境监控AI等。
合作与开源:不少国际研究机构和企业正在合作,推动更多基准测试的开源化,以促进AI技术的普及和透明化。
技术挑战与竞赛:如NLP领域的GLUE、SUPERGLUE,在国际AI会议上设立相关挑战赛,推动技术进步并分享最新成果。
伦理与公平性:国际上也有对基准测试中伦理和公平性问题的考量,确保AI模型不仅是性能优越的,而且在使用时是公平和负责任的。
综上所述,OSWorld作为一个基准测试框架,为AI的开发和评估提供了一个标准,但也需要不断更新以适应快速变化的技术环境和更加多样化的应用需求。】
三、Agentic AI的应用并不容易
尽管供应商将他们的代理AI 工具描述为易于采用,但这并不像在工作流程中用代理取代人类决策者那么简单。
研究公司The Futurum Group 首席信息官实践副总裁 Dion Hinchcliffe 表示,从最简单的层面来说,已经设计为与人类合作的 RPA 工作流程很可能需要进行重大重新设计,才能为代理 AI 做好准备。他说,利用代理 AI 处理非结构化数据、管理上下文决策和动态交互的能力通常并不像更新现有脚本或工作流程那么简单。
Moor Insights and Strategy首席分析师 Jason Andersen 表示,必要的工程工作可能包括评估并向代理平台公开正确的服务、API、数据和控制,以确保代理具有完成给定任务的背景和工具。
对于IT 咨询公司 Eden Digital 的创始人 Anil Clifford 来说,企业需要转变其整体方法向自动化方向发展,因为代理 AI 的概率性质与传统的确定性自动化有着根本的不同。
四、努力让工作更轻松
分析师表示,一些平台供应商已经提供低代码和无代码代理开发和管理平台,但这些平台的功能仅限于构建简单代理或修改供应商自己构建的代理的模板。
【睿观:当前市场上低代码/无代码代理开发平台的局限性:它们往往只能用于构建简单的代理,或者是对供应商预设的模板进行微调。换句话说,这些平台的灵活性有限,难以满足复杂、定制化的需求。
扣子平台 作为字节跳动推出的一款AI Bot开发平台,其核心目标是降低AI应用开发的门槛,让用户能够快速、低成本地构建个性化的聊天机器人。
是否属于类似应用?
相似之处: 扣子平台确实提供了一种低代码/无代码的开发方式,用户可以通过可视化界面和预设组件来搭建机器人,无需深入了解编程细节。这与文中提到的平台在降低开发门槛方面具有一致性。
差异之处:
功能丰富度: 扣子平台提供了更多的功能和组件,包括插件、长短期记忆、工作流等,使得用户能够构建更加复杂和智能的机器人。
开放性: 扣子平台似乎在一定程度上提供了更多的定制化空间,用户可以根据自己的需求来调整和扩展机器人。
应用场景: 扣子平台的应用场景更加广泛,不仅局限于简单的问答,还可以用于各种任务型对话、信息检索等。
结论: 扣子平台虽然属于低代码/无代码开发平台的范畴,但相比于文中提到的平台,它在功能、灵活性以及应用场景上都表现出了更强的扩展性。
一般来说,低代码/无代码开发平台的国际化发展趋势主要包括:
功能的不断完善: 随着技术的进步和用户需求的增加,平台会不断推出新的功能和组件,以满足更复杂的开发需求。
生态系统的构建: 平台会积极构建开发者生态,提供丰富的文档、教程、社区支持,吸引更多的开发者参与。
与其他工具的集成: 平台会加强与其他工具和服务的集成,提高开发效率。
全球化拓展: 平台会拓展到更多的国家和地区,支持多种语言和文化。
总结
扣子平台作为字节跳动在AI领域的一款重要产品,代表了低代码/无代码开发平台的发展方向。它的出现,降低了AI应用开发的门槛,为广大开发者和企业提供了更多的可能性。未来,随着技术的不断进步,可以期待扣子平台在功能、性能和易用性方面取得更大的突破。】
Futurum的 Hinchcliffe 表示:“创建更复杂的代理,特别是需要定制集成和细致决策能力的代理,仍然需要对数据流、机器学习模型调整和 API 集成有一定的技术理解。”他补充说,这些平台有一个学习曲线,迁移过程可能会耗费大量资源。
马什表示,Nucleus Research采访过的大多数尝试代理 AI 的企业都表示,学习曲线比供应商声称的要陡峭,特别是在大规模实施代理 AI 所需的定制深度方面。
Moor的 Andersen 给出了一个具体的例子:虽然无代码平台提供了连接器等集成工具来与其他应用程序协同工作,但经验丰富的开发人员或企业架构师必须首先设置整个后端工作流程,然后才能创建代理来使用此类应用程序完成复杂的任务。
仍在运行旧版应用程序的企业还有其他担忧,因为这些应用程序的连接器可能不可用或功能有限。
“这些系统通常存在集成挑战,很难对现有技术堆栈进行重大更改。这就像试图将一台全新的超级智能计算机安装到仍在旧软件上运行的机器上的旧工厂中,”谷歌云客户工程师Shruti Dhumak 表示,并补充说,在云端诞生的初创公司或公司可能会更容易采用代理 AI。
【睿观:将AI代理集成到现有系统中是一项复杂而艰巨的任务,它涉及到技术、业务、组织等多个方面的挑战。传统企业在进行AI转型时,需要仔细评估自身的IT基础设施、业务流程以及组织文化,制定一个切实可行的AI战略。
技术堆栈的不兼容性: 传统的企业系统往往基于多年积累的、复杂的技术栈。这些系统可能使用了过时的编程语言、数据库,以及各种各样的遗留系统。而AI代理,尤其是那些基于最新深度学习框架的,对计算资源、数据格式以及系统架构都有着更高的要求。将两者强行结合,就像把一台超级计算机塞进一台老旧的机器里,必然会遇到各种各样的兼容性问题。
系统改造的巨大成本: 要将AI代理无缝集成到现有的系统中,往往需要对整个系统进行大规模的改造。这不仅涉及到技术层面的改动,还包括业务流程的调整、人员的培训等,这对于企业来说是一笔巨大的投入。
风险的不可控性: 系统改造过程中,任何一个小小的失误都可能导致整个系统的崩溃。这对于企业来说是不可接受的风险。
技术栈相对简单: 初创公司通常从零开始构建自己的系统,技术栈相对比较新,更容易与AI代理进行集成。
对新技术的接受度更高: 初创公司更加灵活,对新技术有着更高的接受度,愿意尝试新的解决方案。
成本压力相对较小: 相比于传统企业,初创公司对成本的考虑相对较少,更容易进行大规模的系统改造。
以下是一些建议:
从小规模开始: 可以先从一些小的、独立的业务场景开始尝试,逐步扩大AI应用的范围。
选择合适的AI平台: 选择一个易于集成、功能强大的AI平台,可以大大降低开发成本。
建立一支专业的AI团队: 培养一支具备AI技能的团队,负责AI项目的开发和实施。
与外部专家合作: 可以与AI咨询公司或高校合作,获得专业的技术支持。】
五、如果不是现在,那什么时候?
Dev Consult的 Bechard 认为,在现阶段,对代理 AI 的投资是对该技术潜力的押注,而不是投资。但随着代理 AI 变得越来越强大,这种押注的胜算可能会发生变化。“决策者必须通过实验来学习或建立一个滩头阵地,如果技术继续改进,这将成为一种战略优势,”他说。
SanjMo首席分析师 Sanjeev Mohan 建议 CIO 们观望一下。他认为,如果现有的 RPA 可以运行,就没有必要在代理 AI 上花钱,并建议在决定实施代理 AI 之前先了解用例的价值。
其他分析师认为,分层或分阶段采用该技术可能是最佳的前进道路。
Eden Digital的 Clifford 建议使用代理 AI 作为 RPA 的补充,而不是替代。“这种方法允许组织维持其对结构化、重复性任务的 RPA 投资,同时逐步引入 AI 代理来处理更复杂、与上下文相关的流程,”他说。
Hinchcliffe也建议仔细权衡成本(金钱和时间)与企业敏捷性、可扩展性和运营效率方面的好处,并在等式中添加另一个变量:RPA 供应商可能会自己提供代理 AI 功能(UiPath 已经朝这个方向发展),这可能为企业提供一种更安全、更快捷的替代方案,而不是自己实施代理 AI。
【睿观:代理AI在RPA基础上应用的成熟度模型评价指标体系】