你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
首席信息官(CIO)在选择和实施人工智能智能体平台前所需的五点清单
作者:CIO&睿观 来源:CIOCDO 发布时间:2025年02月12日 点击数:

随着智能AI的飞速发展,以下是一些选择人工智能智能体构建平台的建议,以便您、您的团队以及供应商能够同时开展创新。

图源:Shutterstock / Ground Picture


作为一名首席信息官,今年您的IT团队很可能正迅速从评估和部署独立的第三方人工智能软件包,转向在面向客户和内部的业务应用程序中集成定制的人工智能智能体,以实现更高的自动化水平和工作效率。

他们可能正在使用至少一个人工智能代理构建平台,甚至可能还有其他几个平台。由于包括人工智能智能体构建平台在内的所有人工智能工具都在不断创新和更新,而且通常是每日更新,因此在选择这些工具并确定一个常用平台时,有几件事值得牢记。鉴于此,以下是一些需要考虑的要点,这些要点超越了功能和价格等基本因素,但仍可能是成功的关键决定因素。

一、评估智能体构建环境

如果从智能体构建环境本身说起,智能体供应商通常在实践过程中不断学习和创新。他们通常对LLM(大型语言模型。是使用深度学习算法处理和理解自然语言的基础机器学习模型。这些模型在大量文本数据上进行训练,以学习语言中的模式和实体关系。LLM可以执行多种类型的语言任务,例如翻译语言、分析情绪、聊天机器人对话等。)供应商和模型非常熟悉,了解不同模型的优缺点。然而,他们可能在用户界面和以客户为中心的构建环境方面技能较少。他们的整个工作室环境可能经常变化,所以您可能在创建智能体的同时,还要迁移到他们工作室的新版本。

确保他们的环境直观易用,便于在其中测试智能体,并且为智能体提供诸如短期和长期记忆等增强选项。此外,还应具备负责任人工智能的功能——可反思性、基于事实性和上下文相关性,以及安全人工智能的功能——公平性与无偏差性、toxicity check是指检测智能体在生成内容时是否包含有毒内容的过程。有毒内容可能包括仇恨言论、侮辱性语言或其他不道德的表述,这些内容可能会对用户造成负面影响。为了确保智能体生成的内容安全、无害,toxicity check 成为了一个重要的环节。)、human-in-the-loop(人在回环/人在回圈/人机回圈等。具体来说就是设计某种机制让机器/算法和人互动协作来更好的处理某件事情。针对智能产品的设计而言,这个概念被引入所要解决的问题就是在算法准确率跟用户要求还有不小差距的情况下,将人引入到这个循环中,让人去处理算法拿不准的问题,通过修正、提供反馈、输入更多知识来弥补或改进算法,共同完成任务。在这个互动过程中让人和机器发挥各自的优势,相互增强。)和PII redaction(个人身份信息删除,‌是指在使用智能体处理数据时,自动识别并删除个人身份信息/PII的过程。这一过程对于保护个人隐私和数据安全至关重要。)。您还需要能够一目了然地查看作为订阅一部分的已使用积分情况,以及一些增值功能,例如使用人工智能改进智能体角色和指令的能力。

二、详尽的API文档

一旦在人工智能智能体构建平台中构建好智能体,下一步就是使用API(应用程序编程接口,是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。调用,将这些智能体集成到您自己的应用程序中。不仅要寻找详细的API层面文档,还要有更高级别的信息,例如动态配置智能体的步骤说明等。清晰的文档能够帮助您的信息技术团队快速上手,了解从环境设置、RAG(即检索增强生成,是一种自然语言处理模型,旨在改进各种NLP任务的表现,包括问答、摘要生成等。创建与训练、智能体创建到智能体交互与查询的必要步骤顺序。

他们还需要关于如何监控和报告token令牌,在计算机科学和自然语言处理/NLP中,是指文本被分解成的最小单位或基本元素。这些单位可以是单词、词组、标点符号、字符或子词。在NLP中,tokens是模型处理文本的基本单位,用于帮助机器理解和处理自然语言。)使用情况的清晰文档,以及如何监控和显示历史查询、人工智能智能体性能、安全性能以及与其他系统的集成情况。有了这些信息,通常可以将开发和测试时间减半,因为您的IT团队和智能体供应商之间为解决问题和疑问而进行的来回沟通会大大减少。

三、获取专业服务和支持

由于智能体构建环境因持续创新而不断变化,供应商提供专业服务和支持非常重要,这样他们就能在实施过程中协助您的团队,这有助于增强对其技术的信心并建立信任。

寻找那些提供丰富支持且愿意与您的团队合作,帮助您完成智能体开发的供应商。如果您能够接触到他们的领导团队,那就更好了,他们可以就如何最佳利用其平台以及如何利用各种计划提供战略建议,如与AWS(亚马逊云计算服务,是亚马逊提供的是全球最全面、应用最广泛的云平台,从全球数据中心提供超过 200 项功能齐全的服务。)的合作计划及其自身的联盟计划。

四、确保系统正常运行时间

人工智能智能体基础设施的系统正常运行时间通常可以通过API调用进行监控,这对成功部署至关重要。由于许多人工智能智能体构建平台都是初创公司,您可能会发现,在他们迁移到平台的新版本,或者对API、智能体、RAG以及工具环境进行其他更改时,环境偶尔会出现一些停机时间。

寻找内置的监控方式,例如通过API调用,或者能够轻松联系公司人员进行故障排除的方式。在人工智能智能体性能监控方面,您需要关注响应时间、准确性和智能体可用性。关于错误率,要检查智能体遇到的错误频率和类型,例如错误响应、hallucinations(幻觉,指模型生成不基于实际数据或与现实显著不同的内容的现象。)以及信息检索错误。在某些情况下,智能体可能会丢失上下文信息,因此查看短期和长期记忆等设置,并确切了解智能体在其上下文记忆中保留多少推理信息非常重要。

五、探索产品路线图

在解决了构建和部署生产级智能体的上述考量因素后,您还需要探究供应商的产品路线图。例如,如果他们的智能体目前仅提供文本输出,他们是否有计划发展为支持音频、图像和视频的多模态输出?在您自己的部署中是否可能会需要这一功能?

对第三方工具的支持和集成能力也至关重要。例如,如果供应商的智能体目前支持与用于社交媒体发布的X是由埃隆·马斯克创建的一个社交媒体平台,前身为推特。2023年7月23日,马斯克宣布将推特更名为X,并更新了平台标识。X平台目前主要面向美国用户,提供了“沉浸式视频之家”功能,用户可以通过滑动屏幕翻阅系统推荐的短视频,体验与TikTok等平台相似的短视频信息流服务。)工具集成,他们是否有计划支持与LinkedIn(领英,启动于2003年5月,是一个面向职场的社交平台,总部设于美国加利福尼亚州的森尼韦尔。该公司于2011年5月20日在纽约证券交易所上市。网站的目的是让注册用户维护他们在商业交往中认识并信任的联系人,俗称“人脉”。用户可以邀请他认识的人成为“Connections/关系”圈的人。截至2020年5月,领英的用户总量已经达到6.9亿以上,在中国拥有超过5000万名用户。2014年2月25日,领英简体中文版网站正式上线,并宣布中文名为“领英”。)集成?在推出新功能时,他们是否有现成的示例?

好消息是,人工智能智能体构建平台正日益完善,界面更直观、文档更丰富、集成性更强且用例更多。创新的步伐令人惊叹,公司创始人常常天不亮就开始工作,只为跟上发展的节奏。如果您与一个强大的人工智能智能体构建平台合作,就能让您的信息技术团队减少在人工智能底层技术方面的精力投入,更多地专注于业务规则、用户界面以及集成工作,这些将确保您的智能体部署取得成功。

作者:Nicholas D. Evans(尼古拉斯·D·埃文斯)

Nicholas D. Evans(尼古拉斯·D·埃文斯)是Thinkers360的创始人,Thinkers360是全球首屈一指的B2B思想领袖和影响者市场,也是专门从事创新管理和新兴技术的咨询公司Innovators360的创始人。他是《Consulting Magazine/咨询杂志》终身成就奖获得者,之前曾担任普华永道、毕马威、Unisys和Gartner的高管。

译者:宝蓝

【睿观:选择人工智能智能体构建平台时,除了基本的功能和价格因素外,还需要考虑以下几个关键因素,以确保您、您的团队和供应商能够高效协作,推动创新:

主要观点:

  1. 评估智能体构建环境: 确保平台环境直观易用,提供必要的增强选项(如记忆功能),具备负责任和安全人工智能的特性,并且能够清晰地展示使用情况和提供增值功能。

  2. 详尽的API文档: 平台需要提供详细的API文档,包括高级别的配置说明,帮助您的IT团队快速上手并高效地集成智能体。文档还应包含监控和报告token使用情况、查询历史、智能体性能、安全性能以及与其他系统集成的信息。

  3. 获取专业服务和支持: 选择提供丰富支持并愿意与您的团队合作的供应商,他们能够协助您完成智能体开发,增强您对技术的信心。如果能够接触到他们的领导团队,获取战略建议,那就更理想了。

  4. 确保系统正常运行时间: 监控人工智能智能体基础设施的系统正常运行时间至关重要。选择具有内置监控功能或易于联系支持人员进行故障排除的平台。关注响应时间、准确性和智能体可用性等性能指标,并检查错误率、幻觉和信息检索错误等问题。

  5. 探索产品路线图: 了解供应商的产品路线图,例如是否计划支持多模态输出、第三方工具集成等。选择与您的需求和未来发展方向一致的平台。

总结

人工智能智能体构建平台正在不断发展,选择一个强大的平台将有助于您的IT团队减少在底层技术方面的投入,更多地关注业务规则、用户界面和集成工作,从而确保智能体部署的成功。】