你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
生成式人工智能最大的挑战是展示投资回报率——原因如下
作者:zdnet 来源:CIOCDO 发布时间:2024年06月25日 点击数:

从未有一项技术能够落实地如此糟糕,却又能如此自如地假装自己做得没问题。


图源:Robbie Goodall/Getty Images

虽然高管和经理们可能会对将generative artificial intelligence生成式人工智能,是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容,全面超越了传统软件的数据处理和分析能力。)和LLM(large language models)(LLM大型语言模型。是使用深度学习算法处理和理解自然语言的基础机器学习模型。这些模型在大量文本数据上进行训练,以学习语言中的模式和实体关系。LLM可以执行多种类型的语言任务,例如翻译语言、分析情绪、聊天机器人对话等。)应用于手头的工作中感到兴奋,但现在是时候退一步,考虑在哪里以及如何实现业务回报了。这仍然是一个混乱和被误解的领域,需要与过去的技术浪潮几乎毫无相似之处的方法和技能。


挑战在于:虽然人工智能通常会提供非常令人惊叹的概念证明,但很难利用其盈利。Capgemini一般指凯捷咨询公司。凯捷管理顾问公司总部设于法国巴黎,由法国企业家Serge Kampf 1967年创立,是一间全球性的资讯科技服务管理领导厂商。它列名在巴黎CAC40指数中,是法国前四十大企业。企业总部位于巴黎蒂尔西特路,仍然由Serge Kampf担任执行长,在全球39个国家拥有分公司,合并了安永咨询。)执行副总裁Steve Jones(史蒂夫·琼斯今日于旧金山举行的Databricks conference2024610-13日,超级独角兽公司Databricks在旧金山举办了一年一度的Databricks Data+AI峰会。)上发表演讲时表示:“证明ROI投资回报率,是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报。它涵盖了企业的获利目标。利润和投入经营所必备的财产相关,因为管理人员必须通过投资和现有财产获得利润。)是将203040个生成式人工智能解决方案投入生产的最大挑战。


需要进行的投资包括测试和监控投入生产的LLM。测试对于保持LLM的准确和步入正轨尤为重要。Jones琼斯建议说:测试这些模型时,您要表现得有点‘坏’。”例如,在测试阶段,开发人员、设计人员或QAQuality Assurance,质量保证。是质量管理的一部分,它致力于提供质量要求会得到满足的信任。质量保证是指为使人们确信产品或服务能满足质量要求而在质量管理体系中实施并根据需要进行证实的全部有计划和有系统的活动。)专家应该有意地“带偏”他们的LLM,看看们如何处理错误信息。


为了检验负产出,Jones琼斯举了一个例子,说他提出一种假设的商业模式,即一家公司使用龙进行长途运输。该模型做出了肯定的回应。然后,他提示模型提供有关长途运输商业模式的信息。


它给出的答案是,这是从事长途运输工作所需要做的,因为正如已经告诉我的那样,将广泛地与龙合作,然后需要接受广泛的消防和安全培训,’”Jones琼斯说,“您还需要对公主进行礼仪培训,因为龙的工作需要与公主一起工作。然后是一堆标准的东西,包括运输和仓储,被从解决方案的其余部分中删除。”


Jones琼斯继续说,关键是生成式人工智能“是一种将技术糟糕地添加到现有应用程序中并假装自己做得很好的技术。生成人工智能是一种非凡的技术,只会为应用程序添加一些铃声和口哨声,但从生产的安全和风险角度来看,它确实很可怕


生成式人工智能还需要两到五年的时间才能成为主流采用的一部分,与其他技术相比,这速度很快。Jones琼斯说:“您面临的挑战将是如何跟上进度。目前有两种情况:第一个情况是,这将是一个伟大的大模型,它将知道一切,而且不会有任何问题。这就是所谓的疯狂乐观和不可能发生的理论。


正在发展的是每一个供应商、每一个软件平台、每一个云计算,都将希望进行积极的竞争,以成为这个市场的一部分。Jones琼斯说,这意味着您将面临越来越多的竞争和变化。您不必担心多云基础设施,也不必支持它,但您必须考虑护栏等问题。


Jones琼斯说,另一个风险是将LLM应用于所需的功率和分析要少得多的任务,比如地址匹配。如果什么都用一个大模型,那本质上就是烧钱。这相当于去找律师说,我想让为我写一张生日贺卡。他们会从善如流地做,然后收取高额代理费。


他敦促说,关键是要警惕利用LLM的更便宜、更有效的方法。“如果出现问题,您需要能够尽快停用解决方案。您需要确保它周围的所有相关工件都与模型同步调试


不存在部署单个模型这回事——人工智能用户应该将他们的查询应用于多个模型来衡量响应的性能和质量。“您应该有一种通用的方法来捕获所有的指标,并针对不同的模型回放查询,Jones琼斯继续说道,“如果有人在查询GPT-4 TurboOpenAI发布的最新语言模型,相比之前的GPT-3.5GPT-4.0模型,它更为强大。GPT-4 Turbo不仅在技术上有所突破,还在功能上进行了显著的增强,为用户提供了更多的便利和灵活性。)想看看同样的查询对LlamaMeta AI推出的大语言模型。之后源代码公开到了 4chan 论坛上,使得任何一个普通工程师,都有机会开发自己的聊天机器人产品。只需要一台笔记本电脑就能部署,不必像 OpenAI 那样动辄上万块 GPU,对中小开发者极其友好,且性能也没差到哪去。泄漏后的几个月内,一位斯坦福大学的研究人员,只花了不到 600 美元就做出了一个性能尚可的 AI 聊天机器人;大洋彼岸的哈工大,数位研究人员用Llama和专业数据做出了一个医学知识 AI,取名叫华驼。围绕 LLaMA,一个生态开始涌现。)的执行情况。您应该能够有一种机制来回放这些查询和响应,并比较性能指标,这样您就可以了解是否可以用更便宜的方式进行查询。因为这些模型正在不断更新。”


生成人工智能正常情况下不会出错”,但他补充说,生成人工智能是您输入一个发票它会回复棒极了,这一篇关于安德鲁·杰克逊总统的4000字的文章。因为我认为这就是您发送内容的含义’所以,您需要有AI应用的护栏来防止这种情况的发生。


作者:Joe McKendrick·麦克肯德里克

译者:宝蓝 @lex