你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
可持续性与风险之间:首席信息官为何考虑小型语言模型
作者:CIO.com&睿观 来源:CIOCDO 发布时间:2024年08月02日 点击数:

人工智能的前景不容否认,但大模型可能不是将其应用于企业的最佳方式。即将出现的是基于特定数据的能耗较低的小型模型,可让 IT 保持控制。


来源:GORODENKOFF / SHUTTERSTOCK

【睿观:这篇文章探讨了首席信息官(CIO)在面对新一代人工智能(AI)技术,特别是小型语言模型(SLM)和大型语言模型(LLM)时的考虑和挑战。文章从多个角度分析了CIO们在选择和实施AI技术时的关键因素,包括可持续性、控制权、成本和治理


1.可持续性和控制权:文章指出,尽管LLM具备强大的训练能力和广泛的应用潜力,但其高能耗和数据依赖性使得一些CIO更倾向于选择SLMSLM因其能耗较低、数据需求较小,更容易控制和管理,尤其适合对公司数据保密性有较高要求的场景。这种选择反映了企业在追求技术先进性的同时,越来越重视可持续发展和对数据的掌控。


2.成本和治理:在人工智能的应用中,治理和成本管理是CIO们关注的重点。SLM不仅在能源和资源消耗上更具优势,而且可以更好地保护企业的敏感信息。相比之下,使用LLM可能会带来更多的合规和隐私风险,特别是在数据共享和外包服务方面。因此,许多CIO选择在本地部署SLM,以确保数据控制在公司内部。


3.CIO的角色和能力:文章强调了CIO在技术选择中的关键角色。他们不仅要评估技术的成本和收益,还要具备足够的技术知识和团队支持,以便在实施过程中能够影响和优化技术的应用。这需要CIO们保持对最新技术的敏锐洞察力,同时培养能够处理现代技术环境的团队。


总的来说,CIO们在面对AI技术的快速发展时,需要平衡创新与风险、成本与收益,以及控制权与外部依赖。这些考量将决定企业在未来技术环境中的地位和竞争力。】


随着GPT-4 通过图灵测试,微软将其人工智能助手 Copilot 推向企业产品,随着谷歌宣布在意大利的手机上推出 Gemini 应用程序,首席信息官们正在研究新一代人工智能技术以保持最新状态——但不会被技术兴奋或商业主张分散注意力。


“生成式人工智能可以带来很多好处,但如果没有适当的考虑,就不能采用它,”意大利研究和教育界 专用 宽带网络GARR 的首席技术官兼基础设施部门负责人 Massimo Carboni 表示 。“人们对它的炒作非常强烈,但高估其可能性的风险也同样高。在数字世界中,我们必须越来越谨慎,而人工智能和生成式人工智能的第一个风险就是过度信任。”


此外,Gartner最近估计,全球企业在人工智能技术上的支出并不重要。今年预计的 万亿美元 IT 投资总额(较 2023 年增长 8%)中,人工智能占比不大。相反,支出将由更传统的力量推动,例如传统 IT 服务,其价值将超过 1.5 万亿美元,同比增长 9.7%


相比之下,大型服务提供商正在加大对技术的投资,以支持新一代人工智能项目。为了迎接即将到来的繁荣,到2024 年,人工智能应用服务器将占超大规模服务器总投资的近 60%。不过,企业更加谨慎。Gartner 认为,新一代人工智能将经历一个“故事、计划、执行”的周期,因为它在 2023 年被讨论,计划在 2024 年实施,预计在 2025 年实施。 


一、首席信息官监督下的生成式人工智能


Edoardo Esposito是 inewa 的首席信息官,也是 Elevion 集团的成员,该集团是一家认证的能源服务公司,活跃于沼气和生物甲烷生产以及能源效率领域。目前,该公司正处于 Copilot 测试的规划阶段,因为 inewa 的 IT 全部采用 Microsoft 系统,而这款新一代 AI 产品与 Office 套件完美集成。他的实验与其他经理一起进行,例如首席财务官、法律总监以及机构关系和监管总监。


“我们正在测试人工智能在金融领域的应用,比如收入和支出的财务分析,”埃斯波西托说。“我认为这是最大的机会所在。目前,我认为人工智能在法律领域的应用前景并不乐观,但我们正在尝试利用人工智能来管理合同和研究法律。”


当然,人工智能不会提供法律建议,但它可以帮助理解不断更新或变化的大量规则。


“即使是用人工智能生成一份新法律的简单要点摘要并发送给高管进行审查,也会有所帮助,”他说。“最终,对于我们这样的小企业来说,每月30 美元的费用就像在办公室多了一个员工。”


然而,尽管埃斯波西托对简单任务的自动化毫不犹豫,但他并不相信人工智能可以完全自动化复杂任务,还有其他问题。“这些模型在我看来似乎不可持续。它们有大量参数,需要大量能量来训练,”他说。


二、人工智能的不可持续性


卡博尼还强调了人工智能的能源密集程度以及它如何增加原本就很高的技术成本。


他说:“ICT占全球能源总成本的 9%,即 2023 年约 3000 亿美元。过去 10 年,这一比例已增长高达 60%,并且注定会进一步增长。”


Carboni认为,培训方面也存在问题。“生成式人工智能正在颠覆传统的以人为本的方法,”他说。“现在不是由人来培训模型,然后改变公司组织,而是人必须适应来自市场的模型。这对我来说是一种风险。生成式人工智能参与者越少,公司就越容易产生依赖性,失去控制权。”


此外,Carboni补充道,人工智能可能会将数字功能限制在决定行为和成本的少数主体上,因为进入人工智能领域的门槛很高,大多数公司只能购买服务,而无法区分不同产品之间的差异。选择很少,风险在于产品标准化。“所以在我看来,继续在内部开发一些东西总是更好的。”


三、与大型科技公司竞争的公司


公司之间的竞争日益激烈,包括Carboni 在内的许多公司都认为,大型供应商销售其产品的方式在很多方面是不公平的,因为一些市场参与者拥有其他参与者所没有的能力。


“微软和谷歌等公司拥有产品生态系统,这种控制着高达80% 数据市场的寡头垄断比其他公司具有巨大优势,”他说。“大型科技公司的战略还旨在吸纳初创公司,以加强它们对数据的主导地位。”因此很难想象有新进入者能够与之竞争。提供替代产品的初创公司当然存在,而且是开发算法的好方法,但这些还不足以取得成功。


对于Carboni 来说,这并不意味着人工智能的失败,而是希望深入研究并控制它。“我相信人工智能非常重要,我们将在 GARR 上研究它,因为我们有大量数据可以利用,”他补充道。“我们的目的是推导出一个生成式人工智能模型,以更好地定义我们的内部知识库。目前它还没有公开,但如果我们想公开它,就必须开发它以供外部阅读。我们可以为此使用一个小型语言模型。”


四、SLM:寻求控制权的 CIO


小型语言模型(SLM)是使用比 LLM(大型深度学习模型,GPT 等产品就是基于此模型)小得多且更具体的数据集进行训练的 ML 算法。初步测试表明,它们在执行任务时效率更高、成本更低、准确性更高。事实上,Esposito 也关注 SLM 的发展,认为它们在商业用途上更有前景,而且更具可持续性。大型产品具有出色的训练能力,但属于通用产品,而公司需要垂直应用。


“通过API 使用大型人工智能模型,用自己的数据训练自己的人工智能产品需要大量能源资源,”Esposito 说。“这就像把一个数字同事带进你的家,但这个同事的成本很高。你必须用你公司的具体信息来训练他,并不断向他提供新数据,让他了解最新情况。你还必须为他提供大量电力。这就是为什么我对大型语言模型不感兴趣,但对小型语言模型却很感兴趣。公司需要更有针对性、偏见和隐私侵犯风险更低的东西。”


例如,Esposito表示,IT 可以隔离一个狭义的语言任务,采用 SLM,将其放在云端,并只允许其访问公司文档数据库。然后,它只向模型询问与这些文档相关的问题。


“从第一次实验来看,似乎不仅能耗降低了,而且出现幻觉的概率也降低了,”他说。“毕竟,公司的人工智能模型不必知道一切,而只需对某些应用做出反应。SLM 仍然可以进行翻译、执行市场趋势分析、自动化客户服务、管理 IT 工单、创建业务虚拟助理等。在我看来,限制领域并使其专业化,使其处于 IT 控制之下似乎更有效率。


五、权衡人工智能业务和小型模型


控制是关键。布鲁诺·凯斯勒基金会(FBK) 增强中心主任亚历山德罗·斯佩杜蒂 (Alessandro Sperduti) 表示,在人工智能领域,我们面临着私营公司主导的风险。“过去,世界上最重要的人工智能系统都是在大学开发的,而今天却不是,因为私营科技巨头的崛起,其消费能力是公众无法与之竞争的,”他说。


事实上,在科学界,一些人更愿意通过政治干预来重新控制人工智能,就像高能物理学和欧洲核子研究中心的成立一样,欧洲核子研究中心是一个将多个国家聚集在一起合作进行粒子物理理论和实验的机构。但其他研究人员并不认为某些私人行为者的霸权会带来风险,只要政府规范人工智能工具的使用,就像欧盟通过《人工智能法案》所做的那样。


“与物理学领域不同的是,物理学领域没有大生意,而人工智能领域利润丰厚,”斯佩杜蒂说。“这就是微软和谷歌等公司如今竞争激烈的原因。我们每天都会读到超越以往目标的新目标。这个领域的初创公司确实存在,但与其他领域相比,它们数量较少,因为需要的投资巨大。因此,我认为它们无法真正威胁到现有参与者的主导地位并形成强大的竞争态势。”


然而,在较小的模型中,Sperduti 强调了检索增强生成 (RAG) 系统的存在,该系统使用 LLM 来回答有关存储在本地数据库中的文档的问题。通过这种方式,文档保持私密,不会交给提供 LLM 的组织。RAG 使公司能够更好地控制数据,并且成本更低。


“但它们需要在本地进行管理,”他强调道。“你也可以在本地使用开源语言模型,这些模型比LLM 更小,但性能较低,因此可以将其视为 SLM。”


关于成本可持续性,Sperduti表示,LLM 由大型科技公司作为公用事业服务进行管理,就像我们购买电力一样,而拥有 SLM 则意味着将涡轮机留在家中发电。“因此,必须进行经济评估,”他说。“如果模型的使用频率很高,这甚至可能是有利的。但这是一个必须经过仔细分析后才能做出的选择,要考虑到模型的成本、更新、从事模型工作的人员等等。”


六、掌舵的 CIO:治理和专业知识


Carboni还警告说,如果选择 SLMIT 任务会变得更大,而 CIO 的生活却不一定会得到简化。


“在LLM 中,大部分数据工作都是以统计方式完成的,然后 IT 部门针对特定主题训练模型以纠正错误,为其提供有针对性的高质量数据,”他说。“SLM 成本低得多,需要的数据也少得多,但正是由于这个原因,统计计算效率较低,因此需要非常高质量的数据,数据科学家需要大量工作。否则,使用通用数据,模型可能会产生许多错误。”


此外,SLM 对公司来说前景广阔,而且非常有趣,甚至大型科技公司也提供并宣传它们,例如谷歌的 Gemma 和微软的 Phi-3。因此,埃斯波西托认为,治理仍然是根本,在一个应该保持封闭系统的模型中。


SLM更易于管理,并成为公司从 AI 中获取附加值的重要资产,”他说。“否则,对于大型模型和开放系统,您必须同意与GoogleMicrosoft 和 OpenAI 共享战略公司信息。这就是为什么我更喜欢与可以开发定制并提供封闭系统的系统集成商合作,供内部使用。我认为让员工使用通用产品并将公司数据放入其中是不明智的,因为这些数据也可能是敏感数据。数据和 AI 治理对公司至关重要。


七、CIO的能力也同样重要。


Carboni表示:“在我的工作中,我认为重要的不仅是评估使用服务的成本,还有我影响服务的能力。首席信息官必须建立自己的技术知识背景,并配备一支能力强的团队,其中包括大量年轻人,能够在现代环境中使用云原生技术。这样,首席信息官就不会局限于购买产品并期待其性能,而是采取行动并影响该产品或服务。


因此,CIO仍是掌舵人。无论人工智能的无论人工智能的发展轨迹如何,CIO才是决定方向、应用和目标的人。