你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
可持续IT:您的数据真的需要大语言模型(LLM)吗?
作者:esgtoday.com 来源:CIOCDO 发布时间:2025年02月13日 点击数:

在人工智能竞争的浪潮中,我们不应忘记,最简单的解决方案往往是最可持续的。作为 IT 领导者,我们需要保持理性,确保技术决策由业务需求和可持续性驱动,而不是受炒作影响。LLMs大型语言模型是炒作还是真有帮助?它们功能强大,但对于基本的分析任务来说往往是大材小用。可持续的信息技术意味着选择合适规模的解决方案,要有策略地将大语言模型用于处理复杂的非结构化数据,而不仅仅是因为它们很炫酷。

【注:LLMs:大型语言模型。是使用深度学习算法处理和理解自然语言的基础机器学习模型。这些模型在大量文本数据上进行训练,以学习语言中的模式和实体关系。LLM可以执行多种类型的语言任务,例如翻译语言、分析情绪、聊天机器人对话等。】

图源:Chitra Sundaram

作为一名深度参与为企业制定数据战略、治理和分析工作的专业人士,我一直在从事从定义数据愿景到构建高效数据团队的各项工作。我的工作核心是帮助企业利用数据做出更好的决策并推动有影响力的转型。最近,我参与SustainableIT.org的工作,让我有了一个全新的视角来看待这些项目:可持续性。经过一些发人深省的交流,我现在以更具环保意识的思维来看待一切。这篇文章反映了我学到的一些内容。

【注:IASA(International Association of Software Architects,‌国际架构师协会,‌是一个专注于软件架构领域的非营利性组织,致力于推动软件架构的最佳实践和职业发展。IASA成立于2005年,总部位于美国加利福尼亚州。该协会通过举办会议、出版物、认证计划等方式,为会员提供专业发展机会和网络建设平台‌。)

SustainableIT.org在投资者越来越关注ESG的背景下,一群首席信息官和其他顶级科技领袖最近在美国成立了一个新的非营利组织。该组织的目标之一是帮助阐明科技领导者在衡量各种ESG层面的进展时应该遵循哪些基准。该非营利组织董事会主席是Lumentum公司,该公司主要生产高性能激光器和其他光电子产品,市值67亿美元。)】

围绕LLM的炒作是无可否认的。它们有望彻底改变我们与数据交互的方式,能够生成高质量的人类文本、理解自然语言,并以我们从未想过的方式转换数据。从自动化繁琐的任务到从未结构化数据中挖掘见解,其潜力似乎无穷无尽。但我一直在问自己一个问题:对于我们大多数的分析工作,我们真的需要这么强大的功能吗?

想一想:像GPT-3这样的大语言模型是极其复杂的深度学习模型,是在海量数据集上进行训练的。我们都见过ChatGPT、Google Gemini和Microsoft Copilot的演示。它们无疑令人印象深刻。在分析领域,大语言模型可以创建自然语言查询界面,让我们能用简单的自然语言提问。它们还可以自动生成报告,并解读传统方法可能忽略的数据细微差别。想象一下从数据可视化中生成复杂的叙述,或者使用能够实时响应您查询的对话式商业智能工具。在生命科学领域,大语言模型可以分析大量的研究论文,以加速药物研发。在零售领域,它们可以实现个性化推荐并优化营销活动。这些潜在的应用确实具有转型性。

【注:GPT-3(是由美国OpenAI研发的人工智能语言模型。它是一个自回归语言模型,利用深度学习生成类似人类语言的文本。GPT-3通过与生物智能截然不同的路径,被动形成了类似人类类比推理能力的机制,尽管它并未在这方面经过明确训练。)

ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。)

Google Gemini(是谷歌公司发布的人工智能大模型,能够在从数据中心到移动设备等不同平台上运行。包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,能够击败GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。“双子座”Ultra版本是首个在“MMLU/大规模多任务语言理解”领域超越人类专家的模型。2023年12月6日,Gemini 的初始版本已在Bard中提供,开发人员版本将于12月13日通过 Google Cloud的API提供。)

Microsoft Copilot是微软旗下所有GPT-4加持的Copilot功能。2023年9月26日,“Microsoft Copilot”开始通过Win11免费推送。该AI助手是一个集成了在操作系统中的侧边栏工具,可以帮助用户完成各种任务。Copilot依托于底层大语言模型/LLM,用户只需说几句话,做出指示,它就可以创建类似人类撰写的文本和其他内容。)】

大语言模型在自然语言处理、自动化和复杂数据解读方面具有强大的功能。

但让我们面对现实吧。大多数企业从分析工作中实际需要的是什么呢?以我的经验来看,特别是在我在Parexel(精鼎医药公司,是一家全球领先的生物制药服务组织,提供各种合同研究、咨询和医疗通信服务。其致力于加快药物上市和市场渗透速度,拥有丰富的专业知识和广泛的全球运营网络。)工作期间,甚至在与Cleartelligence(是一家通过采用现代数据堆栈,帮助组织做出更智能、更敏捷的业务决策的企业。其提供端到端分析服务,加快组织内的数字化转型。)的众多客户合作时,需求往往归结为一些核心需求,比如:

1.清晰的数据可视化

2.扎实的描述性分析(趋势、关键绩效指标)

3.可靠的预测性分析(预测)

4.易于使用的仪表板

在Parexel工作时,重点常常是分析临床试验数据,以确定患者治疗结果的趋势、根据过去的表现选择试验地点,并预测未来试验的成功率。在与Cleartelligence的客户合作时,需求则多种多样。例如,在一家提供制造技术服务的公司,首要任务是预测销售机会;而在一家设计和制造automatic test equipment/ATE(自动测试设备,是指对被测对象自动进行性能验证和故障诊断并对故障予以隔离的测试设备‌。)的公司,重点是开发一个严重依赖预测的设备生产自动化平台。尽管背景不同,但对可靠、可行的见解的根本需求始终不变。

您猜怎么着?我们已经有用于这些任务的优秀工具了。Tableau(‌是一个强大的可视化分析平台,旨在帮助个人和组织充分利用数据,提高数据驱动的决策能力。其通过直观的界面和拖放功能,使得数据分析变得更加简单和高效。)、Qlik(‌Qlik是一家专注于数据分析和商业智能/BI解决方案的公司,其工具主要面向希望通过数据分析和可视化来改善业务流程和结果的企业用户。Qlik的工具包括Qlik Sense和QlikView,这些工具提供了强大的数据可视化、自助式分析和数据整合功能,帮助用户从多个数据源中提取、转换和加载数据,并进行交互式的可视化分析。)和Power BI微软开发,是软件服务、应用和连接器的集合,它们协同工作以将相关数据来源转换为连贯的视觉逼真的交互式见解。无论用户的数据是简单的Excel电子表格,还是基于云和本地混合数据仓库的集合,Power BI都可让用户轻松地连接到数据源,直观看到或发现重要内容,与任何所希望的人进行共享。Power BI简单且快速,能够从Excel电子表格或本地数据库创建快速见解。同时Power BI也可进行丰富的建模和实时分析,及自定义开发。因此它既是用户的个人报表和可视化工具,还可用作组项目、部门或整个企业背后的分析和决策引擎。)可以处理交互式仪表板和可视化。SQL(数据库语言。是具有数据操纵和数据定义等多种功能的数据库语言,这种语言具有交互性特点,能为用户提供极大的便利,数据库管理系统应充分利用SQL语言提高计算机应用系统的工作质量与效率。SQL语言不仅能独立应用于终端,还可以作为子语言为其他程序设计提供有效助力,该程序应用中,SQL可与其他程序语言一起优化程序功能,进而为用户提供更多更全面的信息。)可以处理数据运算并找出畅销产品。即使是基本的预测建模也可以用Python(计算机编程语言,由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。Python解释器易于扩展,可以使用C语言或C++,或者其他可以通过C调用的语言,扩展新的功能和数据类型。Python也可用于可定制化软件中的扩展程序语言。Python丰富的标准库,提供了适用于各个主要系统平台的源码或机器码。)或R(R语言,用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。)中的轻量级机器学习来完成。在生命科学领域,简单的统计软件可以分析患者数据。在零售领域,基本的数据库查询就能跟踪库存。您明白了吧。这些传统工具通常足以满足大多数企业日常的分析需求。

现有的工具和方法通常为许多常见的分析需求提供了足够的解决方案。

问题在于:LLMs是资源消耗大户。训练和运行这些模型需要巨大的计算能力,会产生显著的碳足迹。可持续的信息技术旨在优化资源利用、减少浪费并选择合适规模的解决方案。使用LLM来计算简单的平均值就好比用火箭筒打苍蝇。我亲眼见过这样的例子。在一家高端家具销售行业的客户那里,我们最初正在探索使用LLMs来分析客户调查,以进行情感分析并相应调整产品销售策略。使用前沿人工智能的诱惑很大,但经过全面评估后,我们推荐了一种更实用的方法。通过利用Python环境中现有的自然语言处理库,我们可以用极少的计算资源实现所需的情感分析,从而显著降低成本和对环境的影响。

通常,对“最新、最先进”技术的最初兴奋之情会让我们忽视实际的考量因素。我想到的另一家客户公司,是通过对临床机构的运营基准进行评估来盈利的。他们的数据主要来自大量的会员调查。当我们考虑调查分析时,可能会想到大语言模型,但我们证明了像Snowflake是作为软件即服务/SaaS提供的分析数据仓库。与传统的数据仓库产品相比,Snowflake提供了一个更快,更易于使用且更加灵活的数据仓库。)和‌DBT(Data Build Tool,是一种开源的数据转换工具,主要用于处理数据仓库中的原始数据,帮助数据分析师和数据工程师将数据转换成更有用的形式,以支持业务分析和报告。DBT通过SQL语言定义数据转换规则,使得数据处理逻辑更加直观和易于管理。其主要功能包括数据转换、模型构建、业务分析、可视化和报告等。这样更简单的工具完全有能力高效分析趋势并生成有价值的见解,而且不会像LLM那样带来资源负担。这不仅为客户节省了大量成本,还符合他们对可持续运营的承诺。这段经历进一步强调了在匆忙采用最复杂的解决方案之前,仔细评估项目真正需求的重要性。

由于LLMs的高能耗,它们对环境有显著的影响。

那么,什么时候值得考虑使用LLMs呢?当您处理真正复杂、非结构化的数据,如文本、语音和图像时。想想客户评论的情感分析、总结长篇文档或从医疗记录中提取信息。在数据和需求不断变化的动态场景中,它们也很有用。而且别忘了自然语言查询带来的增强用户体验。

例如,一家设计和制造家居用品的客户公司使用复杂的建模方法来预测未来销售情况。他们使用了大约15种不同的模型。然后用一个简单算法综合这些模型的结果,来确定针对某一产品表现最佳的模型,进而用于预测。虽然这个过程复杂且数据量庞大,但它依赖的是结构化数据和既定的统计方法。对于这类分析,LLM就有些大材小用了。然而,想象一下,如果这家家具制造商还想将客户评论、社交媒体情感甚至房间设计的图像纳入他们的销售预测中。这时LLM就会变得非常有价值,它能够分析这些非结构化数据,并将其与现有的结构化数据模型相结合。这种将结构化和非结构化数据融合的复杂多模态数据分析,正是LLMs能够大放异彩的地方。

另一个引人注目的用例是在汽车行业。大约三十年前,我在American Honda Motors(是美国本田汽车公司,是本田技研工业株式会社/Honda Motor Co., Ltd.在美国的分公司‌。)担任顾问,当时的工作涉及评估制造商的工程指南(具体细节现在有些模糊了),但我很容易就能想象如今一个由LLM驱动的人工智能助手会如何彻底改变这个过程。想象一下这样一个系统,它能处理像历史维修记录、技术人员笔记、缺陷报告和保修索赔等非结构化文本数据,并将其与物联网读数和机器遥测等结构化传感器数据相关联。这可以提供预测性维护见解,识别设计缺陷,并最终提高车辆的可靠性和安全性。这类结构化和非结构化数据融合的复杂多模态数据分析,正是LLM可以大放异彩的地方。这些例子凸显了LLM挖掘隐藏在非结构化数据中的见解的能力,但也强调了有策略地使用它们的重要性。

LLMs最适合处理复杂的非结构化数据、动态用例以及通过自然语言提升用户体验。

但即使如此,混合方法往往是最佳选择。对于结构化数据使用传统工具,而将LLMs留给真正复杂的任务。这种方法使企业能够充分利用传统分析工具和LLMs的优势,最大限度提高效率并降低资源消耗。这关乎在强大功能和实用性之间找到恰当的平衡。

实现可持续分析的道路在于为工作选择合适的工具,而不仅仅是追逐最新潮流。这意味着要投资培养技术熟练的分析师,并建立完善的数据治理体系。这意味着要将可持续性作为核心优先事项和培养数据素养文化,让分析师有能力批判性地评估他们手头可用的工具和技术,同时要建立明确的数据治理框架,以确保数据的质量、安全和合乎道德的使用。

在人工智能竞争的浪潮中,我们不要忘记,最简单的解决方案往往是最可持续的。Let’s not use a sledgehammer when a well-placed tap will do(当我们只需要轻轻敲打一下就能达到目的时,就不要使用大锤这样的重型工具。这是一种比喻,用来强调在处理问题时应该选择适当的方法或手段,而不是过度或不必要地使用更强大或激进的方式。简单来说,就是“不要用大炮打蚊子”,要选择合适的方式解决问题。)。作为IT领导者,我们需要成为理性的声音,确保技术决策是由业务需求和可持续性考量驱动的,而不仅仅是受炒作影响。通过采用务实且可持续的分析方法,我们可以在释放数据真正潜力的同时,将对环境的影响降至最低。

作者:Chitra Sundaram(奇塔·桑达拉姆)

Chitra Sundaram(奇塔·桑达拉姆)是Cleartelligence, Inc.,的数据管理业务总监,在企业数据战略、治理和数字转型方面拥有超过15年的经验。她专长于数据驱动决策、云现代化以及构建可扩展的数据治理框架,以推动业务成功。Chitra(奇塔)是IASA CAF和SustainableArchitecture.org社区的成员。她有兴趣帮助扩大其成员范围,与有兴趣确保满足ESG在IT方面的要求的IT架构师合作。

译者:宝蓝

【睿观:在人工智能竞争的浪潮中,我们不应忘记,最简单的解决方案往往是最可持续的。作为 IT 领导者,我们需要保持理性,确保技术决策由业务需求和可持续性驱动,而不是受炒作影响。通过采用务实且可持续的分析方法,我们可以在释放数据真正潜力的同时,将对环境的影响降至最低。

  1. LLMs 的优势:

    • LLMs 在自然语言处理、自动化和复杂数据解读方面表现出色。

    • 它们能够处理非结构化数据,例如文本、语音和图像。

    • 它们可以增强用户体验,例如通过自然语言查询界面。

  2. LLMs 的局限性:

    • LLMs 是资源消耗大户,需要大量的计算能力,产生显著的碳足迹。

    • 对于简单的分析任务,LLMs 往往大材小用。

    • 现有工具(如 Tableau、SQL、Python 等)通常足以满足大多数企业日常的分析需求。

  3. 可持续分析的重要性:

    • 可持续分析旨在优化资源利用、减少浪费并选择合适规模的解决方案。

    • 在选择技术决策时,应考虑业务需求和可持续性,而不仅仅是追逐炒作。

    • 培养技术熟练的分析师和建立完善的数据治理体系至关重要。

  4. LLMs 的适用场景:

    • LLMs 最适合处理复杂的非结构化数据、动态用例以及通过自然语言提升用户体验。

    • 例如,在分析客户评论、总结长篇文档或从医疗记录中提取信息时,LLMs 能够发挥巨大作用。

    • 在处理多模态数据分析时,LLMs 也能大放异彩。

  5. 混合方法是最佳选择:

    • 对于结构化数据,使用传统工具;对于真正复杂的任务,则使用 LLMs。

    • 这种方法可以最大限度地利用两者的优势,提高效率并降低资源消耗。