你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
可持续人工智能的4条路径
作者:福建CIO网 来源:福建CIO网 发布时间:2024年02月05日 点击数:

以下文章来源于CIOCDO ,作者CIO.com


更小的模型,更好的芯片和可再生能源的帮助。只有在你需要的时候使用人工智能也是如此。

图源:GORODENKOFF(图片上传者,可以译为用户GORODENKOFF,或者GORDENKOFF) / SHUTTERSTOCK

监管机构、投资者、客户甚至是员工,都在推动企业尽量减少其人工智能举措对气候的影响。从地热数据中心到更高效的graphic processing units/图形处理器(GPUs) ,一切都能有所帮助。但是,如果人工智能用户真的想要应对气候变化,他们必须克服使用最大、最糟糕的人工智能模型来解决所有问题的冲动。


对人工智能导致全球变暖的担忧,源于用于开发和保持人工智能模型运行的GPU消耗的能源是传统云应用程序的四倍,人工智能的耗电量可能和爱尔兰一样多。


作为回应,欧洲和美国的监管机构正在采取行动,要求人工智能的大用户报告其对环境的影响。全球基础设施服务提供商Kyndryl(勤达睿,于 2021 年从 IBM IT 基础架构服务中剥离出来。其全球客户群包括财富 100 强公司中的 75 家。依靠分布于 100 多个国家或地区的 90,000 多名高技能专业人士,全心全意帮助客户取得成功,与客户展开合作并帮助他们施展抱负。依靠分布于 100 多个国家/地区的 90,000 多名高技能专业人士,设计、构建并管理着全球日常运转不可或缺的技术系统,同时推动此类系统的现代化转型。)的全球可持续发展副总裁Faith Taylor(费思·泰勒)说,信用评级机构和客户正在密切关注碳排放等环境、社会和治理(ESG)问题。此外,她说,“员工,尤其是年轻一代,说他们不会在一家没有特定环境目标的公司工作。我们认为这是一个招聘和留住人才的因素。


随着可持续的努力成为更重要的事情,企业精简其人工智能工作的四种路径。


一、使用更高效的流程和体系结构


SaaS(一般指软件运营服务。 软件运营服务是Software as a Service的中文翻译。是指用户获取软件服务的一种新形式。它不需要用户将软件产品安装在自己的电脑或服务器上。)提供商Salesforce(创建于1999年3月的一家客户关系管理/CRM 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台)的减排高级经理Boris Gamazaychikov(鲍里斯·贾马扎奇科夫)建议使用专门的人工智能模型来减少训练它们所需的能源。“有必要让一个也能写十四行诗的模型为我们写代码吗?”他问道,“我们的判断是否定的。我们的方法是为特定的用例创建特定的模型,而不是一个通用模型。”


他还建议利用开源社区来获取可以对各种任务进行预训练的模型。有一个例子,他引用了Meta(Meta Platform Inc,美国互联网公司,原名Facebook,创立于2004年2月4日,总部位于美国加利福尼亚州门洛帕克。“Meta”,来源于“元宇宙”,Metaverse,意思是包涵万物无所不联。Facebook坚定地希望甩掉问世以来就牢牢被贴在身上的标签——社交媒体,要跳出发家领域社交媒体的“舒适圈”,着力开拓元宇宙e。)的Llama-22023年7月19日,Meta AI已正式发布最新一代开源大模型。训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Llama 2也翻了一倍。Llama 2包含了70亿、130亿和700亿参数的模型。Meta宣布将与微软Azure进行合作,向其全球开发者提供基于Llama 2模型的云服务。同时Meta还将联手高通,让Llama 2能够在高通芯片上运行。),他说其已经创造了超过13000种变种。“所有这13000款新模型都不需要任何预训练。”他说,“想想这节省了多少计算量和碳排放。”他补充说,Salesforce的人工智能研究团队还开发了最大并行度等方法,这些方法可以有效地划分计算密集型任务,以减少能源使用和碳排放。


Salesforce不是同时在所有训练数据上训练模型,而是在多个“时期”中训练模型,在每个时期中,根据早期训练的结果对部分数据进行轻微修改。他说,这样也可以减少电力消耗。


一些超级计算器提供了关于使人工智能更可持续发展的工具和建议,比如Amazon Web Services(亚马逊云计算服务,是亚马逊提供的是全球最全面、应用最广泛的云平台,从全球数据中心提供超过 200 项功能齐全的服务。),它提供了关于使用无服务器技术来消除闲置资源、数据管理工具和数据集的提示。AWS还拥有减少数据处理和存储的模型,以及为人工智能应用提供“适当规模”基础设施的工具。如果使用得当,这些工具可以帮助最大限度地减少人工智能所需的计算资源,从而减少其对环境的影响。


二、使用更少的数据


减少用于训练模型的数据集的大小是最大限度地减少人工智能所涉及的能源使用和碳排放的最有效方法之一。Colby College(科尔比学院。是一所位于缅因州沃特维尔文理学院。创建于1813年,于1871年成为全美第一所接受女性学生的男子学院。在2023年U.S. News美国最佳文理学院排名中,科尔比学院位列第24位。的Davis Institute for Artificial Intelligence(戴维斯人工智能研究所。是文理学院第一个跨学科的AI研究所。该研究所利用具有现实世界影响的丰富数据集,促进了教师和学生的重要研究,并为人工智能正在改变行业、职业以及发现、创造力和学术模式的未来做好了准备。)所长Amanda Stent(阿曼达·斯滕特)教授说:“你可以将许多人工智能模型的规模缩小一个数量级,只会损失2%到3%的准确性。这些技术众所周知,但并没有得到应有的广泛应用,因为人们迷恋规模的概念。”还有媒体对大型模型的关注。


Gamazaychikov(贾马扎奇科夫)说,Salesforce的CodeGen模型(是一个开源的大语言模型,旨在解决程序合成问题。程序合成是指根据给定的问题规范生成计算机程序的过程,可以通过输入输出示例或自然语言描述来表达。其实现的会话式AI编程,能够将简单的英文提示转化为可执行的代码。无需亲自编写任何代码,而是用自然语言的方式来描述代码应该完成的任务, CodeGen 就会为用户自动生成代码。)的最新版本允许用户使用自然语言生成可执行代码,其性能与两倍于其大小的模型一样好。他说,根据粗略的经验,大约50%的规模下降意味着碳排放量也相应下降。


在视频和音乐流媒体服务公司Plex(是一个VR流媒体内容共享平台,通过兼容Daydream的安卓智能手机和头显,用户就可以在VR中连接Plex账户的媒体服务器上观看电影或电视节目。Plex有多种交互式的观看环境可供选择,用户还可以邀请好友一同观看并进行互动。),数据科学主管Scott Weston(斯科特·韦斯顿)通过专注于特定需求来减少训练数据的规模。他说:“我们不仅想找到要订阅或离开平台的用户,还想找到那些应该订阅的用户以及如何确保他们订阅。”他补充说,模型训练更简单,因为数据集更集中,因为数据集更专注于它试图解决的特定业务问题。“之后就会利好环境,因为我们没有使用所有这些额外的计算来训练模型,”他说。


Weston(韦斯顿)使用提升建模,运行一系列A/B tests(是用于测试特定用户群,对不同版本的产品特征反应的线上实验方法。基本原则:1.尽快得到实验结论,尽快决策;2.收益最大化,用户体验影响最小。)来确定潜在客户对不同报价的反应,然后使用这些测试的结果来构建模型。数据集的大小受到业务问题的限制。“我们在进行大规模测试时非常谨慎,因为我们不想中断与客户的常规通信。”


三、使用可再生能源


在使用可再生能源的数据中心托管人工智能业务是减少碳排放的直接途径,但也并非没有权衡。


在线翻译服务公司Deepl(是一家致力于为语言发展人工智能的深度学习公司,自2009年成立起,就一直保持着领先地位。起初,这家公司名为Linguee,后来更名为DeepL,以更好地展示其核心业务——翻译服务。如今,DeepL已经推出了一款用于翻译的互联网搜索引擎,为用户提供了更加便捷的语言转换服务。)在四个主机托管设施中运行其人工智能功能:两个在冰岛,一个在瑞典,另一个在芬兰。冰岛的数据中心使用100%可再生的地热和水力发电。Deepl的工程总监Guido Simon(圭多·西蒙)说,寒冷的气候也削减了40%或更多的数据中心冷却服务器所需的总功率,因为可以开窗,而不是使用空调。他说,成本是另一个主要好处,其价格为每千瓦/小时5美分,而德国的价格约为30美分或更多。


Stent(斯滕特)说,用户和可持续数据中心之间的网络延迟对于时间敏感的应用程序来说可能是一个问题,但仅限于推理阶段,即应用程序向用户提供答案,而不是初步训练阶段。


总部位于德国科隆的Deepl公司发现,它可以通过远程协同办公设施中进行训练和推理。“与更靠近我们的数据中心相比,我们看到的延迟增加了大约20毫秒。”Simon(西蒙)说,“在推理过程中,与人工智能引擎的初始连接可能需要10次往返,由于距离的原因,导致大约200到300毫秒的延迟,但您可以优化应用程序以减少初始时间。”


当然,与远程站点的互联网连接速度可以缓解延迟问题。Deepl的冰岛供应商之一Verne Global(是一家总部位于冰岛雷克雅未克的领先服务器主机商。他们提供高性能的云计算和数据中心解决方案,客户包括金融、科技和能源行业等。他们的数据中心基于100%可再生能源,并且使用冷却技术来最大程度地提高能源效率。)声称是所有往返冰岛的海底电缆系统的互连站点,并与欧洲和美国提供冗余、高容量的光纤连接。


Stent(斯滕特)说,另一个考虑因素是“可再生”数据中心是否运行最新、最高效的GPUtensor processing units/张量处理单元(TPU,是一款为机器学习而定制的芯片,经过了专门深度机器学习方面的训练,它有更高效能,即每瓦计算能力。如果不是这样,它最终可能会比传统供电但更现代化的数据中心消耗更多的电力。Simon(西蒙)说,这对Deepl来说不是问题,因为它在同一地点的设施中拥有自己的“超级先进”服务器。


四、根本不使用人工智能


虽然人工智能在员工和客户中引起轰动,但如果其他方法更容易实施,对环境的影响更小,那么它可能会被高估。AWS在其可持续发展指南中建议:“一定要问AI/ML是否匹配你的工作量。当一种更简单、更可持续的方法也可能成功时,没有必要使用计算密集型人工智能。例如,使用ML(机器学习,Machine Learning,是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。)来路由物联网消息可能是没有根据的;你可以用一个规则引擎来表达这个逻辑。”


除了环境方面的考虑,Plex无法投入数百万美元的计算来训练最大的模型。Weston(韦斯顿)说:“这一切都错综复杂,确保你仔细考虑每件事,而不仅仅是在问题上砸钱。”


在线游戏公司Mino Games(全称Mino Games,Mino Games是一家移动游戏开发商,总部位于加利福尼亚州旧金山和QC蒙特利尔。)使用DataGPT(是一家总部位于加利福尼亚州的初创公司,致力于简化企业从数据中使用见解的方式,今天推出了新的AI Analyst,这是一种对话聊天机器人,可帮助团队通过自然语言交流来了解其数据集的内容和原因。),它集成了分析、缓存数据库,以及提取、翻译和加载(ETL)进程来加快查询速度,例如为玩家提供哪些新功能。数据分析部门的负责人Diego Cáceres(迭戈·卡塞雷斯)敦促人们谨慎使用人工智能。他说:“仔细表述商业问题,并确定简单的数学方法是否足够好。”


五、持续的挑战


咨询公司Everest Group(埃弗莱斯集团成立于1991年,其业务网络遍布全球5大洲,为“世界1000强”企业长期提供分析、咨询、猎头等服务,是全球知名信息咨询机构。PEAK Matrix 评估报告是其主打产品之一,Everest Group已连续6年发布RPA领域的PEAK Matrix 评估报告。)的合伙人Yugal Joshi(尤加·乔希)说,除了在基于分布式云的工作负载中实现可持续人工智能的成本外,找出哪种工作负载消耗电力也是一个问题。因此,他说,大多数公司首先关注人工智能的商业成果,然后才关注可持续性。


Salesforce的Gamazaychikov(贾马扎奇科夫)说,另一个挑战是从开发者那里获得有关其基础人工智能模型碳足迹的信息。随着欧盟和美国证券交易委员会等机构的进一步监管,“如果公司还不披露数据,他们也必须尽快开始。”


另一个是人工智能驱动的巨大突破的诱惑,无论对环境造成什么代价。


Colby College(科尔比学院)的Stent(斯滕特)说:“有些公司说‘我想保持可持续发展’,但他们也希望以其卓越的人工智能而闻名,他们的员工希望做一些转型的事情。除非财政压力迫使他们的人工智能努力变得更有效率,”她说,“否则其他事情会让他们远离可持续性。”


作者:Robert Scheier(罗伯特·谢尔)