OpenAI(OpenAI是一个人工智能研究实验室,成立于2015年,其目标是推动和发展友好的人工智能,使人类整体受益。OpenAI致力于创建和推广安全、有效的人工智能技术,并通过研究和合作来确保人工智能的进步能够造福全人类)和Anthropic(Anthropic是一家美国的人工智能初创公司,专注于开发通用AI系统和语言模型。Anthropic致力于构建人们可以依赖的AI系统,并产生关于AI的机会和风险的研究)等商业生成AI平台备受关注,但开源替代方案可以提供成本效益、安全性和灵活性。开源模型的性能不断提升,与商业模型的差距缩小,企业对开源模型的接受度越来越高,但仍面临一些挑战。未来,开源和商业模型将长期共存。
图片来源:GaudiLab / Shutterstock
旅行和费用管理公司Emburse(Emburse是一家提供企业级旅行和费用管理解决方案的软件公司。他们提供创新的端到端旅行和费用管理解决方案,帮助前瞻性的组织规划未来)看到了多个可以从人工智能中获益的机会。例如,它可以用于改善个人用户的体验,更智能地分析收据,或者通过发现欺诈行为来帮助企业客户。
以阅读收据并准确分类费用这一简单工作为例。由于收据看起来可能非常不同,因此很难自动完成这项工作。为了解决这个问题,该公司求助于新一代人工智能,并决定同时使用商业和开源模型。该公司首席技术官Ken Ringdahl(肯·林达尔)【Ken Ringdahl(肯·林达尔)是Emburse的首席技术官。作为CTO,Ken领导着Emburse的技术和开发运营团队。他拥有超过25年的工程经验,并且在企业基础设施软件领域有着专业的专长】表示,这两种类型的新一代人工智能都有其优势。OpenAI的主要商业模型部署起来更快、更容易,而且开箱即用,准确度更高,但开源替代方案提供了安全性、灵活性、更低的成本,而且经过额外培训后,准确度甚至更高。
Ringdahl(林达尔)表示,出于安全考虑,许多商业提供商会使用客户的数据来训练模型。您可以选择退出,但需要注意一些事项。例如,您可能需要支付更多费用以确保数据不会用于训练,并且可能会向公众公开。
“这是专有商业模式的缺陷之一,”他说,“有很多细则,而且并不总是公开的。”
然后是地理问题。Emburse在120个不同的国家/地区可用,而OpenAI则不行。此外,一些地区有数据驻留和其他限制性要求。“所以我们用开源来增强,”他说。“它使我们能够在未覆盖的地区提供服务,并在安全、隐私和合规方面打勾。”
目前,该公司正在使用法国制造的Mistral(Mistral是一个开源的自然语言处理模型,由Mistral AI团队开发。Mistral因其出色的性能和开源精神,在开源社区中获得了广泛的关注和认可)开源模型。“我们评估了所有主要的开源大型语言模型,发现Mistral在经过训练后最适合我们的用例,”他说。“另一个考虑因素是LLM的大小,这可能会影响推理时间。”
例如,他说,Meta【Meta AI是Meta公司(原Facebook公司)在人工智能领域的一系列技术、产品和服务的总称】的Llama(Llama模型是由Meta AI开发的一系列大型语言模型)非常大,这会影响推理时间。
“随着这一领域的快速发展,我们的开源大语言模型(LLM)选择肯定会发生变化,”他补充道。“我们已经开发了我们的软件,因此可以通过配置换入或换出大语言模型(LLM)(无论是开源的还是专有的)。”
另一个好处是,有了开源,Emburse可以进行额外的模型训练。该公司拥有收据样本,这些样本已经标记并分类,采用多种不同的格式和语言。“我们针对我们自己的特定用例对其进行了微调,使其效果非常好,因此成功率极高,”他说。
这意味着,对于非英语用例,经过微调的开源模型可能比大型商业模型更准确。
开源模型还为企业在升级时间方面提供了更大的灵活性。
Ringdahl(林达尔)说:“OpenAI目前的模型是GPT4.0,但他们会推出第五版,而第四版最终会消失——这是他们的时间表,不是我的。”
这是个问题,因为开发商业产品需要大量的测试和优化。“有了开源,你就可以控制在哪里使用它以及什么时候会消失,”他说。
最后,还有价格问题。开源并非完全免费,因为仍然存在基础设施和管理成本。
“就我们而言,我们在自己的私有云中通过AWS(AWS是亚马逊公司提供的一个广泛的云计算服务平台。AWS允许个人、公司和政府组织从亚马逊的数据中心租用计算能力,而不是建立自己的服务器和数据中心)运行它,”他说。“所以我们仍然需要为使用付费。如果你不了解使用模式以及这对你的费用的影响,这仍然会让你大吃一惊。”
但总体而言,无需支付OpenAI的API费用肯定可以节省成本。“这可能是使用开源模型的两三个主要原因之一,”他说。“你可以更好地控制成本。”
其他公司也发现,尽管存在风险,但开源人工智能模型可以提供更多的灵活性、安全性和成本优势。
1.丰富的选择
最普遍的定义是,“开源”在这里指的是代码可用,模型可以在各种情况下免费修改和使用。有很多这样的模型可供选择。
Hugging Face(Hugging Face是一个开源的机器学习平台,专注于自然语言处理和人工智能,为开发者和研究人员提供了丰富的预训练模型、工具和资源,推动了AI技术的发展和应用)目前仅针对文本生成就跟踪了超过150,000个LLM,而六个月前这一数字为80,000。太多了,无法选择?Chatbot Arena(Chatbot Arena是一个开放平台,用于基于人类偏好评估大型语言模型和聊天机器人。它允许用户在匿名、随机的对战中比较不同的AI聊天机器人,并提供一个排行榜来展示不同模型的性能)对160多个顶级模型(包括专有和开源模型)进行了排名,并列出了它们的许可证。
除了模型本身,还有数千种与新一代人工智能相关的开源工具。GitHub(GitHub是一个面向开发者的互联网托管平台,同时也是一个版本控制和协作式软件研发的平台)列出了100,000多个名称中带有LLM的项目,而5月份只有50,000个。但大多数公司都坚持与大公司合作。Deloitte【Deloitte(德勤)是一家全球领先的专业服务网络,提供审计、税务、管理咨询、风险咨询和财务咨询服务。在人工智能领域,德勤展现了其战略布局和专业能力】技术、媒体、娱乐和电信行业实践人工智能部门负责人Baris Sarer(巴里斯·萨雷尔)【Baris Sarer(巴里斯·萨雷尔)Baris Sarer 是Deloitte(德勤)的全球人工智能实践负责人,专注于技术、媒体和娱乐、电信行业。他被认为是该领域的思想领袖,经常在行业论坛、出版物和活动中作为作者和演讲者贡献自己的见解】表示,Meta的Llama模型是在行业部署中出现最多的模型,其次是Mistral。在Chatbot Arena排行榜上,最新的Llama3.1略微落后于最新的OpenAI模型(9月份的GPT-4.0),但领先于8月份发布的同一模型。
“Meta最初推出的都是一些较小的模型,”Sarer(萨雷尔)说。“但现在他们也有了前沿模型,并与主要参与者展开了激烈竞争。”市场份额数据也支持了这一点。根据预测销售平台Enlyft(Enlyft是一个基于人工智能的B2B客户智能平台,旨在帮助B2B销售和市场营销团队识别、优先考虑和吸引正确的客户。它提供数据增强、预测模型和强大的集成功能,以支持B2B企业发现新的潜在客户并提高销售效率)的数据,在GPT-4 41%的市场份额之后,Llama以16%的市场份额位居第二。Mistral也榜上有名,尽管其市场份额不到5%。
Kong对开发人员的API使用情况进行了调查,结果发现了类似的平衡,OpenAI占27%,Llama占8%,Mistral占4%。除了排名靠前的知名前沿模型外,专为小众用例设计的小型语言模型(SLM)也在迅速普及。
Carnegie Mellon University(卡内基梅隆大学)【Carnegie Mellon University(卡内基梅隆大学)是一所位于美国宾夕法尼亚州匹兹堡的世界著名私立研究型大学。在全球范围内享有极高的学术声誉,尤其在计算机科学、工程学、艺术、商业管理、公共政策和科学等领域】人工智能教授Anand Rao(阿南德·拉奥)【Anand Rao(阿南德·拉奥)是卡内基梅隆大学海因茨学院的杰出服务教授,专注于应用数据科学和人工智能领域。他在数据、分析和人工智能的研究、创新、应用以及商业和社会采纳方面拥有超过35年的咨询、行业和学术经验】表示:“研究表明,参数数量在数百万到数十亿的小型语言模型在专门任务中的表现可以胜过大型通用语言模型。”
他说,它们还需要更少的计算能力,并且可以更有效地进行微调。这使得它们更适合在资源受限的环境中部署。
2.Llama提供销售支持和编码
Deloitte的Sarer(萨雷尔)最近与一家数据中心技术公司合作,该公司正在寻求人工智能来帮助改造前台和后台办公室。
“他们有一系列用例—销售、营销运营、现场服务,”他说。“我们选择Meta的Llama作为首选模型,因为其成本、控制、可维护性和灵活性。”
例如,对于销售拓展,人工智能用于从内部和外部来源获取见解,以便更好地让销售人员向客户推销产品和服务,并提出追加销售和交叉销售建议。
“几个月前,他们在美国和欧洲地区推出了这款产品,现在他们根据反馈进行了改进,并将更广泛地推广,”Sarer(萨雷尔)说道。“我们从使用它的销售人员那里得到了很好的反馈。”
然而,他说现在正式计算投资回报率还为时过早,这需要长期收集更多数据点。但早期结果足以扩大推广范围。
确实,专有的新一代人工智能(通常是OpenAI)得到了最多的采用。但Sarer(萨雷尔)说,在许多情况下,开源替代方案也是合理的。
“如果客户倾向于在本地部署AI,那么开源就是唯一的选择,”他说。“而在某些行业,本地部署实际上仍然相当普遍。”而且,与Emburse一样,许多公司也看到了使用开源的地理原因。
“在全球范围内,我们看到人工智能对国家安全和主权的重要性日益增加,因此需要将人工智能(模型)保留在自己的地区,”他说。“坦率地说,这使得开源成为唯一的选择。”
许多其他公司也发现微调自己的模型有好处。
“你可以采用预先训练好的开源模型,并用自己的专有数据对其进行微调,”他说。他补充说,开源在部署方面提供了更大的灵活性。“如果你想在边缘部署一个较小的模型,那么该领域的大多数模型都是开源的。”
最后,除了安全性和灵活性之外,成本也是一个关键因素。有了开源,公司仍然需要支付基础设施费用,但不必支付人工智能供应商的利润。“开源是有理由的,而且这种理由会越来越充分,”Sarer(萨雷尔)说。
即使是开箱即用的模型,某些开源模型在某些任务上也可能比商业替代方案更好。Globant(Globant是一家全球性的科技公司,专注于通过创新技术解决方案帮助企业进行数字化转型和业务重塑。服务于媒体和娱乐、专业服务、技术和电信、旅游和酒店、银行、金融服务和保险以及消费、零售和制造行业的中大型公司)数字创新高级副总裁兼技术副总裁Agus Huerta(阿古斯·韦尔塔)【Agus Huerta(阿古斯·韦尔塔)是Globant的高级副总裁,负责数字创新以及物联网和技术领域的副总裁。他常驻阿根廷,并在IT服务和IT咨询行业工作。AgusHuerta在Globant担任多个重要角色,包括作为技术领导者,他对人工智能、数据和创新技术有深刻的见解和丰富的经验】表示,他发现使用Llama 3(Llama 3是Meta公司推出的一系列大型语言模型,包括具有70亿和80亿参数的预训练和指令微调的语言模型)的代码生成性能比ChatGPT更好。
“Llama 3已被证明能够帮助人们理解软件以及它与其他代码行之间的关联,”他说。“它还可以帮助重构。事实证明,Llama 3在这方面非常出色。”
他补充说,当一个新的开发人员需要快速进入一个项目并开始工作时,它有利于入职培训,而且对于维护一个解决方案也很有帮助。”
3.开源人工智能为何落后于商业
成本更低、灵活性更高、安全性更高——开源有什么不值得爱的呢?开源和专有模型之间的性能差距很大,但去年已经是很久以前的事了。Gartner(Gartner,全称Gartner,Inc.,是一家全球知名的研究和咨询公司,专注于信息技术行业。Gartner提供市场研究、数据分析、技术咨询和战略规划服务,帮助客户做出更明智的业务决策)分析师Arun Chandrasekaran(阿伦·钱德拉塞卡兰)【Arun Chandrasekaran(阿伦·钱德拉塞卡兰)是Gartner的杰出副总裁和分析师,他在Gartner全球首席信息官实践团队中工作,主要研究领域是人工智能。作为Gartner的副总裁兼高级分析师,Arun Chandrasekaran在多个场合和报告中就生成式人工智能的趋势和影响发表了看法。他强调了生成式人工智能将成为企业管理层的“首要任务”,并预测到2026年,超过80%的企业将会采用生成式AI的应用程序编程接口或模型,或在其生产环境中部署生成式AI支持的应用】表示:“到2024年,差距将显著缩小。但尽管差距显著缩小,我们还没有看到很多开放模型投入生产。”
他说,其中一个原因是,公司已在闭源模型上投入了大量资金,并且认为没有迫切需要改变。此外,还有运行开源模型的运营复杂性以及潜在的法律责任。法律赔偿是OpenAI、微软、Adobe和其他主要供应商的Gen AI合同的共同特征。
但开源则不然。“模型创建者通常不承担法律责任,”Chandrasekaran(钱德拉塞卡兰)说。是的,开源模型可以更容易地重新训练或定制。但他表示,这个过程既复杂又昂贵。“而且底层基础模型正在迅速变化,”他补充道。“如果你定制了某些东西,而基础模型发生了变化,你就必须重新定制它。”
最后,还有长期可持续性的问题。“建立一个开放模型,发布它,让数百万人使用它,这是一回事,而围绕它建立一个商业模式,并将其货币化,这是另一回事,”他说。“货币化很难,那么谁会继续资助这些模型呢?建立第一个版本是一回事,但建立第五个版本又是另一回事。”
Genpact(Genpact是一家全球性的专业服务公司,专注于通过数字化转型和智能化运营帮助企业实现业务改进。提供的服务包括财务和会计、采购和供应链管理、客户服务、人力资源以及信息技术等,支持多种语言服务)全球人工智能主管Sreekanth Menon(斯里坎斯·梅农)【Sreekanth Menon(斯里坎斯·梅农)是Genpact的全球人工智能/机器学习实践的领导者。他负责领导Genpact的全球AI/ML项目交付,并带来了超过二十年的创新和行业专业知识。Sreekanth在孵化和推出全球市场上的50多个高级分析解决方案方面发挥了重要作用,并与财富500强客户合作,通过创新的AI驱动解决方案和实践推动业务转型】表示,最终,我们可能会走向一个混合的未来。“尽管开源接管的情绪很普遍,但开源和闭源模式都有其一席之地,”他说。“企业最好不要拘泥于任何模式。”
资金雄厚的公司支持的闭源模型可以突破人工智能的极限。“他们可以提供高度精细、专业化的解决方案,这些解决方案受益于对研发的大量投资,”他说。
4.开源定义为何对企业如此重要
任何关于开源人工智能的讨论中,Meta的Llama都是第一个被提及的。但从技术上讲,它可能不是开源的,而且区别很重要。10月下旬,开放源代码倡议发布了开源人工智能的第一个形式定义。
它要求开源人工智能不仅要共享源代码和支持库,还要共享模型参数,以及模型训练数据的完整描述、其来源、范围、特征和标记程序。但更重要的是,用户必须能够将开源人工智能用于任何目的,而无需征得许可。
根据这一定义,Meta的Llama模型是开放的,但从技术上讲并非开源,因为存在局限性。例如,某些Llama模型不能用于训练其他模型。如果将其用于每月用户超过7亿的应用或服务,则需要获得Meta的特殊许可。
Meta本身将其称为社区许可证或定制的商业许可证。OpenInfra Foundation【OpenInfra Foundation(开源基础设施基金会,简称OIF)是一个非营利性组织,致力于推动开放源代码的基础设施技术的发展和普及。基金会致力于创建能够高效开发优质软件的开源社区,并推动开源技术在人工智能、5G及边缘计算等领域的应用与发展】首席运营官Mark Collier(马克·科利尔)【Mark Collier(马克·科利尔)是OpenInfra Foundation的首席运营官,同时也是OpenStack项目的联合创始人。作为一名坚定的开源原则倡导者,Mark在推动OpenStack成为云计算中坚力量的过程中发挥了重要作用】参与制定了新定义,他表示,企业用户了解这些细微差别非常重要。“对我来说,最重要的是,个人和公司有能力和自由地采用这项基础技术并将其重新组合、使用和修改用于不同目的,而无需征得守门人的许可。”因此,公司需要确信它可以将AI融入产品中,而不是有人回来告诉我不能这样使用。
供应商有时会宣布他们的人工智能是开源的,因为它有助于营销和招聘,并让客户感觉他们没有被束缚。“他们有这种光环效应,但他们并没有真正做到这一点,”Collier(科利尔)说。
在热潮中,企业可能会将供应商关于其人工智能是开源的描述视为表面现象。
“Meta是一个很好的例子,”他说。“很多主流科技报道都说这是开源人工智能,扎克伯格就是这样描述的,而且这种说法被反复提及。但当你深入了解细节时,就会发现许可证是有限制的。”
他补充说,随着各家公司越来越认真地在AI技术上投入巨额商业赌注,它们需要谨慎对待许可证。他补充说,使用具有完全开源许可证的模型还有其他好处。例如,可以访问模型的权重,这使得微调和调整变得更容易。公司需要注意的另一件事是开源许可证,它要求所有衍生作品也必须是开源的。
公司通常不愿公开定制或微调的模型,因为模型中可能隐含了敏感的训练数据。虽然逆向工程模型以获取训练数据并非易事,但这种风险是存在的。
人工智能领域发展迅速,模型开发人员不断创新,许可证问题也日益复杂。在这种情况下,自定义许可证并不能解决问题,反而可能增加法律风险。建议企业在发布开源模型时,选择现有且成熟的开源许可证,以明确模型的使用范围和限制,降低法律风险。
作者:Maria Korolov(玛丽亚·科罗洛夫)
译者:穿山甲
【睿观:总的来说,开源模型为企业提供了更多的选择和灵活性,但同时也带来了新的挑战。企业需要根据自身情况做出明智的选择,并不断关注技术的发展趋势。
开源模型的优势:
成本效益高: 无需支付高昂的API费用,降低了使用成本。
灵活性强: 可以根据企业自身需求进行定制和微调,适应性更强。
安全性高: 避免了数据泄露的风险,更符合数据隐私要求。
社区活跃: 有庞大的开源社区支持,可以获得更多的资源和帮助。
商业模型的优势:
性能稳定: 商业模型经过了更长时间的优化,性能通常更稳定可靠。
服务支持完善: 提供专业的技术支持和维护服务。
不断更新: 商业模型会持续更新迭代,保持技术领先。
企业选择时的考量因素:
成本: 开源模型在长期来看更具成本优势,但初期投入也需要考虑。
性能: 开源模型经过微调后,性能可以与商业模型相媲美。
安全性: 开源模型在数据隐私方面更有优势。
灵活性: 开源模型可以根据企业需求进行定制,灵活性更高。
法律合规: 需要仔细评估开源许可证,确保符合企业法律要求。
行业趋势:
开源模型的性能不断提升,与商业模型的差距缩小。
企业对开源模型的接受度越来越高,但仍面临一些挑战。
未来,开源和商业模型将长期共存,企业可以根据自身需求选择合适的模型。
开源模型已经成为企业在生成式AI领域的重要选择之一。 它们在成本、灵活性、安全性等方面具有显著优势。
企业在选择模型时,需要综合考虑多种因素,没有绝对的最佳选择。
开源模型的生态系统正在不断发展,未来将有更多的创新和突破。
明确需求: 首先明确企业的具体需求,包括性能、成本、安全性、可定制性等。
评估模型性能: 对不同模型进行评估,选择最适合自己需求的模型。
考虑法律合规: 仔细评估开源许可证,确保符合企业法律要求。
构建混合方案: 可以将开源模型和商业模型结合起来,发挥各自优势。
关注模型的长期维护: 开源模型的维护需要企业投入一定的资源。】