你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
拜耳作物科学将人工智能与数据科学相结合,实现创新优势
作者:CIO.com睿观 来源:CIOCDO 发布时间:2024年08月27日 点击数:

拜耳的农业部门正在开发一个基于 AWS 的新型数据科学平台,该平台融合了生成式 AI 功能,这将有助于推动“新颖”的农业解决方案。


来源:PeopleImages.com - Yuri A / Shutterstock


拜耳作物科学公司将生成式人工智能视为推动数千名数据科学家和工程师为全球农民创新农业解决方案的关键催化剂。


拜耳跨国生命科学公司拜耳的农业部门正在开发一个基于 Amazon SageMaker Studio 的新数据科学平台,拜耳作物科学全球数据资产负责人 Will McQueen 表示。他表示,该平台融合了 Amazon Bedrock 和 Amazon Q 的人工智能功能,旨在促进和加快“新型”农产品的创造。


大约 18 个月前,一支由来自拜耳、亚马逊和 Slalom Consulting 的约 10 名工程师和高管组成的紧密团队制定了“决策科学生态系统”的蓝图,并花了大约一年的时间构建该平台。McQueen 表示,拜耳的数据科学家已经在新平台上开发了几个生成式人工智能模型的概念验证,这些模型仍处于“有效性”的发现和评估阶段,并补充说这些模型要到 2025 年才会投入生产。


“目前,研发流程高度保密,”他说。但可以肯定的是,先进的生成式人工智能有朝一日可能会创造出杂交种子或新种子,从而改变和增加食品供应链。“我们公司的核心使命是养活世界,”麦昆说。


麦奎因表示,拜耳作物科学现有的数据科学平台建立在大约 7 年前名为 Domino 的授权平台上,但现在已经失去动力,需要更换以适应现代人工智能时代。决策科学生态系统的首个主要版本计划在未来几个月内发布。


McQueen 表示,与大多数企业一样,拜耳农业部门最初将使用基于 AWS 的生成式 AI 工具来自动化基本业务流程,例如内部技术文档的制作。构建该平台的核心工程师已经利用此功能来加快流程。他指出,在整个部门范围内提供此功能将刺激更强劲的实验和创新。


“在推出此功能之前,各个工程师必须根据自己编写的代码和其他开发内容创建自己的文档。AWS 的现成功能取代了这种手动工作,使我们的工程人员更加高效,能够比以前更快地交付价值,”McQueen 说道。 


即将推出的数据科学平台将由拜耳的工程师和数据科学家使用,它还具有与 Amazon Bedrock 的增强连接和集成、使用自然语言编写代码的能力以及强大的测试和安全护栏。  


作物科学团队还在数据科学平台上开发了独特的功能,包括模型注册表,这是一个自定义的 AI 模型目录和模型生命周期功能,可以跟踪模型从发现到测试、部署和生产的每个阶段的需求。McQueen 表示,模型注册表还使数据科学家能够利用同事开发的代码。


“从加速的角度来看,我们看到了利用生成式 AI 和 Bedrock 创造机会的可重用维度,”他说。“随着模型在其生命周期中移动,它具有不同的阶段门和强制执行这些阶段的要求。”


一、发起变革


农业部门通过开发该技术平台,将其生成性人工智能工作和与 AWS 的合作提升到了一个新水平,该平台不仅可以促进模型开发,还可以培训数据科学家和工程师掌握及时的工程技术和先进数据技术的应用,以创造新的商业产品。


在最近的峰会上,AWS 将拜耳作物科学列为其在生成式 AI 创新方面不断突破的企业客户之一,同时入选的还有 Exscientia 的先进药物发现平台和 EvolutionaryScale 的 ESM3,这为科学家和生物学家提供了一个用于构建各种实验蛋白质的快速工程平台。  


这种创新已融入拜耳作物科学公司科学家和工程师的 DNA 中,但麦昆强调说,使用新一代人工智能平台所涉及的变革管理水平——即使对于高技能人士来说——也是复杂的,需要“深思熟虑的评估”。


他说:“接受以完全不同的方式开展工作并利用人工智能需要一点时间来适应。”


McQueen 表示,Gen AI 的基本功能(例如文档摘要和内容创建)已经提高了数据科学平台的质量并缩短了可用时间。但随着时间的推移,拜耳的创新者和农业科学家将更善于利用该平台独特的工具和功能,以前所未有的方式进行创新。


“这将帮助员工更快地加入[我们的] gen AI 平台,并更好地了解其构建模型的能力,”McQueen 说。“这是附加的。”


尽管如此,他表示,这样做需要严格的监督和严格的质量控制程序,并承认使用地球上最先进的科学工具进行实验存在风险。 


为此,作物部门团队建立了安全措施,防止专有数据从平台泄露——或者更糟的是,向拜耳全球农业人口部署有前景但未经测试的解决方案。 


二、开放的态度


拜耳作物科学公司运营着一个多云环境,但麦奎因表示,由于 AWS 平台更灵活、更开放,因此他选择与 AWS 在 gen AI 方面进行更紧密的合作。基于 Bedrock 的平台将允许拜耳的数据科学家和工程师访问 Hugging Face 等市场上提供的各种开源大型语言模型 (LLM)。


亚马逊的 AI 平台还使拜耳等客户能够使用他们选择的数据平台,这是开发新一代 AI 模型的关键方面。McQueen 指出,在拜耳作物科学的案例中,Google BigQuery 是该部门的数据仓库。


他说:“我们很早就发现 AWS 具有构建灵活的技术能力的能力,这样我们就可以开发更加组件化的架构,使我们能够插入来自不同提供商的不同模型。”


例如,Bedrock 的新一代人工智能模型目录包括来自合作伙伴的开源和封闭模型,例如 Meta 的 Llama 2.1 和 Mistral 的 Large 2(其最先进的新一代人工智能模型)。


IDC 全球基础设施研究云和边缘服务研究副总裁戴夫·麦卡锡 (Dave McCarthy) 指出,云提供商对生成式人工智能的策略仍然各有不同。


“云提供商将采取不同的方法让客户能够使用这些不同类型的模型。谷歌一直专注于其内部开发的 Gemini 系列模型的价值,而 AWS 则采取了以合作伙伴为主导的第三方模型供应商方式,”他说。“从长远来看,哪种方法最好,目前还没有明确的赢家。”


与此同时,随着企业向更先进的新一代人工智能模型开发迈进,首席信息官将在供应商合作、采购、成本、开发、成果衡量和安全等方面面临诸多管理压力。


三、保障流程安全


尽管尚处于早期阶段,拜耳作物科学公司正在积极开发一系列新的用途,McQueen 声称这些用途将对农业行业产生“颠覆性”影响。


该部门正在与 Bedrock 同步推进其数据科学平台,并计划与亚马逊的 AI 平台更新相对应地推出其他产品。


在他们倾向于高级用例时,McQueen 的 IT 团队集成了自动过滤和监控工具以及其他保护措施来保护专有数据,包括集成指导科学家和工程师负责任地开发的方法。  


“对于我们开发的任何可能进入市场或直接嵌入工作流程的新功能,员工必须在其进入主流之前对其进行仔细的基准测试和测试,”McQueen 说道,他的团队努力防止原型在没有在数据科学平台中内置严格的质量控制测试的情况下流入食品供应。


“我们可以与人类专家一起测试[模型],在全面投入生产之前进行验证,”他说。“重要的是,我们不能向外部推出新功能,然后向农民提供影响其业务并造成伤害的糟糕建议。”