你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
数据网格:企业AI成功的秘诀
作者:CIO&睿观 来源:CIOCDO 发布时间:2025年06月06日 点击数:

关于AI技术的讨论充斥着诸如大型语言模型(LLMs)、代理AI和强化学习等专业术语。这里有一个在AI讨论中并不总是处于核心位置,但其实应该受到更多关注的术语:数据网格。在很多方面,数据网格是释放现代企业AI全部价值的关键。

图片来源:Daniel Avancini

考虑到数据网格实际上并不是AI解决方案的组成部分,这样的说法听起来可能有点奇怪。没有数据网格,你也可以构建AI工具和服务。

然而,如果没有数据网格,要完全释放企业AI所能提供的全部好处是非常困难的。数据网格并不是构建AI的先决条件,但它是构建真正创造商业价值的AI解决方案的重要补充技术。

一、什么是数据网格?

数据网格是一种数据架构,它使数据的去中心化管理成为可能。大多数数据网格通过连接组织拥有的各种数据源来实现这一点,从而使这些数据源能够集中访问。然而,底层的数据源仍然是独立的,因此可以根据每个数据源的具体情况以最适当的方式进行管理。

数据网格解决了将组织的所有数据强行放入单一、僵化位置的难题。当企业采用这种架构时,它们最终会陷入一刀切的数据管理方法——这在实践中是一个问题,因为不同的业务领域或部门通常有不同的数据管理需求。

有了数据网格,每个领域可以创建符合其需求的数据产品。由于数据通过数据网格统一起来,因此它仍然是可集中访问和管理的,但它也足够灵活,能够支持各种不同的需求和用例。

二、数据网格在AI中的角色

数据网格对企业AI有效采用和部署至关重要的主要原因是,数据是驱动AI的燃料——通过以特定领域的方式更轻松地访问数据,企业就能更有效地利用AI技术的力量。

为了更全面地解释这意味着什么,让我们先回顾一下现代AI技术,尤其是生成式AI和代理AI的工作原理,因为这两种AI正在推动当今最大的创新。

这些类型的AI解决方案由大型语言模型(LLMs)驱动,而这些模型是通过大量数据进行训练的。然而,商业LLMs的一个主要限制是它们所使用的训练数据并不特定于任何业务或业务领域。它们使用的是通用信息。

因此,目前企业采用的人工智能工具和服务背后的商业LLMs,例如微软的Copilot,对它们所支持的企业的特定需求或内部运作缺乏了解。它们可以很好地编写通用代码或起草通用电子邮件,但它们无法利用特定于业务的知识来执行诸如开发定制产品文档或了解公司的财务状况等任务。

或者至少,商业LLMs出厂时无法做到这些。不过,可以通过让LLMs接触特定于业务的数据来增强它们的能力,从而使它们能够执行特定于业务的任务。

这就是数据网格的用武之地。当企业已经建立了一个数据网格来组织其数据资产时,数据网格就成为了快速高效地将LLMs连接到它们支持高级用例所需数据的基础。

三、数据网格对企业AI的好处

轻松访问用于增强AI模型的数据只是数据网格帮助释放AI技术全部价值的开始。数据网格在企业AI中提供的全部好处包括:

  • 数据发现和可用性。有了数据网格,当企业想要增强AI模型时,不需要再去寻找相关的组织特定数据。这些数据已经通过数据网格进行了编目并可供访问。

  • 数据质量。即使数据资产分散在组织的各个环节,数据网格也通过实现一致的集中式数据管理方法来鼓励高质量的数据标准。

  • 特定领域的数据。由于数据网格根据业务领域组织数据,因此可以轻松地向LLMs提供特定于组织某个部分或目标用例的信息。例如,如果你想让LLM理解你的销售运营,你可以让它访问销售团队拥有的数据产品。与简单地在一个只有部分数据与特定领域或用例相关的大型数据集上训练LLM相比,这样更高效,也更有可能获得更好的性能。

  • 最新的数据。由于数据网格实现了数据的去中心化管理和所有权,它有助于确保数据保持更新。这对于有效使用AI至关重要,因为它使得在数据发生变化时可以重新训练LLMs——这对于模型需要基于最新信息采取行动的情况非常重要。

  • 数据安全。数据网格通过确保数据只对应该查看它的利益相关者开放,从而帮助实现高安全标准。这样可以减轻AI安全风险,例如组织将敏感信息暴露给第三方LLM,而LLM又泄露了这些数据的可能性。有了数据网格,可以在数据源处执行访问控制,限制LLMs读取敏感信息的能力。


作者:Daniel Avancini(丹尼尔·阿万西尼)

译者:穿山甲


睿观:数据网格作为一种去中心化的数据架构,虽非AI组件,却是释放企业AI(尤其是由LLM驱动的生成式和代理AI)全部价值的关键支撑技术。它通过连接各业务领域独立管理的数据源,实现数据的分布式自治与集中式可访问,为AI模型提供了便捷的数据发现、高质量的领域特定数据、持续更新的数据以及更强的安全性。这使得企业能够高效地增强AI模型处理特定业务任务的能力,从而创造真实的商业价值。

金句:

AI是引擎,数据是燃料,而数据网格则是确保燃料精准、高效、安全输送至引擎的智能管道系统。