企业正全力推进AI(人工智能)领域,但数据无法支撑AI。以下是表明你当前的数据管理可能需要系统性升级的关键警示信号。

图源:Wesley Tingey / Unsplash
如果无法获取丰富且准确的数据,AI将无法发挥价值。不幸的是,许多企业所存储数据的方式,对于AI应用来说无法使用。
EY Americas(安永美洲:Ernst & Young Americas,业务咨询公司)的税务技术与转型负责人Daren Campbell(达伦·坎贝尔)表示,AI数据适配不足是普遍问题,即使在那些积极投资AI的组织中也是如此。
他说:“生成式AI和agentic AI(代理型人工智能)的采用正在加速,但只有极少数组织具备有效扩展AI所需的数据治理成熟度。这有助于解释为什么许多公司虽有AI活动,但却没有持续的业务影响,因为其战略期望超前于数据底座能力。”
你的企业生产力是否正被不准确、有缺陷或过时的数据所束缚?以下是快速罗列的七个关键迹象,表明你的组织需要进行数据改造。
一、你的数据战略偏向合规而非业务决策而设计的
与AI不兼容的数据通常是多年来数据孤岛系统、不一致标准和薄弱数据治理的结果。
Campbell(坎贝尔)说:“如今的许多企业数据是为合规和静态报告而设计的,并非为学习、自动化或实时决策而设计。未管理的非结构化数据、缺失的元数据、不明确的所有权以及有限的数据可溯源性,使问题更加复杂,所有这些都使得AI系统难以可靠地解释数据。”
Campbell(坎贝尔)补充说,生成式AI和agentic AI都在迅速加速发展,但只有极少数组织具备有效扩展AI所需的数据治理成熟度。
二、你在数据管理方面薄弱
金融服务公司Capital One的高级杰出工程师David Harmony(大卫·哈莫尼)表示,一个关键的数据管理问题是,团队在当前环境中难以使用现有数据。
“数据治理是AI落地的前置关键,是能够将数据用于AI的必要前提,”他说。
Harmony(哈莫尼)认为,企业领导者必须始终清楚他们的数据在哪里以及数据包含什么。“如果没有良好管理的数据战略,随着AI的加速发展,很难充分利用数据,”他说。
Harmony(哈莫尼)表示,Capital One正在通过对其云数据生态系统进行现代化改造,并构建支持数据发布、使用、治理和基础设施管理的企业平台来解决这个问题。目标是为AI计划创建一个管理良好的基础。“AI建立在管理良好的数据的强大基础上时,最为有效,”他说。
三、你的数据治理未能有效治理
University of Tennessee, Knoxville(田纳西大学诺克斯维尔分校)的副校长助理兼AI主任Vasileios Maroulas(瓦西莱奥斯·马鲁拉斯)表示,如果IT和企业领导者无法清楚地解释他们的数据存储在哪里、谁拥有这些数据以及这些数据是否可靠,那么企业就没有为AI做好准备。“如果每次分析都需要手动核对,AI会放大数据不一致风险,”他警告说。
Maroulas(马鲁拉斯)说,系统的自然增长、部门的孤立、不一致的定义以及缺乏治理,都导致了数据的不可预测性。他指出,大多数企业构建其基础设施是为了运行业务运营,而不是为了实现预测或自动化。“AI暴露了这些结构上的差距,”他指出。
为了提高数据的可预测性,Maroulas(马鲁拉斯)建议专注于治理和互操作性。“明确所有权,标准化术语,并有意地使数据管道现代化,”他说。
四、你的商业智能战略用户流失、使用率低
研究咨询公司ISG(Information Services Group,IT和业务流程服务的全球咨询公司)的AI和数据工程技术总监Olga Kupriyanova(奥尔加·库普里扬诺娃)表示,商业智能的低采用率是一个关键指标,表明一个组织的数据根本没有为AI做好准备。商业智能与AI有什么关系呢? 她说:“息息相关。BI(商业智能)是企业数据的试验场。”
Kupriyanova(库普里扬诺娃)说,当BI表现不佳时,业务用户不会等待——他们会绕过它。“他们会导出数据、自建本地模型,创建本地定义,并将自己的业务逻辑硬编码到电子表格或自定义分析中。”随着时间的推移,这种非官方的业务语义层会不断增加。“它们都不会回流到企业数据仓库中,而这正是真正的危险所在,会产生一种虚假的健康感,”她说。
Kupriyanova(库普里扬诺娃)解释说,从外部看,组织似乎没有重大的数据问题,因为仍在生成报告并做出决策。“然而,实际上,用户已经悄悄地不再依赖核心数据平台,也不再向IT部门寻求帮助。”
五、你的数据与AI可影响的业务成果不一致
技术咨询公司Concentrix的智能体解决方案负责人Guy Bourgault(盖伊·布尔戈)警告说,当AI系统突然开始给出不一致、过时或与预期体验不同步的答案时,这是数据不兼容的明显迹象。“这类失误通常指向缺乏持续治理的底层知识库,”他说。
Bourgault(布尔戈)指出,当领导者很难在他们可用的数据和AI预期影响的业务成果之间建立直接联系时,往往会看到数据不兼容的警告信号。“当这种清晰度缺失时,这表明数据基础还没有准备好大规模支持AI。”
Bourgault(布尔戈)说,与AI不兼容的数据通常源于最初是为人类解释而编写的信息,而不是为机器处理而编写的。
他指出:“许多知识库都属于这一类,因为它们依赖人类直觉来填补缺失的上下文或导航AI无法可靠遵循的决策树。随着权限老化或权限过宽,AI可能会访问它从未打算查看的内容,从而导致不准确或潜在有风险的回复。”他认为,随着时间的推移,过时的内容、不明确的结构和宽松的治理的混合,创造了一个脆弱的数据环境,AI难以正确解释。
六、你被数据负债(遗留问题)压得喘不过气
City University of New York’s School of Professional Studies(纽约城市大学专业研究学院)的数据科学学术主任Arthur O’Connor(亚瑟·奥康纳)观察到,数据质量是大多数人宁愿抱怨也不愿修复的问题。
他说:“这需要解决过去积累的问题,包括不一致的数据格式、缺失的值、相互冲突的业务规则以及不同的接口和协议。这是关于纠正走捷径的遗留问题。” 他观察到,很少有组织有时间、精力和意愿去做这件事。
O’Connor(奥康纳)说,这个数据负债(遗留问题)问题不仅是一个技术挑战;它也是一个组织问题。他说:“企业内部数据集在整个企业中难以被发现或管理不善的主要原因是,使用数据的IT人员和业务团队都没有资源或动力去实现数据的全部价值。虽然数据用户想要完全准确、干净且管理良好的数据,但单个数据所有者通常没有预算、财务激励或组织权力来确保高水平的质量和透明度。”
O’Connor(奥康纳)说,基本问题是,虽然AI很有吸引力、令人兴奋且有趣,但数据治理往往是乏味、枯燥且痛苦的。
七、基础分析难以高效输出
商业与税务咨询公司Eisner Advisory Group的AI咨询服务总监Jen Clark(珍·克拉克)表示,一个可靠的警示信号是,你所在组织的团队获取基本洞察的难易程度。
她警告道:“如果标准报告和分析都很困难,如果要整合出清晰的图景需要跨团队和资源付出努力,那么AI将会放大这一挑战,而非解决它。同样地,如果数据相互脱节或孤立,且没有明确的整合路径,这通常意味着在AI能够带来真正价值之前,需要先开展基础工作。”
Clark(克拉克)观察到,数据代表着现实世界,而现实世界是高度碎片化的。她指出,数据几乎从未(如果有过的话)为理想的AI场景做好完美准备,而且总是存在权衡取舍。“问题不在于不兼容性是否存在,而在于你如何围绕它划定范围,以创造实际价值。”