AI需要在优质“数据”的滋养下才能成长——CIO应把握的数据管理精髓-福建信息主管（CIO）网

AI需要在优质“数据”的滋养下才能成长——CIO应把握的数据管理精髓

作者：CIO.com&睿观来源：CIOCDO 发布时间：2026年05月25日点击数：

自从生成式AI出现以来，企业在AI方面的应用已不再是一种“可做可不做”的选择，而变成了“不这么做就无法生存”的必然要求。许多企业都正致力于利用AI来提升生产力、创造新的业务价值。

【关西电力公司（Kansai Electric Power）】

导言：在人工智能时代，竞争力的源泉究竟是什么？

自从生成式AI出现以来，企业在AI方面的应用已不再是一种“可做可不做”的选择，而变成了“不这么做就无法生存”的必要条件。许多企业都致力于利用AI来提升生产力、创造价值。

在这里，我想要再次向大家提出一个问题。那就是：“究竟是什么决定了人工智能的本质性能？”

决定AI性能的因素，是AI的模型吗？是AI使用的工具吗？还是AI智能体（Agent）呢？当然，我认为这些都很重要。不过从长远来看，多家公司围绕AI模型性能展开的竞争最终会在某个节点趋于收敛。到那时，很可能会出现“不管用哪家的AI模型都一样厉害”的局面。

在这种背景下，我认为能够真正影响AI性能、也是最重要的一环，就是企业所积累的、能够转化为自身优势的“数据”。

例如，如果有人问“花草需要吸收什么才能茁壮成长？”，答案自然是“优质的水分和阳光”。另外，如果被问到“人类需要接受什么才能获得良好成长？”，我认为是“美好的言语”。最后，“AI是通过什么来获得成长的呢？”答案就是“优质的数据”。

对于这一极其简单的原理，企业能在多大程度上深刻理解并坚定不移地执行，将决定其能否确立竞争优势并实现持续增长。

AI是“数据的镜子”

想必大家都已经认识到，AI绝不是什么“魔法棒”。它只是根据被喂给的数据进行学习，并在那个范围内进行推理的存在。也就是说，AI的输出结果在极大程度上依赖于输入数据的质量。可以说，“AI就是数据的镜子”。

如果输入不准确的数据，就会返回不准确的结果（=垃圾进，垃圾出 / Garbage in, garbage out）。
如果输入带有偏差（偏见）的数据，AI就会做出带有偏差的判断。
基于不充分的数据，只能得到肤浅的见解或提示。

由此可见，AI本身并不“聪明”，它只是“忠实于数据”。基于这一前提，我们可以看清：应用AI的本质不在于“使用哪种工具”，而在于“如何整理出优质数据，并妥善加以利用”。

什么是“优质数据”？

那么，什么是“优质数据”呢？显然，仅仅是数据的“量”大，如果质量不行也是毫无用处的。但另一方面，所谓“质量”好，具体指的又是什么呢？

从一般的数据管理视角来看，“优质数据”至少应具备以下几个维度：

正确性（Accuracy）：包含大量错误和噪音的数据，无论进行多么高级的分析，得出的结论都会被扭曲。因此，尽量减少传感器误差、输入错误和数据重复是至关重要的。
完整性（Completeness）：所需字段是否缺失？缺失值是否过多？例如，如果一份客户数据中，年龄、地区、性别等信息出现大面积空白，就很难进行有效的分析。
一致性（Consistency）：相同含义的数据是否存在不同格式混用的情况（例如：日期格式、单位、名称缩写不统一）？这在系统集成和处理长期数据时尤为重要。
最新性（Timeliness）：数据再准确，如果过于陈旧，也可能对当前的决策毫无帮助。是需要实时数据，还是过去的历史数据就足够？这取决于具体的用途，但关键是要保证“符合目标的适当新鲜度”。
目的适切性（Relevance）：如果包含了太多与分析目的无关的数据，就会变成噪音并导致误判。必须明确“为了什么目的使用数据”，并准备与之高度相关的数据。
可靠性（Reliability）：数据的来源是哪里？是如何收集的？这些信息必须明确以确保可靠性，同时还要具备可复现性。来源不明的“黑盒”数据在后期是无法进行验证的。

总而言之，所谓的“优质数据”，指的是“准确无误、缺失少、含义和格式统一、时效性恰当、符合使用目的且来源可靠”的数据。

只有确保了作为“优质数据”的质量底线，AI才能产出有价值的结果。反过来说，如果在数据尚未整理好的状态下盲目引入AI，是绝对无法获得预期成果的。目前许多企业抱怨“引入了AI却没法用”、“AI的准确率提不上去”，其根源大多出在数据问题上。

数据并非“自然而然就能整理好”

这里非常关键的一点是：优质数据绝不是自然而然就能产生的。相反，如果置之不理，数据必然会发生劣化。

根据输入人员和时机的不同，输入规则变得五花八门。
存在多个含义相同但命名不同的数据。
从未被更新过的陈旧数据散落各处，无人问津。
各个部门的数据形成“孤岛（Silo）”，互不相通。

上述这些情况，在许多企业中应该都屡见不鲜吧。

以下展示了本公司在数据管理方面的整体架构。

【数据管理整体架构图】

宏观上，它主要由两大板块构成：一是涉及角色与体制、风险管理、评估的“数据治理”；二是包含数据应用生命周期管理与支持服务的“数据管理”。其中，在数据应用的生命周期管理方面，包含以下流程：

需求管理：明确目的和需求，即“为什么要使用这些数据？”、“这些数据能为谁带来什么价值？”。
收集：根据目标收集必要的数据。设计需要哪些内部/外部数据、以何种粒度和频率收集，以及如何确保其质量。
加工：提升数据质量，将其整理成可用的形态。包括数据清洗（纠正错误与填补缺失）、格式统一、数据合并与查重、针对结构化/非结构化数据的专项处理，以及赋予业务层面的具体含义等。
蓄积：确保数据处于“需要的人在需要时即可使用”的状态。包括存入数据库/数据湖、实施安全与访问控制、元数据管理（让人知道这是什么数据）等。
利活用（应用）：这是最重要的一步。使用数据的目的不是为了“分析”，而是为了“促成行动”。通过数据可视化（仪表盘）、高级分析（统计处理、BI、AutoML、AI），以及嵌入业务流程（自动化、决策支持）等方式，从数据中创造出真正的业务价值。
废弃：妥善处理不再需要的数据。包括保管期限的管理、应对法律法规与合规审查、降低安全风险等。事实上，仅仅是“持有数据”本身就可能构成一种风险。因此，“不保留不需要的数据”这一理念同样重要。

数据管理绝不是一次性建好就结束的工作，而是一项需要持续维护和改进的长期工程。CIO必须将数据管理作为一种机制嵌入到组织中，并持之以恒地执行，直到它彻底扎根。

数据管理并非“只有IT部门才该负责的工作”

另一个核心要点是：数据管理绝不仅仅是IT部门单打独斗的工作。

数据基本上都是在一线业务的运转过程中产生的。因此：

数据的含义和定义到底由谁来拍板？
如何统一数据的输入规则？
如何从源头确保数据的质量？这些问题，本质上都是业务层面的问题、事业发展的问题，更是企业经营层面的问题。

在日本经济产业省于2026年4月发布的最新版《数字技能标准 ver.2.0》中，针对数据管理领域，划定了以下三种关键角色：

数据管家（Data Steward）：基于对业务领域的深厚了解，负责确保数据质量、可靠性与安全性相关的运营工作。同时，还要推动数据管理在业务部门和一线组织中的渗透与扎根，促进数据的有效利用。可以说是“数据质量的把关人与数据应用的推广者”。
数据工程师（Data Engineer）：把握数据的现状，在数据收集、整合、加工、提供等各个流程中实施数据整理与预处理，并通过设计与搭建数据管道，来支撑整个组织的持续性数据利用。可以说是“让数据流动起来的落地与运维执行者”。
数据架构师（Data Architect）：俯瞰整个组织和业务的数据结构、流向及应用方式。紧扣业务战略，设计着眼于数据全生命周期的整体架构，并进行持续优化，从而实现跨部门的数据利用与数据治理的完美平衡。可以说是“数据的全局总设计师”。

对于CIO而言，不能仅仅停留在搭建数据存储和分析的IT基础设施上。更迫切的任务是：在公司内部合理配置具备这三种角色的专业人才，搭建跨部门的全公司统一工具与规则，从而发挥将“企业经营、事业发展、日常业务与数据”紧密缝合的纽带作用。

数据应用的成败，最终取决于“组织风气（企业文化）”

然而，不管人才配置得多么齐备，基础设施、工具和规则搭建得多么完善，如果组织内部没有形成“基于数据来驱动经营和业务”的文化风气，数据依然无法被真正用起来。

一线员工根本不理解录入这些数据的意义是什么。
数据和指标仅仅为了应对本部门的考核而进行了局部优化。
基于客观数据做出的高质量决策，在公司内部得不到认可和奖励。

在这样的状态下，无论机制设计得多么精妙，最终都会流于形式。

反观那些数据应用开展得非常顺利的组织，以下行为往往是自然而然发生的：

所有讨论和会议，都以客观数据为前提。
先提出假设，然后用真实的数据去验证它。
全员都有意识地持续改善数据的质量。

也就是说，数据管理的终极本质，其实是为了营造一种“以利活用数据为前提的组织文化”。

这种文化的形成不可能一蹴而就。正因如此，最有效的方法是“从小处着手，积小胜为大胜”：

在某个特定的核心业务中先行整理数据，并通过引入AI取得立竿见影的成果。
将这个成功案例在公司内部横向推广。
逐步扩大数据治理和AI应用的目标领域。

通过不断运转这个正向循环，数据的重要性就会潜移默化地渗透到整个组织的血液中。

AI时代CIO应扮演的新角色

在AI时代，外界对CIO的角色期望已经发生了天翻地覆的改变。

在过去，CIO的核心职责主要是：

确保IT系统的稳定运行。
最大化地优化IT成本。

但从今往后，CIO需要承担更多直接关乎企业经营命脉的职责：

将数据视为企业的核心资产，并实现其价值的最大化。
为AI的应用铺好路：搭建数据基座、工具和规则，同时推进相关人才的配置与培养。
在全公司范围内，主导酿造“以数据为驱动”的组织文化。

换句话说，CIO必须完成自我进化，成为企业“数据价值创造的总负责人”。

结语：数据，才是竞争优势的真正源泉

在未来的时代，全面利活用AI将成为所有企业生存的基准线。在这场竞争中，拉开差距的关键已经不再是“你是否使用了AI”，而是“你手里到底掌握着什么样的数据”。

数据，是对企业过去各项经营优势的沉淀，更是创造未来商业价值的源泉。而数据的质量，则是由每天的日常业务和组织的运作方式所决定的。

AI，需要在优质数据的滋养下才能茁壮成长。
而企业，则将通过这些强大的AI实现飞跃式成长。

把这个最简单的原理作为一切的出发点，将数据管理彻底推向企业经营的核心位置。这难道不是在AI时代实现企业持续增长的最短路径吗？

而身为CIO，正是那个需要挺身而出、牵引着企业走完这条路径的关键领航人。

下期预告：彻底思考并实现“人与AI的协作究竟是什么？”——CIO应当设计的新型工作方式与企业变革

应用AI的本质不在于“替代”，而在于“协作”。
AI究竟擅长什么？人类又该担负起哪些核心职责？
要实现人机协作，对现有业务流程进行重新设计是必不可少的。

CIO悄悄话：老板天天催AI落地，业务天天骂AI太蠢？作为CIO我终于看透了真相……

最近，生成式AI可谓是火遍了大江南北。老板在外面听了几场峰会，回来就下了死命令：“现在不用AI，以后就没饭吃！赶紧在全公司推行！”

于是，我们IT部门加班加点，采购工具、部署模型、开放接口。可是没过几天，业务部门的吐槽就如潮水般涌来：“这AI怎么总是胡说八道？”“预测的结果根本不准啊！”“这简直是人工智障，还不如我自己用Excel算得快！”

面对这些指责，很多同行可能会抱怨现在的AI大模型还不够成熟。但作为CIO，在仔细排查了系统后，我终于看透了背后的真相——这根本不是AI的锅，而是我们自己数据的锅！

【痛点直击：你喂给AI的是垃圾，它凭什么给你吐出黄金？】

很多企业在搞AI的时候都有一个误区，以为买个最贵的模型、上个最酷的工具，就能立刻产生价值。但事实是，AI并不是魔法棒，它只是一面“数据的镜子”。

回想一下我们公司内部的数据现状吧：各部门各自为政，数据形成了无数个“孤岛”；同一种数据有三种不同的命名规则；客户信息缺斤少两，好几年都没人更新…… 如果我们把这些充满噪音、偏差和错漏的“垃圾数据”喂给AI，AI怎么可能得出准确的结论？“Garbage in, garbage out（垃圾进，垃圾出）”，这就是我们在AI落地时遭遇的最大拦路虎。不解决数据源头的问题，任何高大上的AI项目最后都会沦为形式主义的摆设。

【方案落地：跳出技术自嗨，重塑数据生命周期】

长远来看，市面上的AI模型能力最终会趋于同质化。大家都用差不多的模型时，真正的护城河是什么？是你自家独有的、高质量的“企业数据”。为了让AI能够吸收“优质的养分”茁壮成长，我们必须转变思维，把数据管理当成一把手工程来抓。

第一，明确数据管理不仅是IT部门的事，更是业务的事。数据是在业务中产生的，它的含义和质量必须由业务来把控。我们需要在组织内建立起“铁三角”：

数据管家（Data Steward）：懂业务，负责盯紧数据质量，推动部门内的数据应用。
数据工程师（Data Engineer）：懂技术，负责清洗、整合数据，搭建数据流通的管道。
数据架构师（Data Architect）：懂全局，根据公司战略设计整体的数据架构和生命周期。

第二，打通数据管理的完整闭环。不要再任由数据在系统里发霉了！从明确“为什么用这些数据”的需求管理开始，到按需收集、清洗加工（去重补缺）、安全蓄积，再到最终融入业务流程创造价值，甚至包括过期废弃。每一个环节都要有规可循。我的建议是：不要想着一口吃成胖子。找一个最痛的业务场景切入，先把这一块的数据洗干净，让AI跑出让人惊艳的成果，然后再把这个成功经验横向复制到其他部门。

【终极价值：让数据重塑组织文化，完成CIO的华丽进化】

当我们真正把数据管理做扎实了，带来的改变是颠覆性的。

你会发现，跨部门开会不再是“我觉得”、“凭经验”，而是“用数据说话”、“提假设，用数据验证”。当“以数据为前提”的组织文化生根发芽时，AI才能真正从一个“尝鲜的玩具”，变成企业生产力爆发的“核武器”。

而在这一场变革中，我们CIO/CDO的角色也迎来了终极进化。过去，我们只是负责“系统稳定、控制成本”的后勤大管家；但现在，我们正式成为了企业“数据价值创造的总负责人”。

记住，在AI时代，能拉开企业差距的，永远是你手里捏着的好数据。把土壤培植好，AI自然会开出最惊艳的花。各位IT同仁们，别再盯着模型看了，赶紧回去梳理你们的数据吧！

上一篇：【火山引擎AI创新巡展·福州站邀请函04】…

下一篇：【火山引擎AI创新巡展·福州站邀请函05】…