自从生成式AI出现以来,企业在AI方面的应用已不再是一种“可做可不做”的选择,而变成了“不这么做就无法生存”的必然要求。许多企业都正致力于利用AI来提升生产力、创造新的业务价值。

【关西电力公司(Kansai Electric Power)】
导言:在人工智能时代,竞争力的源泉究竟是什么?
自从生成式AI出现以来,企业在AI方面的应用已不再是一种“可做可不做”的选择,而变成了“不这么做就无法生存”的必要条件。许多企业都致力于利用AI来提升生产力、创造价值。
在这里,我想要再次向大家提出一个问题。那就是:“究竟是什么决定了人工智能的本质性能?”
决定AI性能的因素,是AI的模型吗?是AI使用的工具吗?还是AI智能体(Agent)呢? 当然,我认为这些都很重要。不过从长远来看,多家公司围绕AI模型性能展开的竞争最终会在某个节点趋于收敛。到那时,很可能会出现“不管用哪家的AI模型都一样厉害”的局面。
在这种背景下,我认为能够真正影响AI性能、也是最重要的一环,就是企业所积累的、能够转化为自身优势的“数据”。

例如,如果有人问“花草需要吸收什么才能茁壮成长?”,答案自然是“优质的水分和阳光”。 另外,如果被问到“人类需要接受什么才能获得良好成长?”,我认为是“美好的言语”。 最后,“AI是通过什么来获得成长的呢?”答案就是“优质的数据”。
对于这一极其简单的原理,企业能在多大程度上深刻理解并坚定不移地执行,将决定其能否确立竞争优势并实现持续增长。
AI是“数据的镜子”
想必大家都已经认识到,AI绝不是什么“魔法棒”。它只是根据被喂给的数据进行学习,并在那个范围内进行推理的存在。也就是说,AI的输出结果在极大程度上依赖于输入数据的质量。可以说,“AI就是数据的镜子”。
如果输入不准确的数据,就会返回不准确的结果(=垃圾进,垃圾出 / Garbage in, garbage out)。
如果输入带有偏差(偏见)的数据,AI就会做出带有偏差的判断。
基于不充分的数据,只能得到肤浅的见解或提示。
由此可见,AI本身并不“聪明”,它只是“忠实于数据”。基于这一前提,我们可以看清:应用AI的本质不在于“使用哪种工具”,而在于“如何整理出优质数据,并妥善加以利用”。
什么是“优质数据”?
那么,什么是“优质数据”呢?显然,仅仅是数据的“量”大,如果质量不行也是毫无用处的。但另一方面,所谓“质量”好,具体指的又是什么呢?
从一般的数据管理视角来看,“优质数据”至少应具备以下几个维度:
正确性(Accuracy):包含大量错误和噪音的数据,无论进行多么高级的分析,得出的结论都会被扭曲。因此,尽量减少传感器误差、输入错误和数据重复是至关重要的。
完整性(Completeness):所需字段是否缺失?缺失值是否过多?例如,如果一份客户数据中,年龄、地区、性别等信息出现大面积空白,就很难进行有效的分析。
一致性(Consistency):相同含义的数据是否存在不同格式混用的情况(例如:日期格式、单位、名称缩写不统一)?这在系统集成和处理长期数据时尤为重要。
最新性(Timeliness):数据再准确,如果过于陈旧,也可能对当前的决策毫无帮助。是需要实时数据,还是过去的历史数据就足够?这取决于具体的用途,但关键是要保证“符合目标的适当新鲜度”。
目的适切性(Relevance):如果包含了太多与分析目的无关的数据,就会变成噪音并导致误判。必须明确“为了什么目的使用数据”,并准备与之高度相关的数据。
可靠性(Reliability):数据的来源是哪里?是如何收集的?这些信息必须明确以确保可靠性,同时还要具备可复现性。来源不明的“黑盒”数据在后期是无法进行验证的。
总而言之,所谓的“优质数据”,指的是“准确无误、缺失少、含义和格式统一、时效性恰当、符合使用目的且来源可靠”的数据。
只有确保了作为“优质数据”的质量底线,AI才能产出有价值的结果。反过来说,如果在数据尚未整理好的状态下盲目引入AI,是绝对无法获得预期成果的。目前许多企业抱怨“引入了AI却没法用”、“AI的准确率提不上去”,其根源大多出在数据问题上。
数据并非“自然而然就能整理好”
这里非常关键的一点是:优质数据绝不是自然而然就能产生的。相反,如果置之不理,数据必然会发生劣化。
根据输入人员和时机的不同,输入规则变得五花八门。
存在多个含义相同但命名不同的数据。
从未被更新过的陈旧数据散落各处,无人问津。
各个部门的数据形成“孤岛(Silo)”,互不相通。
上述这些情况,在许多企业中应该都屡见不鲜吧。
以下展示了本公司在数据管理方面的整体架构。

【数据管理整体架构图】
宏观上,它主要由两大板块构成:一是涉及角色与体制、风险管理、评估的“数据治理”;二是包含数据应用生命周期管理与支持服务的“数据管理”。其中,在数据应用的生命周期管理方面,包含以下流程:
需求管理:明确目的和需求,即“为什么要使用这些数据?”、“这些数据能为谁带来什么价值?”。
收集:根据目标收集必要的数据。设计需要哪些内部/外部数据、以何种粒度和频率收集,以及如何确保其质量。
加工:提升数据质量,将其整理成可用的形态。包括数据清洗(纠正错误与填补缺失)、格式统一、数据合并与查重、针对结构化/非结构化数据的专项处理,以及赋予业务层面的具体含义等。
蓄积:确保数据处于“需要的人在需要时即可使用”的状态。包括存入数据库/数据湖、实施安全与访问控制、元数据管理(让人知道这是什么数据)等。
利活用(应用):这是最重要的一步。使用数据的目的不是为了“分析”,而是为了“促成行动”。通过数据可视化(仪表盘)、高级分析(统计处理、BI、AutoML、AI),以及嵌入业务流程(自动化、决策支持)等方式,从数据中创造出真正的业务价值。
废弃:妥善处理不再需要的数据。包括保管期限的管理、应对法律法规与合规审查、降低安全风险等。事实上,仅仅是“持有数据”本身就可能构成一种风险。因此,“不保留不需要的数据”这一理念同样重要。
数据管理绝不是一次性建好就结束的工作,而是一项需要持续维护和改进的长期工程。CIO必须将数据管理作为一种机制嵌入到组织中,并持之以恒地执行,直到它彻底扎根。
数据管理并非“只有IT部门才该负责的工作”
另一个核心要点是:数据管理绝不仅仅是IT部门单打独斗的工作。
数据基本上都是在一线业务的运转过程中产生的。因此:
数据的含义和定义到底由谁来拍板?
如何统一数据的输入规则?
如何从源头确保数据的质量? 这些问题,本质上都是业务层面的问题、事业发展的问题,更是企业经营层面的问题。
在日本经济产业省于2026年4月发布的最新版《数字技能标准 ver.2.0》中,针对数据管理领域,划定了以下三种关键角色:
数据管家(Data Steward):基于对业务领域的深厚了解,负责确保数据质量、可靠性与安全性相关的运营工作。同时,还要推动数据管理在业务部门和一线组织中的渗透与扎根,促进数据的有效利用。可以说是“数据质量的把关人与数据应用的推广者”。
数据工程师(Data Engineer):把握数据的现状,在数据收集、整合、加工、提供等各个流程中实施数据整理与预处理,并通过设计与搭建数据管道,来支撑整个组织的持续性数据利用。可以说是“让数据流动起来的落地与运维执行者”。
数据架构师(Data Architect):俯瞰整个组织和业务的数据结构、流向及应用方式。紧扣业务战略,设计着眼于数据全生命周期的整体架构,并进行持续优化,从而实现跨部门的数据利用与数据治理的完美平衡。可以说是“数据的全局总设计师”。
对于CIO而言,不能仅仅停留在搭建数据存储和分析的IT基础设施上。更迫切的任务是:在公司内部合理配置具备这三种角色的专业人才,搭建跨部门的全公司统一工具与规则,从而发挥将“企业经营、事业发展、日常业务与数据”紧密缝合的纽带作用。
数据应用的成败,最终取决于“组织风气(企业文化)”
然而,不管人才配置得多么齐备,基础设施、工具和规则搭建得多么完善,如果组织内部没有形成“基于数据来驱动经营和业务”的文化风气,数据依然无法被真正用起来。
一线员工根本不理解录入这些数据的意义是什么。
数据和指标仅仅为了应对本部门的考核而进行了局部优化。
基于客观数据做出的高质量决策,在公司内部得不到认可和奖励。
在这样的状态下,无论机制设计得多么精妙,最终都会流于形式。
反观那些数据应用开展得非常顺利的组织,以下行为往往是自然而然发生的:
所有讨论和会议,都以客观数据为前提。
先提出假设,然后用真实的数据去验证它。
全员都有意识地持续改善数据的质量。
也就是说,数据管理的终极本质,其实是为了营造一种“以利活用数据为前提的组织文化”。
这种文化的形成不可能一蹴而就。正因如此,最有效的方法是“从小处着手,积小胜为大胜”:
在某个特定的核心业务中先行整理数据,并通过引入AI取得立竿见影的成果。
将这个成功案例在公司内部横向推广。
逐步扩大数据治理和AI应用的目标领域。
通过不断运转这个正向循环,数据的重要性就会潜移默化地渗透到整个组织的血液中。
AI时代CIO应扮演的新角色
在AI时代,外界对CIO的角色期望已经发生了天翻地覆的改变。
在过去,CIO的核心职责主要是:
确保IT系统的稳定运行。
最大化地优化IT成本。
但从今往后,CIO需要承担更多直接关乎企业经营命脉的职责:
将数据视为企业的核心资产,并实现其价值的最大化。
为AI的应用铺好路:搭建数据基座、工具和规则,同时推进相关人才的配置与培养。
在全公司范围内,主导酿造“以数据为驱动”的组织文化。
换句话说,CIO必须完成自我进化,成为企业“数据价值创造的总负责人”。
结语:数据,才是竞争优势的真正源泉
在未来的时代,全面利活用AI将成为所有企业生存的基准线。在这场竞争中,拉开差距的关键已经不再是“你是否使用了AI”,而是“你手里到底掌握着什么样的数据”。
数据,是对企业过去各项经营优势的沉淀,更是创造未来商业价值的源泉。而数据的质量,则是由每天的日常业务和组织的运作方式所决定的。
AI,需要在优质数据的滋养下才能茁壮成长。
而企业,则将通过这些强大的AI实现飞跃式成长。
把这个最简单的原理作为一切的出发点,将数据管理彻底推向企业经营的核心位置。这难道不是在AI时代实现企业持续增长的最短路径吗?
而身为CIO,正是那个需要挺身而出、牵引着企业走完这条路径的关键领航人。
下期预告:彻底思考并实现“人与AI的协作究竟是什么?”——CIO应当设计的新型工作方式与企业变革
应用AI的本质不在于“替代”,而在于“协作”。
AI究竟擅长什么?人类又该担负起哪些核心职责?
要实现人机协作,对现有业务流程进行重新设计是必不可少的。
CIO悄悄话:老板天天催AI落地,业务天天骂AI太蠢?作为CIO我终于看透了真相……
最近,生成式AI可谓是火遍了大江南北。老板在外面听了几场峰会,回来就下了死命令:“现在不用AI,以后就没饭吃!赶紧在全公司推行!”
于是,我们IT部门加班加点,采购工具、部署模型、开放接口。可是没过几天,业务部门的吐槽就如潮水般涌来:“这AI怎么总是胡说八道?”“预测的结果根本不准啊!”“这简直是人工智障,还不如我自己用Excel算得快!”
面对这些指责,很多同行可能会抱怨现在的AI大模型还不够成熟。但作为CIO,在仔细排查了系统后,我终于看透了背后的真相——这根本不是AI的锅,而是我们自己数据的锅!
【痛点直击:你喂给AI的是垃圾,它凭什么给你吐出黄金?】
很多企业在搞AI的时候都有一个误区,以为买个最贵的模型、上个最酷的工具,就能立刻产生价值。但事实是,AI并不是魔法棒,它只是一面“数据的镜子”。
回想一下我们公司内部的数据现状吧:各部门各自为政,数据形成了无数个“孤岛”;同一种数据有三种不同的命名规则;客户信息缺斤少两,好几年都没人更新…… 如果我们把这些充满噪音、偏差和错漏的“垃圾数据”喂给AI,AI怎么可能得出准确的结论?“Garbage in, garbage out(垃圾进,垃圾出)”,这就是我们在AI落地时遭遇的最大拦路虎。不解决数据源头的问题,任何高大上的AI项目最后都会沦为形式主义的摆设。
【方案落地:跳出技术自嗨,重塑数据生命周期】
长远来看,市面上的AI模型能力最终会趋于同质化。大家都用差不多的模型时,真正的护城河是什么?是你自家独有的、高质量的“企业数据”。为了让AI能够吸收“优质的养分”茁壮成长,我们必须转变思维,把数据管理当成一把手工程来抓。
第一,明确数据管理不仅是IT部门的事,更是业务的事。数据是在业务中产生的,它的含义和质量必须由业务来把控。我们需要在组织内建立起“铁三角”:
数据管家(Data Steward):懂业务,负责盯紧数据质量,推动部门内的数据应用。
数据工程师(Data Engineer):懂技术,负责清洗、整合数据,搭建数据流通的管道。
数据架构师(Data Architect):懂全局,根据公司战略设计整体的数据架构和生命周期。
第二,打通数据管理的完整闭环。不要再任由数据在系统里发霉了!从明确“为什么用这些数据”的需求管理开始,到按需收集、清洗加工(去重补缺)、安全蓄积,再到最终融入业务流程创造价值,甚至包括过期废弃。每一个环节都要有规可循。 我的建议是:不要想着一口吃成胖子。找一个最痛的业务场景切入,先把这一块的数据洗干净,让AI跑出让人惊艳的成果,然后再把这个成功经验横向复制到其他部门。
【终极价值:让数据重塑组织文化,完成CIO的华丽进化】
当我们真正把数据管理做扎实了,带来的改变是颠覆性的。
你会发现,跨部门开会不再是“我觉得”、“凭经验”,而是“用数据说话”、“提假设,用数据验证”。当“以数据为前提”的组织文化生根发芽时,AI才能真正从一个“尝鲜的玩具”,变成企业生产力爆发的“核武器”。
而在这一场变革中,我们CIO/CDO的角色也迎来了终极进化。过去,我们只是负责“系统稳定、控制成本”的后勤大管家;但现在,我们正式成为了企业“数据价值创造的总负责人”。
记住,在AI时代,能拉开企业差距的,永远是你手里捏着的好数据。把土壤培植好,AI自然会开出最惊艳的花。各位IT同仁们,别再盯着模型看了,赶紧回去梳理你们的数据吧!