当前CIO(首席信息官)们在AI浪潮下的核心焦虑:AI需要海量数据,但我们根本不知道未来需要什么数据。
文章的核心观点是:不要(为AI)盲目囤积数据。CIO必须放弃“多多益善”的仓鼠症,转而从“业务战略”出发,自顶向下地确定“什么数据才重要”。
AI的未来不是拼“数据量”,而是拼“数据质量”和“数据相关性”。
你的公司,是否患上了“AI数据仓鼠症”?

——别再盲目囤积数据了!CIO必须从“业务战略”反推“AI燃料”
各位CIO和CDO:
AI需要海量的“数据”作为燃料。这导致了一种普遍的焦虑:我们担心错过了什么,于是开始疯狂地收集、存储一切数据,生怕在未来的AI竞赛中落后。
我们患上了一种“AI数据仓鼠症”。
但技术专家Boomi的CEO Steve Lucas一针见血地指出:
“数据已经够多了,事实上,是太多了。……一个成功的方法是去确定‘什么数据才重要’。”
核心观点是:建立可靠的AI信息流,远非易事。尤其在创新的快速步伐下,我们几乎不可能识别出哪些数据对“长期需求”至关重要。
那么,CIO该怎么办?答案是:停止“自下而上”地囤积数据,必须“自顶向下”地从业务战略出发,去定义什么数据才是有价值的。
数据项目的失败,往往源于“IT的欲望”。
EDF Power Solutions的数据治理顾问Kenny Scott指出,即便在今天,太多的数据项目仍然是由IT专业人员的愿望主导的。
“我早在90年代的银行业就见过‘尾巴摇狗’(指IT主导业务),现在你仍然能看到这种方法,”他说。“人们会(凭空)提出一个需求,然后买个工具来实现它,但根本没有考虑数据的映射、供给和所有权。”
【破局之道:先看“高管层(C-Suite)”的业务计划】“看看你最高管理层的商业计划,”Scott建议,“业务需要去到哪里?然后,数据如何赋能那段旅程?”
数字领导者必须从“业务战略”开始。
ScottsMiracle-Gro的副总裁Fausto Fleites用一个生动的比喻说明了这一点。他们的业务战略是成为“草坪园艺领域每个消费者的‘侍酒师’”。
“如果我想用AI实现这个目标,我需要什么数据?”他自问自答,“我需要大量关于故障排除、消费者常见问题和产品推荐的、格式正确的内容。……成功只是关于以正确的方式去构建数据。”
【睿信咨询顾问启示】先有“愿景”,再有“数据”。从你希望如何改变运营或与客户互动的愿景出发,这自然会驱动你需要收集的数据类型。
面对AI的未来,CIO们最大的困惑是:“我怎么知道我现在收集的数据,在未来是对的?”
SEGRO的CIO Richard Corbridge(其公司有120年历史)坦言:“想象一下我们数十亿资产的数据量,这太难了。”
【破局之道:不要只看“增量”,先看“存量”】PageGroup的CIO Dominic Redmond认为,CIO们不应纠结于“未来可能有什么价值”而去艰难地收集新信息。
“(更重要的问题)可能是你如何处理你‘已有’的数据,因为你已经拥有了所有数据,无论结构化还是非结构化,”他说。“专注于你现有数据中,那些在未来能创造价值和收益的领域。”
【睿信咨询顾问启示】别被“未来”绑架。回去挖掘你已经拥有的“巨大数据量”,弄清楚如何把这些信息放在正确的位置,以便它们能以正确的方式被AI项目使用 。
“数据仓鼠症”的另一个误区是“多多益善”。
RAC的数据和洞察主管Ian Ruffle对此持反对意见:
“一个扔进去60个变量的数据科学模型,并不会说每个洞察都有用。它会说,只有四五个变量真正起作用。”
【破局之道:专注“关键变量”,并做到极致】“不要关注数据收集的‘数量’,而要关注‘质量’和‘真正重要’的是什么,并把这些事情做到极致。”
【睿信咨询顾问启示】数据科学的法则同样适用于数据收集。与其盲目地收集60个可能无用的变量,不如集中资源,把那4到5个真正驱动业务的变量做到“ brilliantly”(出色地)。
我们这十年来目睹的技术创新只会加速。CIO不可能确切知道5年或10年后什么数据最有价值。
【破局之道:让“业务”成为你的“数据向导”】唯一的选择,就是被那些真正理解业务职能细节的高级管理人员所指导。
案例1:客户满意度Joseph Joseph的供应链官Sacha Vaughan表示,他们优先挖掘的是“任何与客户满意度评级相关的互动点”。他们不仅要看“多少人高兴”,更要知道“他们高兴的‘具体含义’”,这才能带来洞察 。
案例2:与董事会绑定涂料制造商Jotun的数据主管Gro Kamfjord总结道,成功的关键是与董事会建立紧密联系,并让“做决策的人”对“结果”和“成本”负责 。
【睿信咨询我顾问启示】匹兹堡市首席数据官Chris Belasco给出了最终建议:“在领导你的数据工作时,要始终牢记你的(业务)结果。这样你就会前瞻性地思考,为了五年后的目标,你今天需要收集什么信息。”
原文:首席信息官:立即收集正确的数据,用于未来的 AI 服务
创新的快速步伐使得识别对长期需求至关重要的数据变得困难。首席信息官必须专注于业务战略并收集有助于董事会实现预期结果的信息。

图源:Ground Picture / Shutterstock
人工智能(AI)需要海量的数据“投喂”。无论是结构化信息还是非结构化信息,首席信息官(CIO)都必须创建技术基础,以确保其组织拥有其AI赋能的服务所需的数据。
根据Gartner的年度预测,到今年年底,全球IT支出预计将达到5.61万亿美元,比2024年增长9.8%,并补充说,今年对数据中心系统、设备和应用程序的投资也将实现两位数的增长,这主要归功于为响应生成式AI项目的业务需求而进行的升级。
然而,尽管公司投资于工具包以利用AI,但建立一个可靠且受信任的信息流远非易事,特别是考虑到严格的治理要求和灵活的客户需求。再加上业务转型的快速步伐,收集面向未来的信息变成了一个更加严峻的前景。
麦肯锡在其《2025年技术趋势展望》报告中指出,技术格局将继续经历由创新引发的重大转变。该咨询公司表示,成功将取决于高管们能否识别出其业务可以使用AI的高影响力领域,同时解决监管变化和生态系统准备情况等外部因素。
作为企业技术的守护者,CIO们将被期望接受这一挑战,但该怎么做呢?对于技术专家Boomi的首席执行官Steve Lucas来说,数字领导者必须首先认识到,现代企业中持有的大量数据,仅仅是未来发展的起点。
“数据有很多,”他说。“事实上,是太多了。我们担心收集、存储和访问数据。我认为一个成功的方法是去确定‘什么数据才重要’。作为一名CIO,你是否了解哪些数据在今天很重要,哪些新兴技术在明天很重要?”
我们与数字领导者的对话表明,那些能牢牢掌握其数据的组织都采取了一种结构化的方法。他们专注于业务战略,并仔细思考业务所需的信息。然后,他们在解决长期目标之前,会先完善组织为其当前计划所收集的数据。
将数据与业务战略联系起来
能源专家EDF Power Solutions的数据治理顾问Kenny Scott表示,在收集正确信息时,至关重要的是与那些运营业务的人打交道。数字领导者必须确保他们的数据项目与业务战略相连接,并由业务战略所驱动。
“看看你C级别高管的业务计划,”他说。“业务需要达到什么位置?然后,数据如何为那段旅程赋能?你的董事会将解决人员和预算问题。但是,你需要做什么来帮助他们实现其战略目标呢?”
在EDF,Scott帮助创建了一个数据基础设施,他称之为“引擎室”,其中包括以Informatica为基础,以Snowflake为核心,以Power BI为“驾驶舱”,用户通过它将信息转化为洞察。随着数据被筛选和分类,运行数据驱动的项目以解决战略性业务挑战变得更加容易。
Scott表示,这种“问题优先”的数据处理方法是对过去的一次重大突破。他提到自己职业生涯早期在金融服务业的经历,那时人们会先购买技术,然后再寻找一个问题来解决。然而,即使在今天,当数据的价值已在整个组织中得到认可时,仍有太多的数据项目是由IT专业人员的欲望所主导的。
“早在1990年代,我就在银行业看到过‘尾巴摇狗’(the tail wagging the dog,指本末倒置)的情况,即IT告诉业务部门他们需要做什么,但你现在仍然能看到这种方法,”他说。“人们会提出一个需求。他们会买一个能实现它的工具,但根本没有考虑数据的映射、供给(provision)和所有权。相反,数字领导者应该从业务战略开始。”
这种方法与ScottsMiracle-Gro的数据智能副总裁Fausto Fleites产生了共鸣,他说他的公司有一个清晰的业务战略,即成为“草坪园艺领域每个消费者的‘侍酒师’(sommelier)”。 怀着这个宽泛的目标,Fleites和他的团队接着会就所需的信息提出具体问题。
“如果我想用AI来实现那个目标,我需要什么数据?”他说。“我需要大量格式正确的、关于故障排除的内容,消费者可能提出的问题,以及产品推荐。这种战略焦点为我们需要什么数据提供了简单的指引。我们拥有大部分信息,而成功仅仅在于以正确的方式构建数据。”
Fleites表示,这种量身定制的方法的精细细节因行业和业务而异。然而,首要的原则是相同的:“从你希望如何参与或改变你的运营的愿景开始,”他说,“而这应该驱动你所收集的数据类型。”
利用你的现有资产
心中有了清晰的业务战略感之后,数字领导者应该转向那些能帮助组织实现其目标的信息。然而,房地产专家SEGRO的首席信息官Richard Corbridge认识到,现在为未来的项目收集正确的数据远非易事。
“你怎么知道你收集的东西是正确的,尤其是在房地产行业?”他说。“我们已经有120年的历史了,所以想象一下数十亿资产所拥有的数据量。”
虽然要“见木不见林”(find the wood for the trees,意指抓不住重点)可能很难,但Corbridge建议CIO们应该在企业内部寻找已建立的数据根源。“关键是回到你已经拥有的大量数据,并弄清楚你如何将这些信息放在正确的位置,以便它能以正确的方式被用于你的AI项目,”他说。
专注于精细的细节,是英国故障救援专家RAC的数据与洞察主管Ian Ruffle所赞同的一种方法。他认为,复杂的组织太容易整理那些很少被使用的数据了。与其对信息收集采取一种“自由放任”(liberal)的态度,不如专注于那些对你的业务‘现在’重要的事情。
“一个数据科学模型,你向其中投入60个变量,它并不会说每一个洞察都有用,”他说。“它会说,是四五个变量在起作用。我认为同样的原则也适用于数据收集。不要关注数据收集的‘数量’,而应关注‘质量’和‘真正重要’的是什么,并把这些事情做到极致(do those things brilliantly)。”
最终,招聘公司PageGroup的首席信息官Dominic Redmond建议,数字领导者必须利用他们现有的数据资产。CIO们不应该挣扎于收集那些“未来可能有价值”的信息,而应该专注于从现有的数据集中筛选出有价值的“金块”(nuggets)。
“这(如何利用存量数据)可能是比‘你正在收集什么数据’更重要的问题,因为你已经拥有了你所有的数据,无论它是结构化的还是非结构化的,”他说。“专注于你未来需要利用的那些数据领域,以创造价值和收益。”
专注于长期结果
匹兹堡市首席数据官Chris Belasco表示,市政组织在约束其数据工作方面有着悠久的历史,以确保成本得到控制和数据被安全保存。企业数字领导者也应致力于创建一种类似的、重点突出的方法。
“试着对期望的结果进行深思熟虑,并确保你正打算实现那些你想要实现的事情,”他说。“如果你在领导你的数据工作时,心中牢记着你的(业务)结果,那么你就会为五年后的(目标),前瞻性地思考你今天需要收集什么信息。”
我们在这十年中见证的技术创新的快速步伐只会加速。CIO们无法确切地知道5年或10年后哪些数据将最有价值,因此唯一的选择是由那些了解业务职能更精细细节的高级管理人员来指导。
家居用品制造商Joseph Joseph的首席供应链官Sacha Vaughan表示,她的公司利用其基于SAP的数据基础来帮助浮现重要的见解。虽然她有兴趣探索AI对业务的潜力,但当前的优先事项是识别那些指向新趋势的数据点。
“我们有兴趣挖掘任何与客户满意度评级相关的互动点,”她说。“我们希望以一种方式对这些数据进行排序,使它不仅仅是关于‘有多少人高兴’的数字,而是让我们知道他们‘具体的意思’,这为我们提供了关于我们未来如何能以不同方式出现并让他们与品牌互动的洞 察。”
涂料制造商Jotun(佐敦)的数据主管Gro Kamfjord不可避免地表示,成功收集数据的关键是与董事会建立紧密的联系。重申一下,将数据计划与业务战略相链接的数字领导者,将比那些在当下被孤立用例所束缚的人,更有可能实现长期成果。
“数据不是一种副产品,也不是你捎带手做的事情,它是你企业正在做的事情的核心,”她说。“所以,要让高级管理人员专注于这种关系,并让那些做决策的人为结果和成本负责。”