你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
CIO们应高度警惕的六大数据风险
作者:CIOCDO 来源:CIO.com 发布时间:2025年07月10日 点击数:

从数据分类错误到在缺乏充分质量保证的情况下使用人工智能,那些希望充分利用数据驱动决策的IT领导者有诸多担忧。

图源:Rob Schultz / Shutterstock

CIO们面临着提供预测分析以及利用人工智能代理对员工队伍进行转型的压力。然而,数据治理、数据运营和数据安全方面的投资——这些一直都很重要——却常常让位于业务驱动的举措,导致如今人工智能的成功仍悬而未决。

为了弥合这一差距,并确保数据供应链得到足够的高层关注,CIO们聘请或与首席数据官展开合作,委托他们处理数据债务、实现数据管道自动化,并转变为一种主动的数据治理模式,重点关注健康指标、数据质量和数据模型的互操作性。

但CIO们在过多地委托数据治理职责或只是旁观数据运营改进时必须谨慎。那些正在重新思考其数字转型战略,并希望从人工智能投资中实现商业价值的首席信息官们,需要更多地关注那些可能破坏这些目标的数据风险。一种可行的办法是向IT主管询问有关数据管理实践的问题,以此来判断哪些方面需要更多的领导关注。

笔者之前曾撰文探讨过CIO们应高度警惕的IT风险以及错过的生成式人工智能机会。以下是CIO们应该审视的六大数据风险,并确保他们的团队制定了补救策略,理想情况下将这些风险转化为战略机遇。

一、错误分类的数据和不参与的数据所有者

随便问一位数据治理负责人,他们在提高数据质量和遵守法规方面面临的最大难题是什么。排在前列的问题中必然会有确定数据所有者,并让他们参与制定和遵守数据政策。如果数据所有者不积极参与,数据可能得不到分类就被用于人工智能,这可能会违反数据隐私规则和其他法规。

在人工智能时代,未分类的数据还带来了第二个挑战:数据科学家是应该在不符合要求的情况下将这些未分类的数据集用于人工智能模型,还是数据治理部门应该禁止任何人使用这些数据?

Netwoven的首席执行官Niraj Tenany(尼拉杰·特南尼)表示:“企业必须对其内容进行分类,以便安全基础设施的各个组件能够采取适当措施。手动分类费力,自动分类又存在大量误判,因此找到恰当的平衡对成功至关重要。”

参与数据治理举措的CIO往往更能有效地说服部门主管指定数据所有者。如今对公民数据科学能力的需求巨大,而且领导者们渴望获得人工智能带来的商业优势,因此他们不会拒绝承担责任。此外,一旦这些数据所有者参与进来,就有更多机会让他们参与人工智能治理,并合作试点人工智能智能体。

二、人工智能暴露的知识产权问题

许多CIO担心员工使用未经批准的公共LLMs(大语言模型)和试用其他生成式人工智能工具时出现的影子人工智能问题。CIO们应该高度警惕因使用人工智能工具而导致的数据分类错误和知识产权泄露风险。

一个担忧是员工在人工智能提示中使用数据、代码、品牌指南、合同以及敏感文件的部分内容。另一个担忧是数据科学家在未经必要批准和保护措施的情况下,将知识产权纳入人工智能模型,包括用于大语言模型的RAG(检索增强生成)以及人工智能智能体的数据。

Rimini Street全球首席信息官Joe Locandro(乔·洛坎德罗)表示:“数据是公司最有价值的资产之一,必须加以保护。CIO们应该警惕员工对数据的不当处理、人工智能工具的滥用以及不良的网络安全习惯。优先开展员工教育、在核心系统中实施数据掩码处理,以及定期进行数据安全审计,这些都是保护敏感信息的关键步骤。”

The Modern Data Company的首席执行官Srujan Akula(斯鲁詹·阿库拉)补充道:“营销团队在不告知任何人的情况下使用ChatGPT,数据科学家利用他们能获取的任何信息构建模型,突然间敏感的客户数据可能就被输入到了公共人工智能工具中。这给CIO们带来了风险,包括数据泄露和合规问题,而这些问题可以通过明确、实用的政策和安全的内部替代方案来解决。”

为了降低风险,Akula(阿库拉)建议CIO们从经过精心整理、可靠的数据集创建数据产品,并明确其所有权和治理规则。

CIO还可以通过发起数据素养项目和促进开放式创新(任何员工都能提交想法),将这种风险转化为优势。这些项目相结合,既鼓励了学习和解决问题,又能让组织更多地了解一线员工的创新举措。

三、第三方数据源

预计2025年美国企业在营销数据方面的支出将达到261亿美元。这些数据通常用于客户细分、个性化营销活动以及优化归因分析。

尽管要确保内部数据管理符合监管要求和数据治理政策并非易事,但追踪第三方数据来源的合规性同样具有挑战性。

SOAX产品负责人Luis Lacambra(路易斯·拉坎布拉)表示:“最容易被忽视的风险之一,就是在未核实数据来源方式的情况下,依赖第三方数据渠道或数据增强服务。如果这些数据是通过不可靠或不合规的方法从公共来源抓取或汇总而来,那么你的组织可能会面临监管审查,或出现运营盲点。”

审查第三方数据合规性应该是由首席数据官负责、明确传达且不容商量的数据治理事项。

CIO可以采用另一种方法来应对第三方数据风险。公司采购并整合了许多数据来源,但有些未被使用,有些与其他数据来源提供重复信息,或者只能带来微不足道的商业价值。希望削减成本的CIO们应该对第三方数据来源进行成本效益审计,评估其利用率,并量化风险。这样就有机会通过剔除低价值、高风险的数据来源来降低成本。

四、数据管道可观测性差

大多数组织在投资强大的数据集成和数据渠道之前,会先投资终端用户分析工具,如数据分析平台和文档处理工具。由于各部门在决策时越来越依赖实时数据,数据渠道的可靠性和性能可能会成为运营上的噩梦,尤其是当数据管理员必须经常处理数据问题,或者滞后的数据导致错误决策时。

RecordPoint首席技术官Josh Mason(乔希·梅森)表示:“CIO们必须时刻敏锐地意识到那些威胁组织完整性、安全性和决策有效性的数据相关风险。其中一个关键领域是对数据管道和使用模式的可见性有限,可观测性不足可能会掩盖诸如延迟、数据漂移、管道故障以及敏感数据的存在和位置等潜在问题。”

数据运营中的可观测性包括监控数据管道、自动响应以及跟踪性能。数据运营指标包括管道可靠性、自动化率、异常率和处理吞吐量。

对于整合了众多数据来源并使用数据架构实现集中访问的CIO们来说,减少数据运营事件可以节省成本。但更重要的是,不可靠的数据集成会削弱信任,这可能会使部门领导减缓对更多人工智能和数据驱动实践的投资步伐。

五、数据质量差距

长期以来,CIO们一直在努力提高数据质量,他们指定数据管理员、实现数据清理流程自动化,并衡量数据健康状况。但这些工作大多集中在ERP(企业资源规划)系统、CRM(客户关系管理)系统和数据仓库中的结构化数据来源上。随着RAG(检索增强生成)技术和人工智能智能体利用非结构化数据来源和文档库来训练模型并提供上下文相关的响应,人工智能扩大了这项工作的范围。

Pryon首席执行官Chris Mahl(克里斯·马尔)表示:“检索增强生成技术使企业能够获取组织内的知识,但它并非没有风险,包括数据隐私漏洞、幻觉现象以及集成挑战。在推广之前,实施过程需要在数据质量方面进行投资、建立治理框架并创建评估系统。真正从检索增强生成技术中获得价值的公司,不仅仅是能够更快地获取信息,还能通过在创新和保障措施之间找到恰当的平衡,做出更好的决策。”

为了弥补数据质量差距,CIO们应该考虑将原始数据集中存储在数据湖中,将数据清理作为一项共享服务提供,并通过数据架构和客户数据平台实现数据访问。由于有许多数据质量和管理工具,开发一项专注于数据质量的共享服务,是满足企业对干净的人工智能数据来源的更大需求以及扩大非结构化数据来源清理范围的有效方法。

六、未经严格质量保证就过度依赖人工智能输出

定义人工智能治理的七个问题包括商业价值、工具选择、合规性和数据治理等方面。但其中最重要的一个也是今天的挑战:员工应该如何验证和质疑大语言模型的回答或人工智能智能体的建议?

对于希望开发人工智能代理的CIO来说,这个问题更为重要,因为测试大语言模型的质量保证实践仍在发展中,而且通常依赖手动测试。

Pendo首席产品官Trisha Price(特里莎·普赖斯)表示:“CIO必须持续监控人工智能生成输出的准确性和可靠性。由于人工智能系统不是确定性的,定义质量变得更加复杂,工程、质量保证和产品之间的界限开始变得模糊。这种转变要求各团队之间更紧密地合作,以确保人工智能驱动的体验值得信赖、符合用户需求,并能够推动实现真正的业务成果。”

从历史上看,CIO们一直难以证明质量保证投资的合理性,因为向企业推销增加开发人员或增强运营和安全弹性更容易。但随着越来越多的软件开发人员使用人工智能代码生成器,并且IT运营变得更加自动化,CIO们可能会发现更有必要、也有更多预算机会投资于质量保证和人工智能测试能力。

对于CIO们来说,对风险保持一定程度的警惕是有益且重要的,尤其是在知识产权和新兴人工智能能力方面。最优秀的CIO所做的不仅仅是制定缓解计划,还会寻求将风险转化为战略机遇的方法。

作者:Isaac Sacolick(艾萨克·萨科利克)

Isaac Sacolick(艾萨克·萨科利克),数字化转型学习公司StarCIO的总裁,指导领导者采用所需的实践,以领导其组织的转型变革。他是《Digital Trailblazer(数字开拓者)》和亚马逊畅销书《Driving Digital(驱动数字)》的作者,讲述了敏捷规划、开发、数据科学、产品管理和其他数字化转型最佳实践。Sacolik是公认的顶级社交首席信息官,也是数字转型的影响者,在InfoWorld、CIO.com、他的博客social、Agile和transformation以及其他网站上发表了900多篇文章。本文中表达的观点是Isaac Sacolick(艾萨克·萨科利克)的观点,不一定代表IDG通信公司,其母公司,子公司或附属的公司的观点。

译者:宝蓝

睿观:

随着企业加速拥抱AI以驱动业务转型,数据风险正成为决定其成败的关键。CIO们必须高度警惕六大潜在“雷区”:错误分类的数据与缺位的数据所有者、AI暴露的知识产权风险、合规性存疑的第三方数据源、数据管道的可观测性差、结构化与非结构化数据的质量差距,以及在缺乏严格质量保证下对AI输出的过度依赖。这些风险不仅会破坏AI项目的根基,导致财务与声誉损失,更会削弱组织对数据驱动决策的信任。因此,CIO不能再将数据治理视为二线任务,而应主动介入,将风险管理融入战略核心,通过建立清晰的所有权、强化数据素价值、提升可观测性、并投资于QA能力,将潜在的数据风险转化为巩固竞争优势的战略机遇。

金句:

在AI的淘金热中,数据是矿脉,但也可能暗藏陷阱;卓越的CIO不仅是挖掘者,更是精明的风险勘探者,能将最危险的矿坑,转化为最宝贵的资产。