你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
别再迷信“云优先”!思科和宝洁的CIO正在发起一场“反向革命”
作者:CI0.com&睿观 来源:CIOCDO 发布时间:2025年12月12日 点击数:

——深度解析:从“全部上云”到“云智能”,企业如何用AI重塑基础设施?

各位CIO和技术领袖:

过去十年,“云优先”(Cloud-First)几乎是IT界的政治正确。

普遍观点认为:上云 = 敏捷 + 扩展性 + 成本效益。 但现实却给了我们一记重拳。

VMware的最新调查显示,企业31%的CIO浪费了一半的云支出,2025年预计有445亿美元被浪费在未充分利用的资源上。

面对不断攀升的开支和AI带来的新挑战,一场静悄悄的革命正在发生。Hylaine技术副总裁Ryan McElroy断言:“向云端的全面冲刺已经结束。

顶级企业如思科(Cisco)和宝洁(P&G),正在从“云优先”转向“云智能”(Cloud-Smart)。

今天,我将为你深度拆解这场变革背后的逻辑,以及CIO如何重新定义“云”的价值。


一、🛑 为什么要“反思”云优先?


原因一:成本失控

“租用装满昂贵英伟达GPU的服务器整整三年,财务上将比直接购买这些显卡更为经济上损失惨重,”McElroy直言。在AI时代,云端的高昂推理成本和数据流出费用(Egress Fees),正在吞噬企业的利润。

原因二:AI带来的“数据重力”

AI不仅仅是算力,更是数据。思科的首席工程师Nik Kale指出,训练和微调大型模型需要对客户数据有强有力的控制。 “云智能不仅仅是为了回归(Repatriation)——而是让AI的‘数据重力’与正确的控制平面对齐。”


二、🧠 “云智能”实战:思科的三层架构


思科并没有完全抛弃公有云,而是变得更加“精明”。他们根据AI工作负载的特性,重新划分了领地:

  • 私有云(Private Cloud)训练、微调、客户敏感数据。 思科将模型训练和反馈循环迁移到区域私有云,获得了完整的审计能力,并显著降低了数据传输成本

  • 边缘计算(Edge/On-Prem)实时推理、特征提取。 在处理14万个客户环境的拍字节级数据时,思科将特征提取和异常检测转移到客户本地采集器,只向云端发送高级别风险信号。结果:大幅降低了逃逸率,同时提升了模型真实度

  • 公有云(Public Cloud)编排、无状态服务。 编排层和非敏感服务留在公有云,利用其弹性实现规模化。

【成效】这种混合架构不仅改善了合规态势,还实现了两位数的云支出减少


三、📉 FinOps进化:用“小模型”省大钱


World Insurance Associates的CIO Michael Corrigan展示了另一种“云智能”策略:用AI来管理AI成本

他们设计了一套智能路由系统:

  1. 简单查询➜ 小语言模型(SLM:消耗处理能力少,成本低。

  2. 复杂流程➜ 大语言模型(LLM:只有当SLM搞不定时,才升级到昂贵的LLM。

“我们只使用基于复杂流程的真正需要消耗的部分,”Corrigan说。


结语:云是一个“活的框架”


宝洁CTO Paola Lucetti将云战略形容为“一个活的框架”(a living framework)。

从“云优先”到“云智能”,本质上是从“为了上云而上云”回归到“为了业务价值而选择基础设施”。

对于CIO而言,这不仅是技术的抉择,更是财务和战略的成熟。正如McElroy所说:“任何盲目迁移到云端的人,现在都很难回头。但那些拥有新思维的CIO,正在重新掌握主动权。”


全文:CIO们从“云优先”转向“云智能”


面对不断攀升的开支,IT 领导者正在重新思考云计算方法,使其更具成本效益和效率,并更符合业务价值的战略性。

图源:Rob Schultz / Shutterstock

长期以来,普遍观点认为“云优先”(cloud-first)的做法将为首席信息官CIO)带来敏捷性、可扩展性和成本效益等应用和工作负载的优势。虽然云仍然是大多数IT领导者首选的基础设施平台,但许多人正在重新思考云战略,从“云优先”转向“云智能”(cloud-smart),即选择针对特定工作负载的最佳方案,而非仅仅将所有工作搬到外部,并将云置于其他考虑之上。

云成本优化是促使这一重新思考的一个因素,组织在快速增长的背景下难以控制不断攀升的云费用。根据VMware最近的一项调查,估计企业云基础设施支出中有21%(相当于2025年的445亿美元)被浪费在未充分利用的资源上——其中31%的CIO浪费了一半的云支出

技术咨询公司Hylaine的技术副总裁Ryan McElroy表示,向云端的全面冲刺已经结束。云智能组织拥有一套明确且经过验证的流程,用于确定哪些工作负载最适合云端。

例如,McElroy说,“必须快速交付并支持未来大规模的项目应该在云端构建。那些依赖遗留技术、必须托管在虚拟机上或工作负载高度可预测且可持续多年的解决方案,应部署到管理良好的数据中心。”

McElroy表示,云智能趋势受到了更好的本地技术、更长的硬件周期、与超大规模云服务提供商(hyperscalers)的超高利润率以及行业典型的炒作周期的影响。所有这些都支持混合基础设施方案。

然而,他补充道:“人工智能(AI)又带来了一个重大问题——数据和计算的孤立。许多组织对构建高性能GPU数据中心不感兴趣或无法实现,需要使用云端。但如果他们保守或成本规避,数据可能就在混合基础设施的本地组件中。”

McElroy表示,这些变量导致了复杂性或意想不到的成本,无论是迁移费用还是数据传出费用(data egress charges)。

他估计,“只有10%的行业成员公开承认他们正在向云智能迈进。”虽然这个数字看起来偏低,但McElroy表示其意义重大。

“要调节云端姿态有很多前提条件,”他解释道。“首先,你通常必须是新任CIO或CTO。任何(曾经)迁移到云端的人都很难回头。”

此外,组织还需要留住并提升管理其拥有数据中心或托管设施的人才。McElroy表示,他们还必须有超出云端在原始敏捷性和分时计算方面带来好处的基础设施需求。

一、选择与重新评估合适的超大规模运营商

宝洁公司(Procter & Gamble)的CTO兼高级副总裁Paola Lucetti表示,公司在大约八年前开始迁移工作负载时,采用了云优先战略。Lucetti说,当时的规定是所有新应用都部署在公有云,现有工作负载将从传统托管环境迁移到超大规模服务商。

“这种方法使我们能够快速实现现代化,减少对遗留基础设施的依赖,并利用云平台所提供的可扩展性和韧性,”她说。

如今,几乎所有P&G的工作负载都运行在云端上。Lucetti说:“我们选择将部分工作负载放在公有云之外,是因为我们会定期重新评估延迟或性能需求。这一基础在数字化转型的关键阶段为我们带来了速度和灵活性。”

随着公司的云生态系统日益成熟,其业务优先事项也在不断调整。“成本优化、可持续性和敏捷性成为了核心,”她说。“P&G的云智能意味着选择并定期重新评估适合特定工作负载的超大规模服务商,嵌入FinOps(金融运营)实践以实现透明度和治理,并利用混合架构支持特定用例。”

Lucetti表示,这种方法通过自动化、AI和代理(agentic)技术赋能开发者,能够更快地创造价值。“这种方法不仅仅是技术层面——更是文化层面。它体现了战略灵活性的思维方式,技术决策与业务成果相契合。”

二、人工智能正在重塑云决策

McElroy表示,人工智能代表着巨大的潜在支出需求,并提高了基础设施战略的赌注。

他说:“租用装满昂贵英伟达GPU的服务器整天运行三年,财务上将比直接购买这些显卡更为经济上损失惨重,但能够无缝使用明年型号的灵活性可能带来战略优势。”

以思科(Cisco)为例,首席工程师兼产品架构师Nik Kale表示,他们对公有云真正属于什么变得更加深思熟虑。成本是一个因素,但主要驱动力是人工智能数据治理

云智能不仅仅是为了回归(repatriation)——而是让AI的‘数据重力’与正确的控制平面对齐,”他说。

IT部门已经区分出哪些应该放在私有云,哪些要进入公有云。Kale解释道:“训练和微调大型模型需要对客户和遥测数据的强有力控制。因此,我们越来越倾向于混合架构,其中推理和数据处理在安全、私密的环境中进行,而编排和非敏感服务则留在公有云中。”

思科的云智能战略始于数据分类和工作负载分析。他说,任何具有客户可识别信息、诊断痕迹和模型反馈循环的内容,都将在区域合规的私有云中处理。

此外,还有“无状态服务、内容分发和遥测聚合,这些都受益于公有云弹性以实现规模和效率,”Kale说。

他说,思科的方法还包括“将原本云端部署的功能打包到客户环境中安全部署——在本地提供相同的AI驱动洞察和自动化,同时不将数据暴露给共享基础设施。这为客户提供了在不牺牲数据驻留权、隐私或成本的情况下,灵活采用AI能力。”

Kale表示,这些做法改善了思科的合规态势,降低了推断延迟,并实现了可衡量的两位数云支出减少

人工智能在大规模威胁检测领域,已经从根本上改变了其云计算方法。“我们模型的早期版本完全运行在公有云上,但一旦我们开始针对客户特定的遥测进行微调,数据的敏感性和体量使得云端传出(egress)既昂贵又难以治理,”他说。“将培训和反馈循环迁移到区域私有云,使我们获得了完整的审计能力,显著降低了传输成本,同时保持推理混合,使受监管地区的客户能够获得亚秒级的响应时间。”

IT部门也在其生成式AI支持助手中遇到了类似问题。Kale说:“最初,病例记录和诊断日志是在公有云LLM中处理的。随着金融和医疗领域的客户对数据流出其环境提出合理担忧,我们重新设计了架构,使其能够直接在其[虚拟专用云]或本地集群中运行。”

Kale补充说,编排层仍存在于公有云,但敏感数据从未离开其控制平面。

人工智能还重塑了思科客户体验(CX)产品组合中遥测分析的处理方式。IT从超过14万个客户环境中收集拍字节(PB)级的运营数据。

Kale说:“当我们转向实时预测AI时,将原始时间序列数据传输到云端的成本和延迟成为瓶颈。通过将特征提取和异常检测转移到客户本地采集器,并只向云端发送高级别风险信号,我们大幅降低了数据传出量,同时提升了模型的真实度。”

在所有情况下,“人工智能明确了架构上的权衡:特定工作负载受益于公有云的弹性,但最敏感、数据密集且延迟最关键的人工智能功能需要更贴近数据,”Kale说。“对我们来说,云智能已经不再只是回归,而是将数据重力、隐私边界和推理经济学与正确的控制平面对齐。”

三、更经济的执行路径

与宝洁一样,World Insurance Associates认为云智能意味着实施FinOps框架。CIO Michael Corrigan表示,这意味着要根据业务用例为虚拟机构建一个优化且一致的版本,并了解所需的存储和计算量。

这些是决定成本的主要驱动因素,“因此我们根据用例制定了一套一致的环境规模标准,”Corrigan说。这赋予了World Insurance Corrigan所说的自动化架构。

“然后我们优化构建,确保像弹性这样的功能都开启了。所以当服务通常在夜间未被使用时,它们会关闭,减少存储空间以关闭计算量”,所以公司并没有为此买单,他说。“一切都从优化或标准的基础开始。”

World Insurance与其云服务提供商在不同层面的承诺上合作。以Microsoft为例,保险公司可以选择使用虚拟机,或者Corrigan所说的“预留实例”(reserved instance)。通过告诉供应商他们计划使用多少台机器或打算花费多少钱,他可以尝试争取折扣。

“这正是FinOps框架必须真正到位的地方……因为显然,你不想承诺一个你原本不会消费的支出水平,”Corrigan说。“这对消费者或我们这些使用云服务的组织来说,是提前获得非常显著折扣的好方法。”

World Insurance正在利用人工智能进行自动化和警报。人工智能工具通常基于计算处理模型收费,“你可以设计查询,使得如果是较简单的内容,它会走更低成本的执行路径”,然后进入一个小语言模型(SLM,后者消耗的处理能力较少,Corrigan说。

用户获得满意的结果,“因为你消耗的量减少,成本也更低”,他说。

这就是公司采取的策略——将AI查询路由到更便宜的模型上。如果有更复杂的工作流程或流程,会先被引导到SLM,“看看是否符合要求(checks the box),”Corrigan说。如果需求更复杂,则会进入下一阶段,成本更高,通常涉及需要处理更多数据以满足终端用户需求的大型语言模型(LLM)。

“所以我们也尝试用这种方式管理成本,只消耗基于复杂流程的真正需要消耗的部分,”他说。

四、云是一个“活的框架”

Hylaine的McElroy表示,CIO和CTO需要更加开放地讨论混合基础设施配置的优势,以及过去几年技术水平的变化。

“许多组织都在为云计算成本苦恼,尽管他们本能地知道云成本过高,但当首席财务官(CFO)不知道自己错过了多少节省时,几乎没有动力去承担高风险的回归工作,”他说。

Lucetti将宝洁的云战略形容为“一个活的框架”(a living framework),并表示未来几年公司将继续利用合适的云能力,赋能AI和代理技术以实现商业价值。

“目标很简单:让技术与业务增长保持一致,同时在快速变化的数字环境中保持敏捷,”她说。“云转型不是终点——而是一段旅程。在P&G,我们深知成功来自于将技术决策与业务成果相结合,并拥抱灵活性。”