你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
多云环境的投资回报率:实现价值与效率最大化指南
作者:CIO&睿观 来源:CIOCDO 发布时间:2025年06月24日 点击数:

IT专家为在多云环境中计算ROI(投资回报率)提供建议,涵盖云成本管理、性能洞察以及有效治理等方面,以推动业务成果提升。

图源:Rob Schultz / Shutterstock

我们生活在一个多云的时代。根据HostingAdvice.com最近对IT领导者的一项调查,89%的受访者表示,企业在其业务中绝不应仅依赖单一云服务提供商。相反,他们会转向诸如Azure、AWS和Google和谷歌等超大规模云服务提供商,以及一些规模较小的云服务供应商来获取云服务。但这并不意味着一切都一帆风顺。实际上,73%的企业在应对安全复杂性方面存在困难,45%的企业担心供应商锁定问题。

此外,还有一个潜在问题日益凸显。如何确保在多云环境中的投入能够获得回报?多云环境的ROI究竟如何,又该如何提高这一回报率呢?为找到答案,我们向企业高管和云专业人士请教,深入了解他们在这一领域的工具和技巧。

一、多云环境如何带来回报

多云架构增强了系统的弹性,这是其能够带来投资回报的最显著方式之一。Chronosphere公司的现场首席技术官Bill Hineline(比尔·海纳林)表示:“虽然没人愿意公开承认,但重大的云服务中断事件确实时有发生。当这种情况出现时,单一云服务提供商的10个可用区也无济于事。而这时,多云架构就能发挥作用。” 对于每分钟停机成本高昂的企业而言,能够在不同云服务提供商之间进行故障转移,可能成为保障财务状况和企业声誉的关键。

不过,不同的云服务提供商并非仅仅是功能相同的存储和计算集群,多云架构可以为企业提供针对特定任务的最佳工具。

Baseten公司的营销主管Mike Bilodeau(迈克·比洛多)表示:“每种云服务在处理某些特定工作负载时表现更为出色。根据企业的业务性质和正在构建的项目,针对不同产品使用不同的云服务是很有意义的。” 海纳林对此表示赞同:“例如,企业可能会在Google Cloud Platform/GCP(谷歌云平台)上运行分析工作负载,而将核心工作负载保留在AWS(亚马逊网络服务)上。”

JLEE & Associates的首席执行官Jimmie Lee(吉米·李)补充说:“一家云服务提供商可能在存储方面成本较低,另一家则可能在计算或人工智能交易方面价格更优。如果实施得当,这些优势能够显著降低成本。”

性能方面也是多云环境能够大放异彩的领域。Bilodeau(比洛多)表示,通过将工作负载部署在距离终端用户更近的不同云区域,可以降低延迟并提高响应速度。他指出:“亚马逊有一个经典数据,每增加100毫秒的延迟,他们就会损失1%的营收。利用多云环境使工作负载更接近客户,有助于解决这一问题。”

这种优势不仅仅体现在架构上。在人工智能应用密集的环境中,推理成本可能迅速占据公司云服务支出的主导地位。Baseten的首席技术官Amir Haghihat(阿米尔·哈吉哈特)说:“我们亲眼目睹,对于许多大型企业来说,推理成本比其他所有云服务成本高出一个数量级。采用多云策略能让他们在合同谈判中获得不小的优势。”

此外,多云环境还能增加对GPU等稀缺资源的获取机会。Haghihat(哈吉哈特)说:“对最新硬件的需求非常高,获取B200等设备可能很困难。采用多云策略,无论GPU在哪里可用,都能更轻松地利用其更好的性价比。”

图源:IDG

多云环境还使企业能够通过在公共云和私有云之间分配工作负载,灵活调整运营成本结构。Rimini Street的全球首席信息官Joe Locandro(乔·洛坎德罗)对此深有体会。

Locandro(洛坎德罗)说:“我们曾为电网运行大型预测模型,这需要巨大的计算能力。迁移到更先进的云环境后,模拟时间从12小时缩短到了2小时,这使团队每月能够运行的模拟次数增加了300%。”

二、多云环境的不足之处

毫无疑问,对于技术领导者而言,多云环境的所有这些优势听起来就像收银机发出的“咔哒”声(意味着赚钱)。但我们采访的所有专家都强调,要实现这些投资回报,取决于实际的执行情况,而理想的结果往往难以实现。在实际操作中,许多企业发现,多云环境同样容易带来摩擦、冗余以及收益递减等问题。

EasyAudit.ai首席执行官Christian Khoury(克里斯蒂安·库里)表示:“如果你的团队有一半时间都花在上下文切换上,那灵活性就是空谈。当工程师们不得不同时应对两个云控制台、两个IAM(身份与访问管理)系统以及两套文档时,我们发现工作效率下降了。”多个环境非但没有提升敏捷性,反而会因工具重复和工作流程不兼容而拖累团队。而且,一旦你成功部署了应用程序,可能会发现性能受到了影响。

即使是工作负载可移植性这一众多多云策略的核心支柱,也很少能达到企业预期的效果。YL Ventures的合伙人、Akamai的前首席安全官Andy Ellis(安迪·埃利斯)说:“企业常对自己抱有一个幻想,认为多云策略能让应用程序根据需要在不同云服务之间迁移。”

“现实情况则恰恰相反。”在大多数情况下,应用程序与特定供应商的服务紧密集成,而其中一些服务正是当初促使你选择多云策略的特殊功能。Ellis(埃利斯)说:“你不能再把应用程序视为‘只是虚拟化的一排服务器’。应用程序是一个微服务生态系统,其中很多服务都是需要付费的。”

这种紧密耦合不仅限制了可移植性,还削弱了谈判能力。Ellis(埃利斯)说:“你实际上并没有足够的筹码轻易威胁供应商要迁移现有应用程序。可以说,云迁移项目的成本比过去的数据中心迁移还要高。” 供应商深知这一点,虽然他们有动力留住你的业务,但转换成本和复杂性实际上形成了一种锁定效应。

三、为何需要评估多云环境的ROI

关键问题不在于多云环境能否省钱,而在于其成本是否物有所值。Forrester分析师Tracy Woo(特蕾西·吴)就是这样定义这个问题的。Woo(吴)表示:“几乎每个人都明白,企业将工作负载迁移到云端并非仅仅为了省钱。”

“所以接下来的问题是:这值得吗?而这就涉及到成本管理之外的诸多因素了。”她说,许多公司在做这些决策时并非基于长远规划。“很多所谓的‘策略’不过是:别人都这么做,我们也应该跟风。在疫情期间这种情况尤为明显。”

对于仍在发展壮大的公司而言,目前多云环境可能并非必要。Baseten公司的Bilodeau(比洛多)指出:“关于延迟问题,通常企业在规模达到一定程度后才会意识到(自己存在延迟问题)。”为了解决这类问题,“大多数公司一开始不会选择多云环境,因为相较于推动产品应用,这是一笔巨大的基础设施投资。”但一旦公司在流量、性能要求或客户需求等方面达到某个阈值,采用多云环境的压力就会增大。

问题在于,这种发展过程很少是按照清晰的战略规划展开的。技术团队往往会默认使用他们熟悉的工具。EasyAudit.ai的Khoury(库里)说:“我们原本并不打算采用多云环境。但最终还是这样做了,因为不同团队各自选择了他们熟悉的工具。开发人员选择了GCP,运维人员选择了AWS。后来法务部门表示,为了某笔企业交易,我们需要一个私有云选项。这简直就是供应商的噩梦。”

即使是成熟的大型企业也常常无意中继承了多云的复杂性。正如YL Ventures的Ellis(埃利斯)所说:“企业的并购活动会带来不同的云环境,而且随着企业的发展,云服务也会不断增加。开发团队可能掌握不同云技术的专业知识,他们会基于自己熟悉的技术进行开发。”他补充说:“企业在其他业务领域的合作关系,可能促使合作伙伴提供优惠价格,从而推动企业采用他们的云服务。”

有时,决策甚至并非由企业内部做出。Baseten的Bilodeau(比洛多)解释说,对于销售基础设施软件的供应商来说,客户的偏好会决定云服务的选择:“有些公司只使用‘AWS’或‘GCP’。如果您的软件无法在这些云中运行,这可能会成为交易的阻碍。”Woo(吴)对此表示赞同:“很多人没得选。可能是出于政治原因,或者某个任性的工程师,又或者是合作伙伴的要求——突然间,你就得顺应大家的需求。”

其结果是,架构是由一个个独立的决策拼凑而成,而非一个连贯的规划。JLEE & Associates 公司的Lee(李)表示:“我们经常发现,客户在使用众多不同的云服务和产品。这些往往是别人为他们设计或推荐的,缺乏一个更全面、更具前瞻性的战略规划。”

为了应对这种复杂性,具有商业头脑的IT领导者需要发挥更大作用。Rimini Street的Locandro(洛坎德罗)说:“通常情况下,IT部门从技术和风险的角度看待云服务提供商。而具备商业洞察力的CIO则有责任制定完善的指标、进行监控并提高成本意识,从而真正理解其中的价值。”

四、提高多云投资回报率的技巧:策略、结构和技能

多云环境能够带来显著回报,但前提是你要合理规划如何使用它。仅仅在多个平台上拥有账户并不会自动带来这些好处。

“如果实施不当,多云产品的成本可能会失控,”JLEE & Associates的Lee(李)说。Rimini Street的Locandro(洛坎德罗)补充说,对于许多组织来说,多云环境的TCO(总拥有成本),包括管理、监控和提升员工技能等方面,“远远超出了最初的预期和供应商的承诺”。

如果缺乏治理、可观测性以及架构规范,你将面临成本上升、团队混乱以及错失机会的风险。以下是我们采访的专家为使多云环境投资物有所值而推荐的步骤。

只使用真正需要的云服务:这一点看似显而易见,但在实践中却常常被忽视。Pluralsight公司的首席云策略师Drew Firment(德鲁·菲尔蒙特)表示:“太多领导者将多云环境视为一种身份象征,而非一项战略。重要的不是‘云服务的数量’,而是基于合理原因选择合适的云服务。”

在EasyAudit.ai公司,Khoury(库里)的团队提出了一个尖锐的问题:“生产环境中每个云服务的实际价值是什么?”任何无法支持核心服务或合规要求的云服务都被标记出来。他说:“我们并非追求理论上的冗余,而是试图清理无用的基础设施,在处理多项费用之前先控制好一项费用。”

云成本与可观测性息息相关。Chronosphere公司的Hineline(海纳林)表示:“许多团队仍然将成本视为一个单纯的项目支出,而非一种治理手段。可观测性方面也是如此。”他还说:“成功实施多云策略的团队将成本和可观测性视为同等重要的因素。这意味着严格的标签管理、明确的责任归属以及有针对性的监测工具。如果你的FinOps(财务运营)团队无法将每一笔支出追溯到具体的服务和团队,那就是在盲目行事。”

YL Ventures的Ellis(埃利斯)对此表示赞同:“如果无法了解云服务的使用情况,那就如同开着推土机在瓷器店里横冲直撞(盲目行事)”他建议,与其采用繁琐的流程进行严格管控,不如“从一开始就提供精细周到的服务”,引导团队进入成本高效的环境。

审查架构以根除低效率问题:Ellis(埃利斯)建议采取一些基本措施,比如识别同一供应商下的重复账户。他说:“这样做可以在批量采购时为你争取更优惠的价格。”

即使是简单的做法也可以减少浪费。Rimini Street的Locandro(洛坎德罗)说,他曾遇到过“开发人员启动测试和开发环境后,完成工作却忘记关闭。使用完毕后应及时关闭环境,而不是让云资源持续消耗。”

衡量重要事项——生产力和成果:Firment(菲尔蒙特)说:“多云环境的投资应以有意义的生产力提升和业务成果来衡量。如果你无法实现更快的部署和提升客户价值,那只是在以一个更花哨的名义增加云服务费用而已。”

提升团队技能——并引导他们达成目标:Firment(菲尔蒙特)补充说:“只有当你的团队经过培训,能够应对不同云环境的差异时,灵活性才能转化为更快的交付速度。”但你不应期望每个开发人员都精通所有云服务。“目标是一次构建,随处运行,并实现快速交付。”

这就需要架构能够支持明智的决策。正如Ellis(埃利斯)所指出的:“开发人员通常会选择阻力最小的路径,所以你越能让他们轻松采用那些总体上能为你节省最多资金的平台,你的处境就会越好。”

五、多云环境的复杂性需要明智的推进策略

如果说多云环境曾经看起来只是一种技术升级,甚至是一种高端的象征,那么现在它需要更深入的思考:一种将云架构与业务成果相联系的战略视角。这种演变与IT自身角色的转变同步发生。

Forrester的Tracy Woo(特蕾西・吴)表示:“我认为(多云投资回报率)这个问题背后的情况,是很多团队都不得不面对的。他们之所以面临这样的情况,是因为过去IT就只是IT——你有一台桌面电脑,上面安装了一些应用程序。而如今,IT战略已然成为推动业务或数字转型的关键支撑。”她还说:“IT的重要性越来越高,这就是为什么云计算正切实改变着人们的工作方式。而在此之后,一个更为关键的问题浮现出来:多云的投资回报率究竟如何?”

对于那些将多云仅仅视为一项任务勾选(敷衍对待),或者任由其毫无规划地发展的组织而言,答案很可能是“收效甚微”。但对于那些将云架构与业务优先级、成本管控、性能目标以及对团队能力的实际评估相结合的组织来说,多云可以成为长期灵活性和弹性的基础,并为最初必要的投资带来回报,甚至更多收益。

六、追踪多云成本的工具

专家们分享了他们最喜欢的用于密切关注日常多云支出的工具(以及其他小贴士):

Jimmie Lee(吉米·李):在使用四大主要云服务提供商时,要在理解如何优化云架构和降低成本方面超越他们自身的工具、团队及合作伙伴网络是极具挑战性的。话虽如此,市面上还是有一些值得关注的第三方工具。目前正在开发的人工智能产品将在不久的将来为这些成本提供更多的可见性和管理能力。

像CloudZero、Apptio、Vantage、Harness和Densify等都是这类工具。对我来说,追踪和控制成本始于确保我们拥有透明且优化的IaC(基础设施即代码)和CI/CD(持续集成/持续交付)设计和运营。这确保了变更经过适当的代码审查,迫使进行尽职调查并就变更原因和时机进行对话,并允许我们为每个中等或大型变更设定成本节约或ROI的目标。

Andy Ellis(安迪·埃利斯):从各大平台(AWS Cost Explorer、Azure成本管理以及谷歌云成本管理)中的成本管理和分析工具入手。当这些工具无法满足需求时,你就应该真正开始考虑使用多云工具了,因为此时你已经对自身需求有了足够的了解,能够成为一个有鉴别力的买家。

像CloudZero、Apptio Cloudability和Kubecost这类工具可能是很好的起点,但市面上有很多竞争对手,其中许多工具都可以与你现有的FinOps平台集成。在购买时,这些集成功能可能是最有价值的特性。

你还可以将对成本节约的关注与对安全的关注结合起来。这两项工作都始于盘点你的云账户,并将它们整合到一个中央平台。云原生应用保护平台(CNAPPs,如 Orca 和 Wiz)现在已将云成本优化作为一项内置工具,它能够识别完全未使用的服务,以便你进行清理——在降低风险的同时节省资金,还能减少云运营团队需要关注的事项数量。

Drew Firment(德鲁·菲尔蒙特):在花钱购买工具之前,先从严格的标签管理、严格的治理以及让工程团队对财务负责做起。如果没有人对支出负责,那么每个人都会超支。

像AWS Cost Explorer(亚马逊网络服务成本浏览器)、GCP Billing Reports(谷歌云平台计费报告)和Azure Cost Management(Azure 成本管理)这样的原生工具是一个良好的开端。但像CloudHealth和Apptio这样优秀的成本工具不仅能向你展示账单金额,还能告诉你产生这些费用的原因。像Stacklet这类工具更是变革性的,因为它们将策略融入到流程中。它们不仅能展示你的支出情况,还能从一开始就防止你犯下代价高昂的错误。

即使是最好的工具,如果你的员工没有接受过将云成本视为其工作成功一部分的培训,那也无济于事。只有当你培训团队使用这些工具,而不仅仅是让财务部门使用时,才能真正实现有效的成本可见性。

作者:Josh Fruhlinger(约什·弗洛林格)

译者:宝蓝


睿观:多云环境能为企业提供系统韧性、成本优化及性能提升等战略机遇,但同时也带来了管理复杂、成本失控和可移植性受限等严峻挑战,其投资回报率(ROI)并非必然(机遇与挑战)。许多企业因并购或团队偏好等原因“意外”陷入多云,而非出于战略规划。要提升ROI,必须采取系统性策略:制定清晰战略,只使用真正需要的云;通过可观测性工具和严格治理来控制成本;优化架构以根除效率低下;并提升团队技能以驾驭不同环境(核心对策)。最终,只有将云架构与业务成果、成本管控和团队能力紧密结合,才能驾驭其复杂性,真正释放其价值(结论)。

金句:

在多云的世界里,成本失控是默认状态,而投资回报是刻意为之的结果;没有精细的治理,再多的云也只是一团昂贵的迷雾。