通过调整“精益创业”方法论以适应生成式AI项目试点,企业可以有效降低AI采纳的风险,并更好地确保在规模化应用中取得切实成果。
图片来源:GaudiLab / Shutterstock
在生成式AI出现之前,我们Rest——作为澳大利亚最大的养老基金之一——早已启动了一项战略,旨在为我们的会员简化退休投资体验。
然而,随着2022年11月ChatGPT的发布,整个格局发生了巨大变化。我们认识到这项技术在为会员进一步提升效率方面的巨大潜力,同时也意识到它可能为我们这个受到高度监管的组织带来额外的风险。
我们大约50%的会员年龄在30岁以下,许多人从事兼职和临时工作,这意味着他们的账户余额通常低于全国平均水平。因此,我们必须高效运营,同时确保我们的投资获得强劲的回报。生成式AI为实现这一目标提供了一个绝佳的机会。但是,正如许多组织已经发现的那样,利用生成式AI实现有意义的商业价值可能充满挑战。
从技术角度实现我们的目标,需要一种务实、可控的方法来释放生成式AI的益处,同时该方法必须与我们的组织战略和风险偏好保持一致。
为了满足这一需求,我们基于“精益创业”方法论开发了一个框架。我们的模型——“测试、衡量、扩展、放大”(Test, Measure, Expand, Amplify)——旨在指导和规模化生成式AI项目,同时有效规避风险并实现可衡量的业务成果。
对于那些寻求实用项目管理方法以交付价值导向型生成式AI解决方案的组织而言,我们在Rest构建的以下四步框架或可为其提供借鉴与指导。
第一步:测试 (Test) — 从小处着手,验证想法
与“精益创业”方法论将“构建”(Build)作为第一步不同,我们的框架始于实验。在许多情况下,生成式AI模型已经是“消费级”产品,无需大量的软件开发即可上手。但在为一项AI计划投入大量资源之前,从小处着手并验证想法至关重要。
我们在此阶段进行了一些实验,包括引入RestGPT以提高员工生产力。在我们的首个版本中,我们在一个安全的环境中,利用运行在企业基础设施上的ChatGPT“引擎”,并将数据存储在我们自己独立的租户中。
为确保我们遵循一种受控且结构化的方法,我们设立了“护栏”,包括一项“负责任使用政策”,要求员工同意在使用生成式AI时遵守我们的风险与治理方针。
随后,我们成立了一个工作组,在全公司范围内担任倡导者,以帮助激发项目兴趣。我们挑选了几个关键用例进行测试,这些用例均与我们为会员提升效率的目标相符。
为了使这成为一次真正的实验,我们为每个用例设定了明确的基准。关键在于,我们需要了解在引入生成式AI之前,员工在每项任务上花费的时间,这样我们才能衡量任何实际的改进。
这个“测试”阶段使我们能够以一种可控的方式验证生成式AI的价值,确保其与业务需求对齐,同时系统性地管理风险。
第二步:衡量 (Measure) — 定义真正重要的指标
我们框架中的“衡量”阶段,是基于在“测试”阶段建立的既定指标来评估每个用例。这是尤为关键的一步,因为项目团队将在此阶段做出关键决策:是继续投资某个用例,还是停止并转向价值更高的机会。
在高峰时期,我们约有90%的员工在使用RestGPT工具。但正如IT和项目负责人所知,工具的使用率仅仅是一个指标,其本身并非KPI。衡量与战略目标相一致的生产力提升至关重要——在我们的案例中,即为会员带来效率提升。
举例来说,我们用RestGPT测试的一个用例是帮助我们的财务团队分析市场洞察报告。在RestGPT的协助下,执行此项分析所需的时间减少了约85%——这在试点期间为我们的分析师节省了大量时间。
这正是在“衡量”阶段所要寻找的结果:一个清晰、可量化的效率提升。它是一个强有力的价值指标,并为规模化推广该用例提供了充分理由。
第三步:扩展 (Expand) — 规模化行之有效的方案
在我们框架的“扩展”阶段,我们在实验成功的领域识别更多的用例,以扩大生成式AI的影响力。然而,我们也认识到,并非每个用例都能如预期般规模化。
在“测试”阶段确认了RestGPT能推动生产力提升后,我们便将目光投向了基于聊天的AI之外,开始探索企业级的AI集成。
我们当时还在并行测试一个聊天自动化工具,旨在通过生成推荐回复来支持员工的在线聊天。该工具能提供AI生成的回复,客服专员可以在与会员的实时聊天互动中复制、编辑并发送。
从表面上看,结果似乎很不错,该工具提供了大量高度准确的回复建议。但当我们分析实际采纳率时,发现只有一小部分建议被我们的员工使用。他们对于依赖AI来实时撰写回复感到不适。因此,我们没有强行推进一个未被充分使用的解决方案,而是在仅仅两周半后暂停了该计划以调整策略。
这是一个关键的学习时刻:并非每个生成式AI用例都能成功规模化,即使它通过了初步测试。采纳率与准确性同等重要。
相比之下,呼叫中心的其他试点项目,如语音转文本转录和通话数据分析,则显示出立竿见见的价值,将通话后处理工作时间减少了50%。
“扩展”阶段将使你能够精确地找到生成式AI在何处以及如何发挥最大影响。通过保持灵活性并关注采纳率,你可以在必要时进行调整。
第四步:放大 (Amplify) — 释放全部潜力
我们框架的最后一步,是项目团队退后一步,评估进展,并识别那些将产生最大影响的进一步用例。
在此阶段,项目团队专注于那些能在规模化应用中交付最大价值的用例。在我们的案例中,我们基于两个关键因素进行评估:
影响力 (Impact):基于实施成本与“节省的员工工时”或“质量提升”所计算出的用例扩展的净现值 (NPV) 是多少?
可行性 (Practicality):考虑到与现有系统的集成、现成解决方案的可用性以及潜在风险,在规模上实施该项目的可行性如何?
基于这种方法,我们发现了两个生成式AI可以显著增强我们战略的明确领域:
Rest员工的AI助手:我们的第一个“放大”计划涉及升级RestGPT,将其应用范围扩大到所有800多名员工。通过利用一个企业级平台,我们能够将其集成到许多后台系统,如ServiceNow、Atlassian、M365和办公桌预订系统,这使我们能够集中化知识检索和任务自动化,包括处理IT请求。通过升级到企业平台,我们现在可以追踪哪类员工在使用该工具以及用于何种目的。追踪实际节省的工时对我们而言是一个“游戏规则改变者”。这使我们能够识别从初级分析师到高层管理人员所节省的时间,并让我们对正在实现的价值充满信心。
呼叫中心的对话辅助:我们的第二个计划专注于提升呼叫中心的会员体验。通过将AI与人类专业知识相结合,我们在会员通话时为员工提供量身定制的指导。通过与一家生成式AI平台合作,我们看到了在每天1600通电话中提升效率的机会。通过将每通电话的处理时间平均减少2.5分钟,我们估算出每年可节省总计20,000小时。这使得我们的呼叫中心员工每天能帮助更多的会员。
我们的“放大”阶段带来了另一个关键的学习时刻:借助生成式AI,你可以发现意想不到的好处。例如,我们曾低估了分析通话数据的价值,而现在我们正利用这些数据来更深入地洞悉会员最关注的话题。
利用生成式AI交付成果
在Rest,这个框架在引导我们应对生成式AI采纳的复杂性方面发挥了关键作用,确保了我们的各项举措与战略目标保持一致,并为我们的会员交付了切实的价值。
当您在考虑自己的生成式AI之旅时,我们希望采纳一个像“测试、衡量、扩展、放大”这样的框架,能有助于您开发以价值为导向的用例,并将其有效地规模化至企业级别。
1.【核心挑战/背景】
企业在面对生成式AI浪潮时,普遍陷入一个核心困境:一方面,该技术展现出重塑业务效率与客户体验的巨大潜力;另一方面,在高度监管和成本敏感的环境中,盲目投入不仅可能导致资源浪费,还可能引入难以控制的合规与数据安全风险。文章以澳大利亚大型养老基金Rest为例,其会员结构年轻化、账户余额普遍偏低的特点,决定了其运营效率必须做到极致。因此,对Rest而言,挑战并非是否要采纳AI,而是如何以一种务实、可控且与自身战略和风险偏好高度匹配的方式,将AI的巨大潜力精准地转化为可衡量的商业价值,从而避免陷入“试点炼狱”,确保创新能够真正服务于核心业务目标。
2.【应对策略/核心论点】
为应对上述挑战,Rest公司借鉴“精益创业”思想,独创了一套名为“测试-衡量-扩展-放大”的四步走框架,旨在系统化地解构和管理AI项目的生命周期。第一步“测试”,主张从小范围、有明确基准的实验入手,如内部使用的RestGPT,并设立“负责任使用政策”等治理护栏。第二步“衡量”,强调对结果的量化评估,用实际数据说话,例如财务团队利用AI分析报告,时间缩短了85%,这一清晰的效率提升成为了继续投资的有力依据。第三步“扩展”,在成功的领域扩大应用,但同时保持警觉,因为并非所有试点都能成功规模化。一个关键案例是聊天自动化工具,尽管技术上准确率高,但因员工采纳率低而被果断暂停,这揭示了“用户采纳率与技术准确性同等重要”的核心洞察。第四步“放大”,则是在前序基础上进行战略聚焦,基于影响力(净现值NPV)和可行性两大标准,筛选出最具规模化价值的项目。最终,他们锁定了企业级AI助手和呼叫中心对话辅助两大方向,前者通过与ServiceNow等后台系统深度集成,实现了对员工生产力价值的精准追踪;后者预计每年能节省20,000小时的通话处理时间。
3.【结论与启示/战略价值】
该四步框架的最终结论是,生成式AI的成功落地并非依赖于一次性的技术豪赌,而是一个纪律严明、迭代演进的价值发现过程。对于企业的CIO和CDO而言,其战略价值体现在提供了一套将AI从概念炒作转变为企业级战略资产的务实路线图。它强调,真正的护城河并非技术本身,而是驾驭技术的能力。该框架的核心启示有三:第一,风险可控的创新,通过“先测试、后投入”的模式,将创新风险最小化;第二,价值驱动的决策,以可量化的业务指标(如节省工时、提升质量)和用户采纳率作为项目存续与否的唯一标准;第三,战略聚焦与规模化,通过系统性评估,将有限的资源集中投入到能产生最大复利效应的应用场景中。最终,这个框架帮助决策者摆脱了对AI的模糊期望,建立起一套可复制、可衡量、可持续的AI价值实现机制。
总结:面对生成式AI带来的机遇与风险,企业亟需一套务实的落地方法论。“测试-衡量-扩展-放大”四步框架,通过小范围实验、量化价值评估、关注用户采纳和聚焦高影响力场景,为决策者提供了一条从零散试点到企业级战略整合的清晰路径,确保AI创新在风险可控的前提下,实现可衡量的商业价值。
(二)金句
成功的生成式AI战略,并非一场追逐技术浪潮的豪赌,而是一张精心绘制的航海图,它指导企业在规避暗礁(风险)的同时,精准抵达价值大陆(商业成果)。
书名: The Lean Startup(中文译名:《精益创业》)
作者: Eric Ries
推荐理由: 本文提出的四步框架明确基于“精益创业”方法论。阅读此书可以深入理解其“构建-衡量-学习”的反馈循环核心思想,这对于任何希望在不确定性高的领域(如生成式AI)进行低风险、高效率创新的企业决策者来说,是必读的基础理论。
网址: https://theleanstartup.com
书名: Competing in the Age of AI: Strategy and Leadership When Algorithms and Networks Run the World(中文译名:《AI时代的竞争:当算法和网络主宰世界时的战略与领导力》)
作者: Marco Iansiti and Karim R. Lakhani (哈佛商学院教授)
推荐理由: 本文聚焦于AI实施的“战术”层面,而这本书则提供了“战略”层面的宏大视野。它深入探讨了AI如何从根本上重塑企业运营模式、竞争格局和组织架构。对于希望理解AI对整个商业生态系统深远影响的CIO和CDO而言,此书能帮助他们将具体的AI项目置于更宏大的企业战略转型框架中进行思考。
网址: https://www.hbs.edu/faculty/Pages/item.aspx?num=56633
行业报告: The state of AI in 2024: A new era of Gen AI for all(中文译名:《2024年AI现状:全民生成式AI新纪元》)
机构: McKinsey & Company (麦肯锡公司)
推荐理由: 这份来自麦肯锡的年度报告提供了关于全球企业采纳AI(特别是生成式AI)的最新数据、趋势和洞察。它可以为Rest公司的案例提供更广泛的行业背景,帮助决策者了解不同行业、不同职能部门的AI应用成熟度、投资回报率以及面临的共同挑战,从而更好地校准自身的AI战略和期望。
网址: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2024-a-new-era-of-gen-ai-for-all