导语:很多企业满怀信心地引入 AI 智能体(AI Agents),以为能大幅削减人力成本。但当月底的账单寄来时,CIO 们却傻眼了——在没有严格控制的情况下,一个 AI 智能体每天的 API 调用成本竟然高达 300 美元!折算下来年薪超过 10 万美元,而它干的活,甚至还不到一个普通员工的一小部分。

这是近期硅谷顶级播客《All In Podcast》中爆出的残酷真相。科技圈的大佬们正在发出警告:如果不加限制,你的 AI 代理比雇人还要贵得多。
一、为什么 AI 代理会变成“吞金兽”?
导致 AI 成本失控的几个核心原因:
“大炮打蚊子”的粗放部署:给一个通用的大模型(如最顶配的 Claude 或 GPT-4)下达一个极其宽泛、边界模糊的任务,让它无休止地进行多步推理和循环。这就像雇了一个没有明确工作范围的外包团队,账单自然会让你震惊。
盲目放权的代价:很多工程师为了偷懒,让 AI 智能体盲目地擦除和重写大段代码。这种“无人值守”的模式不仅消耗海量 Token,还会因为 AI 产生的幻觉和错误,带来巨大的安全和质量风险。
缺乏集中可见性(影子 AI):团队里有人试用了一个智能体觉得不错,于是口口相传。突然之间,公司里同时跑着 15 个无人监管的 AI 智能体,财务部门甚至不知道钱花在了哪里。
二、CIO 如何踩下刹车,扭亏为盈?
AI 依然是极其强大的生产力工具,前提是你必须学会“算经济账”:
模型降维打击:不是所有任务都需要最前沿的大模型。对于边界清晰、重复性高的任务,使用经过微调的小参数模型(甚至在本地运行),成本可以降低 10 倍以上。
物理硬性限额:像管理云资源一样管理 AI智能体。为每个团队或工程师分配独立的 API 密钥,并设置绝对的每月资金消耗上限(Hard Cap)。
以“产出价值”衡量成本:如果一个高级 SRE(站点可靠性工程师)年薪 20 万美元,而一个定制化的垂直 AI 智能体能以极低的成本完成他 80% 的事故排查工作,这笔钱就花得值。
总结:
“AI 是工具,不是你大脑的替代品。”未来的赢家,不是那些盲目堆砌 AI 智能体的公司,而是那些从第一天起,就将 AI 视为“可变成本运营资源”,并为其建立严格预算、审计和问责机制的企业。
全文:没有管控的 AI 智能体,成本可能比雇佣员工还要高
播客主持人爆料称 AI 智能体每天的消耗高达 300 美元,而人工智能专家表示:如果 IT 团队不对其使用设定严格的限制,这个夸张的数字完全是现实。

来源:Rob Schultz / Shutterstock
科技圈知名投资人 Jason Calacanis 和风险投资家 Chamath Palihapitiya(两人也是热门播客《All In Podcast》的联合主持人)指出,如果没有适当的控制,AI 智能体(AI Agents)的消耗成本可能会远远超过其产出的实际价值。
在最近的一期节目中,资深科技投资者 Calacanis 透露,在他旗下的一家公司中,在使用 Claude API 时,AI 智能体的成本迅速飙升至每天 300 美元。令人尴尬的是,这些相当于“年薪 10 万美元”的 AI 智能体,所能替代的仅仅是普通员工一小部分的工作量。
“Token(代币)的消耗速度什么时候会超过员工的工资?”他质问道。“答案是:你马上就要越过这条红线了。我也即将触及这条红线。”
Social Capital 风险投资公司的 CEO Palihapitiya 则表示,他的公司为最顶尖的开发者设定了明确的 Token 预算上限。他警告说,无节制地滥用 AI 智能体,代价将是极其昂贵的。
“如果你把所有员工的 AI 消耗加总起来,你会清晰地看到一种可怕的趋势,你会被迫去想:‘好吧,既然这些 AI 花了这么多钱,那员工的生产力现在至少得翻倍才行’,”他说。
他补充道,设置限制是绝对必要的,否则他很快就会把公司的钱烧光。
这期播客在 X(前 Twitter)和 LinkedIn 上引发了广泛的讨论。一些网友认为 AI 公司的利润率实在太高了;而另一些人则表示,这两位主持人的亲身经历,恰恰证明了为什么企业必须对 AI 智能体的支出保持严密的管控。
“这并不是在否定 AI 智能体的价值,”AI 解决方案供应商 Addo AI 的 CEO Ayesha Khanna 在 LinkedIn 上写道。“真正的问题在于,你运行 AI 的方式在经济学上是否站得住脚。遗憾的是,目前大多数团队的做法在经济上都是不划算的。”
其他几位 AI 专家也证实,如果 IT 领导者不勒紧支出的缰绳,每天 300 美元的成本是完全可能发生的。但他们同时也指出,只要落实了正确的管控措施,AI 代理的成本根本不需要这么高。
“Fractional CTO(共享首席技术官)”服务提供商 Solidmatics 的 CEO Vygandas Pliasas 表示,如果没有管控机制,当企业使用昂贵且高度定制化的智能体系统进行代码编写,并且通过不断调用 API 来运行,而不是直接使用现成的编程辅助工具时,智能体的成本就会像火箭一样飙升。
“有时我在一周内的 API 消耗就能达到 500 美元,而且这还是在我采取了非常克制的、由人类主导的干预方式下产生的,”他说。“问题的核心在于,如果你放任 AI 智能体盲目地擦除和重写大段代码,你其实已经不再是自己真正在把控工作了,而且我也会对产出的代码质量打上一个巨大的问号。”
他补充说,允许 AI 智能体彻底接管编码和其他核心任务,极有可能引发安全漏洞和其他不可预知的风险。
“我总是强调,AI 是工具,不是你大脑的替代品,”Pliasas 说。“你必须用你的大脑来主导。你利用 AI 来更快地寻找答案;但如果你盲目地信任它、放任它自动运行,那你迟早会收到那张天价账单。而且,它产出的结果往往配不上这个价格。”
此外,AI 驱动的站点可靠性工程(SRE)供应商 Cleric 的 CEO 兼数据科学家 Shahram Anver 补充道,脱离具体语境去谈论“每天 300 美元”的成本是具有误导性的。“当你给一个极其庞大、通用的 AI 模型下达了一个边界非常宽泛的任务,然后任由它去狂奔时,天价账单就会产生,”他说。“这就像你雇佣了一个外包团队,却没有给出明确的工作范围(Scope),等收到发票时你自然会惊掉下巴。”
Cleric 公司构建了一个专门的站点可靠性工程(SRE)代理,其运行成本仅仅是“每天 300 美元”的一小部分。因为它有着极其明确的特定目标,它知道该问什么问题,也知道在什么时候应该停止运行。
Anver 指出,在很多业务场景中,尽管存在成本超支的潜在风险,但使用 AI 智能体依然比招聘更多的 IT 员工要划算得多。“一个高级 SRE 的年薪加上各种福利的完全成本(Fully loaded cost)超过 20 万美元,”他补充道。“如果一个 AI 智能体能以极其低廉的成本,完成这个专家 80% 的事故排查工作,那么真正重要的考量标准是‘这个智能体的产出是否足够可靠’,而不是去计较它到底花了多少 API 调用费。”
不过他警告说,如果 IT 领导者不设立规矩,企业依然很容易在这种新事物中迷失方向。
“大多数公司都在用交学费的笨办法来吸取教训,”Anver 补充道。“团队里有个人为了完成某项任务偷偷启动了一个智能体,发现效果不错,就告诉了队友。突然之间,你的公司里同时跑着 15 个无人监管的 AI 智能体,而你对它们到底在干什么、消耗了多少资源一无所知。”
专注于聊天机器人和技术支持优化的 AI 提供商 Katico 的 CX/CS 软件分析师 Kateryna Babenko 指出,部署 AI 智能体既有奢华的玩法,也有极其经济的玩法。
“如果你非要让一个持续运行的智能体(比如OpenClaw),去对接最昂贵的前沿模型(Frontier Model)API,并且伴随着海量的 Token 消耗、超长的上下文窗口、复杂的多步推理以及长篇大论的输出,那么这笔经济账很快就会变得非常难看,”她说。“在某些极端情况下,AI 完成单项任务的成本,甚至比直接雇一个人来做还要高。”
然而,Babenko 补充说,如果将一个“任务边界极其严密”的智能体,与一个经过针对性微调的较小 AI 模型搭配使用(无论是在本地运行,还是在受控的推理层上运行),成本将呈断崖式下降。
她指出,在这条智能体光谱的两端,存在着完全不同的运营模式,但许多公司并没有把它们区分开来。“他们一听到‘AI 智能体’这个词,就理所当然地认为这只代表一种固定的支出类别,但事实并非如此,”她说。“这是一个极宽的光谱,一个精打细算的智能体部署与一个粗放式的草率部署之间,其运营成本的差距轻轻松松就能达到 10 倍以上。”
因此,她强烈建议 IT 领导者应该基于具体任务进行 Token 消耗量建模,在他们准备使用的模型层级上建立推理成本基准,然后将这些成本与他们试图替换或增强的传统工作流的人力成本进行严密的对比。
“真正能证明其成本合理性的 AI 智能体,是那些被应用于‘人类极其厌恶的手工重复劳动’的代理,这些任务必须具有明确的边界,输出结果易于自动化检查,并且人类监督员能够在错误引发连锁灾难之前,及时将其拦截,”Babenko 补充道。
IT 领导者不仅需要思考技术的实现,更必须算清 AI 智能体的经济账。“那些能将 AI 智能体运行得风生水起的组织,一定是那些将 AI 视为‘可变成本运营资源’的组织。从引入 AI 的第一天起,他们就将预算、控制、所有权归属以及问责机制,深深地植入了系统的骨髓之中,”她说。
Solidmatics 的 Pliasas 建议对 AI 智能体的使用设置硬性的预算上限(Caps)。他指出,目前主流的 AI 提供商都允许客户为每个 API 密钥或整个组织设定绝对的支出上限。IT 领导者可以为每个团队甚至每位工程师生成独立的 API 密钥,并设置每月的美元消耗红线。
对于像 Cursor、GitHub Copilot 或 Claude 专业版这类托管型 AI 工具,企业的 IT 团队应该集中管理许可证(Licenses),统一决定谁有资格获得使用席位、他们分配在哪个权限层级,以及他们只能使用基础模型还是可以访问极其昂贵的高级模型。
然而,Pliasas 同时也建议 IT 领导者在预算上限的执行上保持一定的灵活性。
“这最终取决于员工交付的价值,”他说。“如果一名顶级工程师正在借助 AI 推出高质量、高影响力的核心功能,或许他一个人的产出,就相当于一个 10 人团队辛苦一年的成果。在这种情况下,他消耗的高昂 API 成本绝对是物超所值的,你不能简单粗暴地拿这个数字去和一个普通员工的固定薪水做比较。”