全部笔记
账单到期了

2026年6月4日

账单到期了

整整两年,AI 的成本感觉像个可以忽略的零头。到了 2026 年,发票来了——Uber 四个月就烧光了一年的 AI 预算,Microsoft 把 Claude Code 从自家工程师手里收了回去,JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学,而残酷之处在于:更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。

差不多有两年时间,用 AI 的成本是你根本不会去想的东西。在 demo 里它只是几分钱。在融资路演的 PPT 里它只是一个脚注。所有人都当产品里的智能是免费的——什么都调用最好的模型,让 agent 想循环多久就循环多久,先把规模做起来,账单的事永远别操心。

到了 2026 年,账单来了,而且它不是脚注。

成本恐慌是真的

今年春天的数字不再是抽象的了。 Uber 四个月就烧光了一整年的 AI 预算Microsoft 悄悄收回了自家大多数工程师的 Claude Code 许可证, 把他们推到了一个更便宜的内部工具上。一位 AI 顾问告诉 Axios, 他们有一个客户 单月在 Claude 上花了五亿美元。 JPMorgan 发了一份标题相当“欢乐”的报告 《AI Token 成本正在吞噬互联网利润》。 而只有 14% 的 CFO 表示他们能看到这笔花费带来了清晰、可衡量的回报。

最直白的一句来自一位 Nvidia 高管——当时 AI 成本已经飙过了工资支出:算力的成本现在 远远超过了员工的成本。 好好品一品这句话。本该让人变得更廉价的工具,反而变得比人还贵。

为什么这不是一时波动

把这当成一次暂时的飙升,会让人安心一些——价格会降下来,自己就会理顺。每个 token 的单价确实在降,但这救不了你,因为问题是结构性的。token 计费颠覆了软件赖以建立的经济学。

软件的魔力在于近乎为零的边际成本。你建好一次,第一万个用户带给你的额外成本几乎和第一个用户一样少。这就是“先做规模、后做变现”行得通的原因——多服务一些人几乎是免费的。AI 打破了这一点。 每一次使用都在烧 token,所以成本随使用量上升,永远不会变平。更糟的是,agent 不是一次模型调用——它会循环、规划、调用工具、反思。智能体型的 AI 消耗的 token 最多可达一个简单查询的 1,000 倍, 而 Goldman Sachs 预计 agent 会推动 token 需求在 2030 年前 增长 24 倍

下面这部分应该会重塑你的思路:在 token 这套逻辑下,把 agent 做得更好往往会让它更贵。 更多推理、更多步骤、更多上下文——更强的能力——就是更多 token。软件界惯常的本能“把它做得更聪明”,现在挂上了一个计价器。一份分析发现, 这笔 token 税吃掉了扩张期 AI 公司 23% 的营收,把毛利率锁死在比 SaaS 常态低约 30 个百分点的位置。 这道差距不是你能优化掉的 bug。它是新的物理定律。

我们自己造的孽

现在讲老实的另一半,因为这场恐慌不只是模型的价格——很大一部分是自找的。好几家公司主动激励了 token 燃烧。Meta 和其他公司搞了内部排行榜,按员工用了多少 token 来排名,于是人们做了理性的事:他们 整天把一切都往 agent 上砸,只为往榜上爬。 他们管这叫“tokenmaxxing(拼命烧 token)”,而它产出的正是它所衡量的东西:最大的花费,而非最大的价值。分析公司 Faros AI 甚至发现,在高强度采用 AI 的情况下,“代码churn(写了又删的代码)”——也就是写出来又被删掉的行数—— 暴涨了 800% 以上。 那些昂贵的 token,很多都生成了转头就被扔掉的代码。

所以这张账单是两件事叠在一起:推理本身真实的、结构性的成本,再加上其上的一次纪律失守——把一种计量收费的资源当成免费的,甚至还奖励人们去浪费它。

这到底意味着什么

这不是“AI 不管用”。这是“AI 从来都不是免费的,而我们花了两年时间假装它是,并以此造产品”。这次修正是健康的,它干掉的正好是该被干掉的那些习惯。那套偷懒的打法——把最贵的模型对准一切,让 agent 无边界地循环,从不看一眼计价器——正在死去。取而代之的,是工程里最古老的美德:效率,被当成一项功能来对待,而不是事后才想起的补丁。

再看看谁没在恐慌。那些早就 把无聊的 90% 工作路由到便宜模型做好 grounding 好让 agent 不至于乱抓乱试白烧 token、 并把 agent 保持得足够窄、而不是放任一个全能神级 agent 永远循环下去的团队——他们从一开始就把这笔成本算进去了,因为他们一直把 token 当成它本来就是的真实成本。这场成本恐慌,大体上是给所有没这么做的人的一次清算。

廉价 demo 的时代结束了。现在每一个 AI 产品都得回答那个它本该一开始就回答的问题:它烧掉的 token 值不值得? 这不是危机。这只是数学终于现身了——来得有点晚,而且声音很大。

评论

暂无评论

登录以参与讨论。

做第一个分享想法的人。