BUSINESS · 2026年7月3日

模型被商品化了。芯片没有。

两年来整场游戏比的都是哪个模型最聪明。这场游戏要结束了：Claude Sonnet 5 以极低的价格达到了接近 Opus 级的质量，各家实验室在拼成本而不是拼智商，而换供应商如今只是改一处配置。当能力层被商品化，护城河就会顺着技术栈往下滑——滑到推理硅片和机架上。OpenAI 刚流片了自己的芯片。这对我们其余在上层搭东西的人意味着什么：你每个 token 的价格地板，是由上面两层、由你永远不会见到的人设定的，所以就照这个来设计。

看看这个季度各家实验室实际上在比的是什么。不是「我们的会推理、他们的不会」。比的是价格。Claude Sonnet 5 交付时带着接近 Opus 级的智能体质量，每百万输入 token 3 美元，对上 Opus 的 5 美元——而且它现在是默认的了。前沿模型正在朝「几乎什么都够用」收敛，它们之间的差距在缩小，而且——就像我一直说的——用一个换另一个是改一处配置，不是重写。

这就是商品化的样子。而当所有人痴迷的那一层变成商品，有意思的钱就挪到别处去了。

当栈顶被抹平，护城河就顺着它往下掉

它掉到了硅片上。就在 Sonnet 5 之前几天，OpenAI 和博通揭晓了 Jalapeño，OpenAI 的第一款定制推理芯片—— 一个从零为 LLM 推理打造的加速器，目标是榨出好得多的每瓦性能。这不是个面子工程。这是一种认知：如果模型是商品，那么持久的优势就在于 比谁都更便宜地把它伺服出来——这意味着要拥有芯片、机架、电力合同以及晶圆产能配额。

模型从来就不是你的护城河。到了 2026 年，它也不再是实验室的护城河了。护城河是那个能把推理跑得每次便宜十分之一美分的人——而这是在一家晶圆厂里决定的，不是在一个提示词里。

如果你在上层搭东西，这意味着什么

你在向一群人租算力，而这群人如今正陷入一场拥有物理层的军备竞赛。你控制不了芯片、控制不了数据中心，也控制不了他们在这之上定的价。所以别再假装 token 价格是一个固定的输入，开始把它当成它本来的样子来对待——一个易变的、由上游控制的变量：

不留情地量体裁衣。 默认应该是那个刚好越过及格线的最小模型，而不是那个手边最大的。先伸手去够小模型，把贵的那个留给真正需要它的调用。
按难度路由，默认走缓存。 90% 用便宜模型，难的那 10% 用强模型，前面挡一个缓存，这样你永远不会为同一个答案付两次钱。成本是一个架构决策，不是一个账单上的惊吓。
让两家供应商都保持热身。 可移植性不只是防一个模型突然停摆的保险——它还是你在这场价格战打下去时追逐最便宜的够用底座的方式。锁死在一家供应商上，这个季度他们需要多少利润你就得吃下多少。
拥有那些不会被商品化的部分。 你的数据、你的评测、你的产品、你的品味。芯片和模型正在变成可互换的公用事业。你围绕它们搭起来的东西，才是唯一不会被商品化的。

归根结底

「哪个模型最聪明」的时代正在收尾，取而代之的是一场关于谁能最便宜地把智能伺服出来的争斗——在你没有席位的晶圆厂和数据中心里打响。没关系。你不需要席位。你需要的是像对待一件价格不由你定的商品那样，去搭建你所租用的东西。

把模型当作可互换的，把 token 价格当作上游的天气。量体裁衣、路由、缓存、保持可移植——然后把你的护城河灌进商品之上的那一层，因为那是唯一属于你的一层。

暂无评论

登录以参与讨论。

做第一个分享想法的人。