BUSINESS · 2026年7月3日
模型被商品化了。芯片没有。
两年来整场游戏比的都是哪个模型最聪明。这场游戏要结束了:Claude Sonnet 5 以极低的价格达到了接近 Opus 级的质量,各家实验室在拼成本而不是拼智商,而换供应商如今只是改一处配置。当能力层被商品化,护城河就会顺着技术栈往下滑——滑到推理硅片和机架上。OpenAI 刚流片了自己的芯片。这对我们其余在上层搭东西的人意味着什么:你每个 token 的价格地板,是由上面两层、由你永远不会见到的人设定的,所以就照这个来设计。
看看这个季度各家实验室实际上在比的是什么。不是「我们的会推理、他们的不会」。比的是价格。Claude Sonnet 5 交付时带着接近 Opus 级的智能体质量,每百万输入 token 3 美元,对上 Opus 的 5 美元——而且它现在是 默认 的了。前沿模型正在朝「几乎什么都够用」收敛,它们之间的差距在缩小,而且——就像我一直说的——用一个换另一个是改一处配置,不是重写。
这就是商品化的样子。而当所有人痴迷的那一层变成商品,有意思的钱就挪到别处去了。
当栈顶被抹平,护城河就顺着它往下掉
它掉到了硅片上。就在 Sonnet 5 之前几天,OpenAI 和博通 揭晓了 Jalapeño,OpenAI 的第一款定制推理芯片—— 一个从零为 LLM 推理打造的加速器,目标是榨出好得多的每瓦性能。这不是个面子工程。这是一种认知:如果模型是商品,那么持久的优势就在于 比谁都更便宜地把它伺服出来——这意味着要拥有芯片、机架、电力合同以及晶圆产能配额。
模型从来就不是你的护城河。到了 2026 年,它也不再是实验室的护城河了。护城河是那个能把推理跑得每次便宜十分之一美分的人——而这是在一家晶圆厂里决定的,不是在一个提示词里。
如果你在上层搭东西,这意味着什么
你在向一群人租算力,而这群人如今正陷入一场拥有物理层的军备竞赛。你控制不了芯片、控制不了数据中心,也控制不了他们在这之上定的价。所以别再假装 token 价格是一个固定的输入,开始把它当成它本来的样子来对待——一个易变的、由上游控制的变量:
- 不留情地量体裁衣。 默认应该是那个刚好越过及格线的最小模型,而不是那个手边最大的。先伸手去够小模型,把贵的那个留给真正需要它的调用。
- 按难度路由,默认走缓存。 90% 用便宜模型,难的那 10% 用强模型,前面挡一个缓存,这样你永远不会为同一个答案付两次钱。成本是一个架构决策,不是一个账单上的惊吓。
- 让两家供应商都保持热身。 可移植性不只是防一个模型突然停摆的保险——它还是你在这场价格战打下去时追逐最便宜的够用底座的方式。锁死在一家供应商上,这个季度他们需要多少利润你就得吃下多少。
- 拥有那些不会被商品化的部分。 你的数据、你的评测、你的产品、你的品味。芯片和模型正在变成可互换的公用事业。你 围绕 它们搭起来的东西,才是唯一不会被商品化的。
归根结底
「哪个模型最聪明」的时代正在收尾,取而代之的是一场关于谁能最便宜地把智能伺服出来的争斗——在你没有席位的晶圆厂和数据中心里打响。没关系。你不需要席位。你需要的是像对待一件价格不由你定的商品那样,去搭建你所租用的东西。
把模型当作可互换的,把 token 价格当作上游的天气。量体裁衣、路由、缓存、保持可移植——然后把你的护城河灌进商品之上的那一层,因为那是唯一属于你的一层。
评论
暂无评论
登录以参与讨论。
做第一个分享想法的人。