AI-NATIVE · 2026年6月4日

各大实验室现在拼的是价格，而不是 IQ

过去两年，旗舰模型发布会的主标题只有一个：我们最聪明，看我们刷爆的基准测试。到了 Microsoft Build 2026，标题变了——质量和 Opus 同一档，但每美元的输出多了约 10 倍，token 还少用 60%。炫耀的重点从 IQ 转向了效率，整个行业都在围绕价格而非峰值能力重新洗牌。本文讲清楚这条轴线为什么翻转，以及如果你在做产品，这意味着什么。

过去两年，旗舰模型的发布主标题永远只有一个：*我们最聪明。*看，这是我们登顶的基准测试，这是我们以几个百分点险胜的对手。智商就是整个记分牌。到了 Microsoft 2026 年的 Build 大会，标题变了，而这个变化本身就是故事。

Microsoft 到底在炫耀什么

Microsoft 公布了它的首批自研模型，领衔的是一款推理模型 MAI-Thinking-1，在基准测试上表现得相当不错——AIME 拿到 97%，SWE-Bench Pro 拿到 53%，大致与 Opus 并驾齐驱。但请注意，能力数字并不是它的卖点。卖点是价格。它配套的编程模型 MAI-Code-1-Flash，能用最多 60% 更少的 token 解决更难的问题 ——更低延迟、更低成本，也就是 Microsoft 反复强调的“return on token”（每 token 的回报）。而且 Microsoft 预测，相比 GPT-5.5，它能实现 每美元输出 token 提升 10 倍。炫耀的口径从“比你更聪明”变成了“同样质量，成本只要十分之一”。

这条轴线为什么翻转

有两股力量把竞争从 IQ 这条轴线推到了价格这条轴线上，这两点我都写过。

第一股是成本恐慌。当企业用四个月就烧掉了一整年的 AI 预算，“同样质量便宜 10 倍”才是能成交的那句话——而不是“在某个财务部门根本没听说过的基准测试上高出两分”。成本成了那个约束性的瓶颈，于是成本也就成了各家实验室主打的东西。

第二股是智能正在变成大路货。当一个免费的开放权重模型已经逼近前沿、只差几个百分点时，略微更聪明几乎一文不值——但在同样质量下大幅更便宜，则价值连城。说得直白点：Google 表示它的 Gemini 3.5 Flash 可以为企业每年省下超过 10 亿美元，而它便宜是出于结构性原因——Google 用自家芯片，加上一个庞大到能随规模扩张而持续提升效率的 token 飞轮。10 亿美元这个标题，比基准测试上的一分要好看得多。

暂无评论

登录以参与讨论。

做第一个分享想法的人。

各大实验室现在拼的是价格，而不是 IQ

Microsoft 到底在炫耀什么

这条轴线为什么翻转

整个行业都在围绕价格重新洗牌

如果你在做产品，这意味着什么

一个诚实的提醒

评论