2026年6月6日
这个月落地了三个前沿模型。我只改了一行代码。
2026 年 6 月,一个月内接连发布三个全新前沿模型——GPT-5.6、Gemini 3.5 Pro 和 Claude Mythos——而 5 月才刚出了两个。对大多数团队来说,这是一台让人焦虑的跑步机:「我们要不要迁移?」而对一支用笨办法搭好架子的团队来说,这是三次免费升级,每次只需改一行配置。模型的疯狂迭代不是要拼命追赶的麻烦,而是你能自动领取的礼物——前提是你早就留好了接住它的那条缝。
看看这个月的发布日历。业界普遍认为 OpenAI 会推出 GPT-5.6——已经 有一份 Codex 日志提到了它,Polymarket 上六月发布的概率接近 89%。 谷歌在 I/O 上确认 Gemini 3.5 Pro「下个月就来」。Anthropic 说 Claude Mythos「未来几周内」上线。这就是一个月内来自三家厂商的三个前沿模型——而它们落地的背景,是 5 月刚发布的 Claude Opus 4.8 和 Gemini 3.5 Flash。
对很多团队来说,这样一份日历让人压力山大。每一次发布都会重新开启那场焦虑的会议:新的更好吗,我们该不该换,工作量有多大,我们是不是落后了?而对我自己的产品来说,这个月这三连发意味着平静得多的事。我读了发布公告,跑了我的评测,然后改了一个配置值。整件事就这么简单。这两种体验之间的差距,完全取决于一个你同样可以做出的架构决策。
这台跑步机是可选的
压力不是模型带来的,是代码和模型的连接方式带来的。如果某个具体模型的名字、API 形态和怪癖被穿插进你整个代码库——被几十处引用,提示词还针对某一家厂商的具体行为做了精调——那么每一次新发布确实就是一个迁移项目。你得去找出所有这些引用,逐一修改,重新测试,然后祈祷。难怪它像一台跑步机:每发布一个模型就是又跑一圈。
但这一切都不是天生如此。把自己焊死在一家厂商上是一种选择,而且是可以避免的选择。模型作为 API 背后的一种大宗商品,其全部意义就在于:你可以在你的应用和背后任意一个模型之间放一层干净的隔层——这样换模型就不再是一个项目,而变成了一项设置。
留好那条缝,把升级收进口袋
这个模式很无聊,而且现在有名字了:模型网关,或者说与厂商无关的隔层。你的代码只对接一个接口。在它背后,一个轻薄的适配器负责映射到你指向的任意厂商。OpenRouter 和 LiteLLM 这类工具存在的全部理由就是充当这条缝——有一种说法说得很到位,OpenRouter 抽象模型厂商的方式,就像 Stripe 抽象了支付处理商一样, 所以你的应用永远不会把单个端点写死。你甚至不需要库;自己写三十行的间接层就能搞定。机制本身不那么重要,重要的是它换来的那个特性:换模型是改一行参数,而不是一次重构。
一旦这条缝存在,整份日历就反转了。GPT-5.6 发布了?把配置指向它,跑一遍评测套件,数字变好就留下,没变好就回退——十分钟,而不是一个迭代周期。Gemini 3.5 Pro 在你那些简单步骤上更便宜? 把便宜的活路由给它,把贵的模型留给难的部分。一个月里的三次发布,就从三场救火变成了三次几乎不费力就能变得更好或更便宜的机会。那种惩罚焊死团队的疯狂迭代,奖励了你。
为什么这只会越来越成立
节奏没有放慢。我们刚刚目睹前沿发布之间的间隔压缩到了以周计,而三家实验室每个月你追我赶,有一份分析说得很直白:单一厂商的锁定 从来没有像现在这样昂贵。 模型进步得越快,能够即刻采纳进步所蕴含的价值就越大——而当那支没法采纳的团队,代价也就越高。
这正是「哪个模型胜出是一种设计坏味道」中很容易被忽略的部分。重点从来不是说模型之间没有差异——它们确实有差异,这个月的三个也会各自在某些方面更强。重点是:那个经得起时间的工程决策,不是挑出赢家,而是把系统搭成让挑选这件事变得便宜、可逆、可持续——这样你就永远不会被上个月的选择绑死。
要点
真正的护城河从来不是某个模型,而是那条缝。这条缝是竞争对手下载不走的东西,是把一份无情的发布日历从焦虑之源,变成一股你能开着自动驾驶领取的免费升级之流。所有人拿到的都是同样的模型;那支在自己的产品和这些模型之间搭好了干净隔层的团队,能在任意一周用上当下最好的那一个,代价只是改一行代码。
所以当下一批三连发到来时——按这个速度,下个月就会来——问题不是「我们押注哪一个」,而是「我们能多快把它们全试一遍」。如果你诚实的答案是「几分钟」,那么你已经赢下了唯一能产生复利的那场比赛。
评论
暂无评论
登录以参与讨论。
做第一个分享想法的人。