ARCHITECTURE · 2026年6月19日
瓶颈搬到了电网
OpenAI 与 NVIDIA 敲定了 10 吉瓦、又与 AMD 敲定了 6 吉瓦;一座 Stargate 数据中心刚在密歇根获批 1.4 吉瓦,无视当地居民的强烈反对。AI 的约束早就不再是模型了。它是电力、土地,以及围绕二者的政治。这重新定义了效率值多少钱,而这正是支配着远比数据中心小得多的系统的同一条规律。
这个月 AI 领域最让人瞠目的数字不是跑分,而是以吉瓦来计量的。 OpenAI 与 NVIDIA 宣布建立合作,部署 10 吉瓦的系统, NVIDIA 将随着每一吉瓦上线投资最高 1000 亿美元。前后几天,OpenAI 又与 AMD 敲定了 另外 6 吉瓦。而 密歇根的一座 Stargate 数据中心 获批取用 1.4 吉瓦 ——无视那些根本没得到听证机会的居民的高声反对。
一吉瓦大约相当于一座满规模核反应堆的输出,或者一座中等城市的用电量。 前沿实验室如今是在按整座城市的用电量来谈判。这告诉你真正的约束 搬到哪里去了。
瓶颈不再是智能了
有一阵子,AI 的限速试剂是模型能力。那已经不是那堵墙了。那堵墙是 电力、土地、散热,以及拿到它们的本地政治。 模型已经准备好做更多的事, 超过了电网能供得起的量。
这就是为什么这些交易谈的是能源而不是算法,为什么摩擦如今出现在 乡镇公用事业委员会这一层、而不是研究实验室。当约束性的限制是 物理基础设施时,游戏就从「谁的模型最聪明」变成了「谁真能供得上电」, 而成本和反弹则落在有真实居民的真实地方。
效率重新成为护城河
下面这部分即使你永远不会去建数据中心也很重要。当电力是稀缺 资源时,每一个你不必去算的 token 都意味着真金白银和真实的瓦特。「 不管什么都甩最大的模型上去」的时代正撞上一张物理账单。
这把那些无聊的工程取舍重新定义成了战略取舍:
- 把模型选到合适的尺寸。 把容易的那 80% 路由到更小、更便宜的模型并不是抠门, 而是一份能扩展的负载和一份扩展不了的负载之间的差别。
- 别再重算没变过的东西。 缓存、增量、以及不在每次调用里都把整个世界重发一遍—— 如今都是经济决策,不只是整洁与否的问题。
- 认真测量每次请求的成本。 当约束是物理性的,赢的是高效的 设计,就像从前赢的是聪明的设计一样。
我是在小得多的规模上学到这一点的——当时我在为同一个世界里的一万名玩家搭建一套实时 系统:瓶颈从来不是 CPU,而是流量——你推送出去的字节。把真正的 约束叫出名字,你才会去优化对的东西。在文明的尺度上,约束就是电网, 同样的纪律照样适用:最便宜的那一瓦,是你压根没花出去的那一瓦。
瓶颈是物理的,所以优势也是
前沿如今被那些你用一句巧妙的 prompt 修不好的东西卡住了:变电站、输电 线路、水、许可,还有那些宁可不在身边安一座数据中心的邻居。这是个比软件 习惯的世界更慢、更硬的世界——而它奖励那个浪费最少的人。
底线
当头条交易以吉瓦计价、并在县一级被争来争去时,模型 就不再是 AI 里稀缺的那部分了。
瓶颈从智能搬到了电力——这又让效率重新成为一种竞争 优势,从数据中心一路下到你每次请求的 token 账单。 找到真正的 约束,然后别再把钱花在推不动它的地方。在这个尺度上,那个约束以六十 赫兹的频率嗡嗡作响。
评论
暂无评论
登录以参与讨论。
做第一个分享想法的人。