fedorthinks
全部笔记

ARCHITECTURE · 2026年6月19日

瓶颈搬到了电网

OpenAI 与 NVIDIA 敲定了 10 吉瓦、又与 AMD 敲定了 6 吉瓦;一座 Stargate 数据中心刚在密歇根获批 1.4 吉瓦,无视当地居民的强烈反对。AI 的约束早就不再是模型了。它是电力、土地,以及围绕二者的政治。这重新定义了效率值多少钱,而这正是支配着远比数据中心小得多的系统的同一条规律。

瓶颈搬到了电网

这个月 AI 领域最让人瞠目的数字不是跑分,而是以吉瓦来计量的。 OpenAI 与 NVIDIA 宣布建立合作,部署 10 吉瓦的系统, NVIDIA 将随着每一吉瓦上线投资最高 1000 亿美元。前后几天,OpenAI 又与 AMD 敲定了 另外 6 吉瓦。而 密歇根的一座 Stargate 数据中心 获批取用 1.4 吉瓦 ——无视那些根本没得到听证机会的居民的高声反对。

一吉瓦大约相当于一座满规模核反应堆的输出,或者一座中等城市的用电量。 前沿实验室如今是在按整座城市的用电量来谈判。这告诉你真正的约束 搬到哪里去了。

瓶颈不再是智能了

有一阵子,AI 的限速试剂是模型能力。那已经不是那堵墙了。那堵墙是 电力、土地、散热,以及拿到它们的本地政治。 模型已经准备好做更多的事, 超过了电网能供得起的量。

这就是为什么这些交易谈的是能源而不是算法,为什么摩擦如今出现在 乡镇公用事业委员会这一层、而不是研究实验室。当约束性的限制是 物理基础设施时,游戏就从「谁的模型最聪明」变成了「谁真能供得上电」, 而成本和反弹则落在有真实居民的真实地方。

效率重新成为护城河

下面这部分即使你永远不会去建数据中心也很重要。当电力是稀缺 资源时,每一个你不必去算的 token 都意味着真金白银和真实的瓦特。「 不管什么都甩最大的模型上去」的时代正撞上一张物理账单。

这把那些无聊的工程取舍重新定义成了战略取舍:

  • 把模型选到合适的尺寸。 把容易的那 80% 路由到更小、更便宜的模型并不是抠门, 而是一份能扩展的负载和一份扩展不了的负载之间的差别。
  • 别再重算没变过的东西。 缓存、增量、以及不在每次调用里都把整个世界重发一遍—— 如今都是经济决策,不只是整洁与否的问题。
  • 认真测量每次请求的成本。 当约束是物理性的,赢的是高效的 设计,就像从前赢的是聪明的设计一样。

我是在小得多的规模上学到这一点的——当时我在为同一个世界里的一万名玩家搭建一套实时 系统:瓶颈从来不是 CPU,而是流量——你推送出去的字节。把真正的 约束叫出名字,你才会去优化对的东西。在文明的尺度上,约束就是电网, 同样的纪律照样适用:最便宜的那一瓦,是你压根没花出去的那一瓦。

瓶颈是物理的,所以优势也是

前沿如今被那些你用一句巧妙的 prompt 修不好的东西卡住了:变电站、输电 线路、水、许可,还有那些宁可不在身边安一座数据中心的邻居。这是个比软件 习惯的世界更慢、更硬的世界——而它奖励那个浪费最少的人。

底线

当头条交易以吉瓦计价、并在县一级被争来争去时,模型 就不再是 AI 里稀缺的那部分了。

瓶颈从智能搬到了电力——这又让效率重新成为一种竞争 优势,从数据中心一路下到你每次请求的 token 账单。 找到真正的 约束,然后别再把钱花在推不动它的地方。在这个尺度上,那个约束以六十 赫兹的频率嗡嗡作响。

评论

暂无评论

登录以参与讨论。

做第一个分享想法的人。