全部笔记
Anthropic 用 AI 写了 80% 的代码。但你不是 Anthropic。

2026年6月9日

Anthropic 用 AI 写了 80% 的代码。但你不是 Anthropic。

今年五月,Anthropic 合并进生产环境的代码里,超过 80% 是 Claude 写的。这个数字马上会出现在每一场「程序员要被淘汰了」的争论里,出现在每一次「为什么我们跟不上」的会议里。所以请认真读它,因为它说明的恰恰和大多数人以为的相反。这是一家手握最强模型的公司,把这个模型用在自己身上,再由业内最顶尖的一批工程师把关。百分比不是重点。让 80% 能安全上线的那个东西,才是。

Anthropic 分享了一个确实很惊人的数字:今年五月,它合并进生产环境的代码里,超过 80% 由 Claude 撰写, 而一年多前这个比例还只有个位数的低位。管理层估计,如果把脚本和实验也算进去,能到 90% 以上。如今一个普通的 Anthropic 工程师每天合并的代码量,是 2024 年的八倍

这个数据马上会无处不在——出现在「程序员完蛋了」的论调里,出现在某人质问「为什么你们团队还没到 80%」的会议上。所以值得放慢脚步,认真读一读它,因为诚实的解读指向的方向,几乎和它将被使用的方向完全相反。

幸存者偏差,拉满

是谁产出了那 80%?是地球上唯一一家造出最强编程模型的公司,用的是那个模型,跑在一套为它量身打造的代码库上,再由业内最有能力的一批工程师审查。如果说有谁有资格安全地交付大部分由 AI 写的代码,那正是这支团队。这不是贬低——这正是重点所在。这个数字是在最理想的条件下产出的最理想结果。

你只要把目光移出前沿实验室,立刻就能看清这一点。微软 CEO 把公司里 AI 生成代码的比例放在 30% 左右;Salesforce 也在差不多的区间。这些同样是顶尖的工程组织,可它们还不到 Anthropic 数字的一半。这道差距就是线索。「80%」不是一个你正在落后的、普世的新常态。它是一个特定地方、在几乎无人拥有的优势加持下产出的特定结果。把它当成你必须达到的基准,就好比把彩票中奖者的银行余额当成预期收益来读。

80% 不是成就。审查才是。

标题埋掉的,正是这一部分。生成代码从来都不是难的那一环——我 以前就说过,而在规模化之下,这句话更加成立。把 80% 的 AI 生成代码变成 80% 的 AI 合并代码,靠的是生成之后发生的一切:审查、判断、品味,以及决定什么能进生产环境的那套标准。Anthropic 在这方面底子很厚。大多数地方没有,而且看得出来。

放眼整个行业,瓶颈已经翻转了:AI 生成代码的速度超过了人类审查的速度,而 审查者正在节节败退——被海量代码淹没,被同事合并的「AI 垃圾」搞得焦头烂额,那些同事的生成能力早已超过了自己审核代码的能力。这就是同一个 生产力悖论换了身衣服:把生成速度催到超过你的审查能力,并不会让你更快,只是把失败往下游挪了。Anthropic 能到 80% 并且守住质量,是因为它的审查肌肉能吸收这股洪流。如果你照搬这个百分比却没有相应的审查能力,你得到的不是 Anthropic 的结果——你得到的是一堆没人审过、却挂着你名字的代码积压。

连 Anthropic 自己都没把这当成纯粹的胜利

还有一个细节,应该重新框定整件事。Anthropic 公布 80%,并不只是为了炫耀生产力。它是把这个数字和一段关于 递归自我改进 的讨论一起发布的——AI 越来越多地在构建 AI——同时还附上一个论点:应该有办法在前沿研发加速到超出人类监管之外时 暂停它。发布这个数字的公司,同时也是那个在说「这事推进得够快了,我们应该谨慎」的公司。这不是「裁掉你的工程师」的气场。这是「我们正把越来越多的工作交给模型,而且我们正盯紧它」的气场。

真正该从中学到什么

如果你带团队或写代码,有用的读法几乎和炒作完全相反:

  • 追求的是纪律,不是百分比。 值得改进的数字不是「AI 写了多大比例」,而是「我们能不能审查、理解并为交付出去的东西背书」。先把那个天花板抬高;AI 的占比可以安全地跟在它后面上升。
  • 不要生成超过你审查能力的东西。 AI 代码多到你审不过来,那不是速度,是债务。如果审查是瓶颈——而它通常就是——那么投资就该投在那里,而不是去生成更多。
  • 对跨语境的数据打折扣。 一家前沿实验室的数字,转移到你团队身上的程度,不会比奥运会的分段成绩转移到你晨跑的程度更高。衡量你自己的结果,别去衡量别人的最佳情况。

归根结底

「我们 80% 的代码是 AI 写的」这句话是真的、令人印象深刻,而且几乎完美地被设计成会被误解。它不能证明工程师过时了,也不能证明你的团队落后了。它证明的是:全世界装备最精良的软件组织,用着自己的前沿模型,配上顶尖的审查者和一套专为此目的打造的代码库,可以让模型写下大部分代码——并且依然守住质量这条线

模型负责敲键盘。人,以及围绕他们的那套体系,负责让这一切变得安全的那部分——而那部分,恰恰不是一份订阅就能附赠的。所以别去羡慕那 80%。去构建它底下的东西,那套让这样一个数字成为胜利而非负担的审查与判断。把这个做对,百分比自然会水到渠成。跳过它,那么 80% 的 AI 代码,不过就是 80% 等着发生的事故。

评论

暂无评论

登录以参与讨论。

做第一个分享想法的人。