ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月14日
AI 编程带来的提速，比你感觉到的要小
在一项受控研究中，经验丰富的开发者在自己的代码库上用 AI 处理复杂任务时，被测出反而更慢了——可他们全程都觉得自己快了 20%。2026 年一次方法更严谨的后续研究，得出的结论接近一个小幅的正收益，而非大收益。与此同时，约 93% 的开发者都在用 AI 工具，可整体生产力几乎没动。这一切并不是说 AI 编程是假的。它说的是：速度的「感觉」和速度的「事实」已经脱钩了，如果你凭感觉来管理，你就会管错。下面教你怎么分辨。
- methodology
- careers
2026年6月14日
一年改三次的 AI 规则
科罗拉多州通过了一部里程碑式的 AI 法律，剑指算法歧视。它本应在 2026 年 2 月生效，随后被推迟到 6 月 30 日。12 月，联邦政府签署了一项命令，要先发制人地架空各州的 AI 法律，并点名了科罗拉多州的这部法律。接着在 2026 年 5 月，科罗拉多州自己又把法律推迟到了 2027 年 1 月，并大幅削减了内容。如果你照着这套规则手册在搭建产品，你的目标一年里挪了三次。你没法照着一部坐不住的法律去搭建——但你可以照着它底下的那条原则去搭建，而那条原则几乎纹丝不动。下面就讲怎么做。
- business
- security
2026年6月14日
会自己猎杀漏洞的 AI
Anthropic 的 Claude Mythos 在每一个主流操作系统和浏览器中都找出了数以千计的零日漏洞——包括 OpenBSD 里一个存在了 27 年的 bug，以及 FFmpeg 里一个潜伏了 16 年的缺陷——并且在超过 83% 的情况下一次就写出了能跑通的攻击代码。它被认定为太危险，不能公开发布；取而代之的是，少数几家巨头在 Project Glasswing 计划下拿到了抢先体验权。这是迄今为止最清晰的一面镜子，照出了 AI 的双刃本质：能在攻击者之前替你找出 bug 的那个工具，同样也能更快地替攻击者找出来。这篇就讲讲该怎么看待它。
- security
2026年6月14日
那个快模型，突然变聪明了
两年来，每次选模型你都得做个取舍：要么又快又便宜，要么又聪明又慢。Gemini 3.5 Flash 刚刚打破了这个规则。这个『Flash』档——本该是便宜又快的那一档——如今在 Artificial Analysis Intelligence Index 上拿下 55 分，领先 Grok 4.3 和 Claude Sonnet 4.6，同时跑出每秒超过 280 个 token 的速度。快模型不再是笨模型。这应该让你重新打开一个大多数团队一年前悄悄冻结的决定：你的默认模型是哪个，它现在还是对的吗？这篇讲讲该怎么想——也包括那个坑。
- ai-native
- business
2026年6月14日
以更低价格回归的「AI 裁员」
Forrester 预测，打着 AI 旗号砍掉的岗位中，有一半会被悄悄重新填补——要么外包到海外，要么以明显更低的薪水回来。55% 的雇主已经在为自己的 AI 裁员后悔。而且在很多情况下，AI 根本没有取代任何人：活儿被送到了海外，却被包装成了自动化。Amazon 的无收银员门店 Just Walk Out 最后被发现严重依赖印度的远程员工盯着摄像头。无论你是打工人还是老实做事的开发者，教训都一样：「我们因为 AI 裁了人」往往讲的是一个关于成本的故事，只是披上了 AI 这件外衣。下面教你怎么读懂它。
- business
- careers
2026年6月14日
你正在运行 12 个智能体。其中一半各自为政。
如今一家公司平均运行约 12 个 AI 智能体，明年还会涨到 20 个——而其中一半完全各自为政，根本不和别的智能体打交道。我们急着往里加智能体，却没来得及把它们连起来，于是大多数企业手里攥着一抽屉聪明的工具，每个只看得见工作的一小片，没有一个看得见全局。价值从来不在于拥有更多智能体，而在于它们之间的连接，而这恰恰是几乎没人去搭建的部分。下面说说这道鸿沟是怎么裂开的，又该怎么把它补上。
- agents
- business