笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月14日
AI 编程带来的提速,比你感觉到的要小
在一项受控研究中,经验丰富的开发者在自己的代码库上用 AI 处理复杂任务时,被测出反而更慢了——可他们全程都觉得自己快了 20%。2026 年一次方法更严谨的后续研究,得出的结论接近一个小幅的正收益,而非大收益。与此同时,约 93% 的开发者都在用 AI 工具,可整体生产力几乎没动。这一切并不是说 AI 编程是假的。它说的是:速度的「感觉」和速度的「事实」已经脱钩了,如果你凭感觉来管理,你就会管错。下面教你怎么分辨。
- methodology
- careers
2026年6月14日
一年改三次的 AI 规则
科罗拉多州通过了一部里程碑式的 AI 法律,剑指算法歧视。它本应在 2026 年 2 月生效,随后被推迟到 6 月 30 日。12 月,联邦政府签署了一项命令,要先发制人地架空各州的 AI 法律,并点名了科罗拉多州的这部法律。接着在 2026 年 5 月,科罗拉多州自己又把法律推迟到了 2027 年 1 月,并大幅削减了内容。如果你照着这套规则手册在搭建产品,你的目标一年里挪了三次。你没法照着一部坐不住的法律去搭建——但你可以照着它底下的那条原则去搭建,而那条原则几乎纹丝不动。下面就讲怎么做。
- business
- security
2026年6月14日
会自己猎杀漏洞的 AI
Anthropic 的 Claude Mythos 在每一个主流操作系统和浏览器中都找出了数以千计的零日漏洞——包括 OpenBSD 里一个存在了 27 年的 bug,以及 FFmpeg 里一个潜伏了 16 年的缺陷——并且在超过 83% 的情况下一次就写出了能跑通的攻击代码。它被认定为太危险,不能公开发布;取而代之的是,少数几家巨头在 Project Glasswing 计划下拿到了抢先体验权。这是迄今为止最清晰的一面镜子,照出了 AI 的双刃本质:能在攻击者之前替你找出 bug 的那个工具,同样也能更快地替攻击者找出来。这篇就讲讲该怎么看待它。
- security
2026年6月14日
那个快模型,突然变聪明了
两年来,每次选模型你都得做个取舍:要么又快又便宜,要么又聪明又慢。Gemini 3.5 Flash 刚刚打破了这个规则。这个『Flash』档——本该是便宜又快的那一档——如今在 Artificial Analysis Intelligence Index 上拿下 55 分,领先 Grok 4.3 和 Claude Sonnet 4.6,同时跑出每秒超过 280 个 token 的速度。快模型不再是笨模型。这应该让你重新打开一个大多数团队一年前悄悄冻结的决定:你的默认模型是哪个,它现在还是对的吗?这篇讲讲该怎么想——也包括那个坑。
- ai-native
- business
2026年6月14日
以更低价格回归的「AI 裁员」
Forrester 预测,打着 AI 旗号砍掉的岗位中,有一半会被悄悄重新填补——要么外包到海外,要么以明显更低的薪水回来。55% 的雇主已经在为自己的 AI 裁员后悔。而且在很多情况下,AI 根本没有取代任何人:活儿被送到了海外,却被包装成了自动化。Amazon 的无收银员门店 Just Walk Out 最后被发现严重依赖印度的远程员工盯着摄像头。无论你是打工人还是老实做事的开发者,教训都一样:「我们因为 AI 裁了人」往往讲的是一个关于成本的故事,只是披上了 AI 这件外衣。下面教你怎么读懂它。
- business
- careers
2026年6月14日
你正在运行 12 个智能体。其中一半各自为政。
如今一家公司平均运行约 12 个 AI 智能体,明年还会涨到 20 个——而其中一半完全各自为政,根本不和别的智能体打交道。我们急着往里加智能体,却没来得及把它们连起来,于是大多数企业手里攥着一抽屉聪明的工具,每个只看得见工作的一小片,没有一个看得见全局。价值从来不在于拥有更多智能体,而在于它们之间的连接,而这恰恰是几乎没人去搭建的部分。下面说说这道鸿沟是怎么裂开的,又该怎么把它补上。
- agents
- business