ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月3日
我不再逐一批准 agent 的决定了，现在我只是看着它们。
刚开始做 agent 的时候，我会批准它的每一个动作——感觉这样很负责。其实并不是；批到第三十个'yes'时，我已经在橡皮图章式地批准了，这比完全没有检查点更糟。真正的监督不是经手每一个决定，而是制定策略、观察结果。这就是我从人在环内到人在环上的转变，以及让放手真正变得安全的那套架构。
- agents
- methodology
- ai-native
2026年6月3日
锚定不是一个功能。它是一种约束。
LLM 天生就是个猜测者——它永远会编造内容，而你无法用 prompt 把这一点消除。唯一可靠的办法是架构层面的：让一个确定性的数据源掌管事实，把模型降级为一个永远不许自行撰写事实的复述者。'加个 RAG' 并不等于这件事。这里讲清楚两者的区别，以及为什么这是一条分界线——一边是听起来自信的 AI，一边是你能信任的 AI。
- architecture
- agents
- methodology
2026年6月3日
一个什么都干的 agent，什么都干不好
当一个 agent 不够好用时，本能反应是给它加东西——再加一个工具、更多指令、更多上下文。可这只会让它更糟，而且这是被量化出来的，不是品味问题。解药是工程里最古老的那条规则：单一职责。一个 agent，一份职责，少数几个工具，简短的上下文。一个上帝智能体就是一万行的函数披了件风衣——它失败的原因一模一样。
- agents
- architecture
- methodology
2026年6月3日
现在，编排就是架构
把一个 god-agent（上帝智能体）拆成十个专注的小 agent，你就把一个模型问题换成了一个系统问题：现在它们必须协同工作，而协调比任何单个 agent 都更难。大多数团队把这套连线当成管道。它不是——它就是架构，它是一个分布式系统，并且会像分布式系统那样崩溃。本文讲清楚编排到底是什么、它如何崩坏，以及为什么在你能说清瓶颈在哪之前，不该急着去用它。
- agents
- architecture
- methodology
2026年6月3日
prompt engineering 已死。我从来没做过它。
整个行业花了两年时间，寻找对着模型念的魔法咒语。如今它正悄悄宣告 prompt engineering 已死，转而用 context engineering 和 harness engineering 取而代之。但问题在于：这些根本不是什么新把戏——它们就是工程，是真正搞系统的人一直在做的工作。为什么措辞从来不是重点，以及究竟是什么让一个 agent 能真正跑起来。
- agents
- methodology
- ai-native
2026年6月3日
模型从来都不是你的护城河
如今一个能跑在笔记本上的模型，得分已经和最强的闭源前沿模型相差几个百分点以内。这听上去像是惊天动地的大新闻，但对任何做产品的人来说，正确的反应就是耸耸肩——因为模型从来都不是守护你的东西。本文讲清楚：为什么前沿能力变免费几乎不改变你该如何做产品，以及什么才真正能复利成优势。
- ai-native
- business
- agents