笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月3日
我不再逐一批准 agent 的决定了,现在我只是看着它们。
刚开始做 agent 的时候,我会批准它的每一个动作——感觉这样很负责。其实并不是;批到第三十个'yes'时,我已经在橡皮图章式地批准了,这比完全没有检查点更糟。真正的监督不是经手每一个决定,而是制定策略、观察结果。这就是我从人在环内到人在环上的转变,以及让放手真正变得安全的那套架构。
- agents
- methodology
- ai-native
2026年6月3日
锚定不是一个功能。它是一种约束。
LLM 天生就是个猜测者——它永远会编造内容,而你无法用 prompt 把这一点消除。唯一可靠的办法是架构层面的:让一个确定性的数据源掌管事实,把模型降级为一个永远不许自行撰写事实的复述者。'加个 RAG' 并不等于这件事。这里讲清楚两者的区别,以及为什么这是一条分界线——一边是听起来自信的 AI,一边是你能信任的 AI。
- architecture
- agents
- methodology
2026年6月3日
一个什么都干的 agent,什么都干不好
当一个 agent 不够好用时,本能反应是给它加东西——再加一个工具、更多指令、更多上下文。可这只会让它更糟,而且这是被量化出来的,不是品味问题。解药是工程里最古老的那条规则:单一职责。一个 agent,一份职责,少数几个工具,简短的上下文。一个上帝智能体就是一万行的函数披了件风衣——它失败的原因一模一样。
- agents
- architecture
- methodology
2026年6月3日
现在,编排就是架构
把一个 god-agent(上帝智能体)拆成十个专注的小 agent,你就把一个模型问题换成了一个系统问题:现在它们必须协同工作,而协调比任何单个 agent 都更难。大多数团队把这套连线当成管道。它不是——它就是架构,它是一个分布式系统,并且会像分布式系统那样崩溃。本文讲清楚编排到底是什么、它如何崩坏,以及为什么在你能说清瓶颈在哪之前,不该急着去用它。
- agents
- architecture
- methodology
2026年6月3日
prompt engineering 已死。我从来没做过它。
整个行业花了两年时间,寻找对着模型念的魔法咒语。如今它正悄悄宣告 prompt engineering 已死,转而用 context engineering 和 harness engineering 取而代之。但问题在于:这些根本不是什么新把戏——它们就是工程,是真正搞系统的人一直在做的工作。为什么措辞从来不是重点,以及究竟是什么让一个 agent 能真正跑起来。
- agents
- methodology
- ai-native
2026年6月3日
模型从来都不是你的护城河
如今一个能跑在笔记本上的模型,得分已经和最强的闭源前沿模型相差几个百分点以内。这听上去像是惊天动地的大新闻,但对任何做产品的人来说,正确的反应就是耸耸肩——因为模型从来都不是守护你的东西。本文讲清楚:为什么前沿能力变免费几乎不改变你该如何做产品,以及什么才真正能复利成优势。
- ai-native
- business
- agents