笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月3日
spec 才是源。prompt 只是用完即弃的边角料。
在一份由 agent 编写的代码库里,什么才是“源代码”?不是生成出来的代码——那现在只是构建产物,就像编译出来的二进制文件。也不是 prompt——那只是你划着用来启动构建、然后随手丢掉的一根火柴。真正持久、由你撰写、拥有、版本化并审查的东西,是 spec。这个层级关系已经翻转,而大多数人还在打磨那个本该扔掉的部分。
- agents
- specs
- methodology
2026年6月3日
你的 agent 信任工具描述。漏洞就出在这里。
对语言模型来说,你给它的数据和一条指令之间没有区别——它把一切都当作可能要执行的命令来读。这一个事实就是 AI agent 安全的全部。本文讲清楚它如何把一个有用的工具变成数据外泄的通道、为什么 prompt 修不了它,以及那条唯一能告诉你 agent 何时真正危险的结构性规则——致命三要素(lethal trifecta)。
- agents
- security
- methodology
2026年6月2日
廉价的代码才是最贵的代码
修改软件的成本不是一个常数——它是一条曲线,而这条曲线的形状由你的架构决定。跳过 SOLID、DRY、KISS 和 DI 并不能省钱,只是把账单挪到以后,还要加上利息。下面就用数字来讲讲这背后的经济账。
- architecture
- methodology
- business
2026年5月17日
真正的 artifact 是 spec,而不是 prompt
当 agent 的行为通过 spec PR 而不是 prompt 改动落地时,团队会像推理代码一样去推理 agent。本文讲它在实践中长什么样,以及为什么行得通。
- agents
- methodology
- specs
2026年5月15日
我在指挥 coding agent,而不是写代码
一篇短文,记录当实现层变成 agent 之后发生了什么变化——什么保持不变、什么消失了,以及新的瓶颈落在哪里。
- agents
- methodology
- ai-native
2026年5月10日
有 eval 才算交付
为什么我拒绝在没有 holdout evaluation set 的情况下交付一个 agent,怎样的 eval 才有用,以及当团队跳过这一步时我反复见到的 failure mode。
- agents
- eval
- methodology