笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月2日
构建变便宜了,想法没有。
编程智能体抹掉了几十年来定义软件的那个约束——构建的能力。当构建变便宜,竞争就向上移到那个一直才是真正瓶颈的东西:品味、市场判断,以及敢于交付的胆量。一篇关于现在到底什么才能赢的实战笔记。
- agents
- ai-native
- business
2026年5月17日
真正的 artifact 是 spec,而不是 prompt
当 agent 的行为通过 spec PR 而不是 prompt 改动落地时,团队会像推理代码一样去推理 agent。本文讲它在实践中长什么样,以及为什么行得通。
- agents
- methodology
- specs
2026年5月15日
我在指挥 coding agent,而不是写代码
一篇短文,记录当实现层变成 agent 之后发生了什么变化——什么保持不变、什么消失了,以及新的瓶颈落在哪里。
- agents
- methodology
- ai-native
2026年5月10日
有 eval 才算交付
为什么我拒绝在没有 holdout evaluation set 的情况下交付一个 agent,怎样的 eval 才有用,以及当团队跳过这一步时我反复见到的 failure mode。
- agents
- eval
- methodology