ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月2日
构建变便宜了，想法没有。
编程智能体抹掉了几十年来定义软件的那个约束——构建的能力。当构建变便宜，竞争就向上移到那个一直才是真正瓶颈的东西：品味、市场判断，以及敢于交付的胆量。一篇关于现在到底什么才能赢的实战笔记。
- agents
- ai-native
- business
2026年5月17日
真正的 artifact 是 spec，而不是 prompt
当 agent 的行为通过 spec PR 而不是 prompt 改动落地时，团队会像推理代码一样去推理 agent。本文讲它在实践中长什么样，以及为什么行得通。
- agents
- methodology
- specs
2026年5月15日
我在指挥 coding agent，而不是写代码
一篇短文，记录当实现层变成 agent 之后发生了什么变化——什么保持不变、什么消失了，以及新的瓶颈落在哪里。
- agents
- methodology
- ai-native
2026年5月10日
有 eval 才算交付
为什么我拒绝在没有 holdout evaluation set 的情况下交付一个 agent，怎样的 eval 才有用，以及当团队跳过这一步时我反复见到的 failure mode。
- agents
- eval
- methodology