关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
RSS →
2026年5月15日
一篇短文,记录当实现层变成 agent 之后发生了什么变化——什么保持不变、什么消失了,以及新的瓶颈落在哪里。
2026年5月10日
为什么我拒绝在没有 holdout evaluation set 的情况下交付一个 agent,怎样的 eval 才有用,以及当团队跳过这一步时我反复见到的 failure mode。