ZH
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
RSS →
2026年6月3日
对语言模型来说,你给它的数据和一条指令之间没有区别——它把一切都当作可能要执行的命令来读。这一个事实就是 AI agent 安全的全部。本文讲清楚它如何把一个有用的工具变成数据外泄的通道、为什么 prompt 修不了它,以及那条唯一能告诉你 agent 何时真正危险的结构性规则——致命三要素(lethal trifecta)。