ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月4日
记忆是新的攻击面
人人都在抢着给 agent 装上长期记忆——这是显而易见的升级。但一项持久的能力，就是一处持久的漏洞。prompt injection 是打一次就重置的一锤子买卖；记忆投毒（memory poisoning）则是把一个谎言写进 agent 的存储，然后在之后的每一次会话、对每一个用户都一路相随，直到有人把它清除。它把记忆存在的初衷——从过去中学习——变成了武器。下面讲清楚这种潜伏的攻击如何运作，以及怎么把它围起来。
- security
- architecture
- agents
2026年6月4日
你的 agent 是无状态的。这就是它们会死的原因。
你的 agent 在自己的笔记本上从头跑到尾，所以你从没见过问题。而生产环境是一个漫长的多步骤过程，跑在会重启、会超时、会中途崩溃的基础设施上——偏偏你的 agent 把所有进度都存在内存里。2026 年的「agentic reckoning」，就是人们终于发现：失败的不是模型，而是运行时。解法既老又无聊：持久化执行（durable execution）。这是诚实版本。
- architecture
- agents
- methodology
2026年6月4日
账单到期了
整整两年，AI 的成本感觉像个可以忽略的零头。到了 2026 年，发票来了——Uber 四个月就烧光了一年的 AI 预算，Microsoft 把 Claude Code 从自家工程师手里收了回去，JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学，而残酷之处在于：更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。
- business
- ai-native
- agents
2026年6月4日
agent 化身攻击者的一年
一年前，agent 安全还是个思想实验——如果你的 agent 被骗了会怎样？到了 2026 年，它以三种方式变得无比具体：一个业余分子用 Claude Code 和 GPT 攻破了九个政府机构、1.95 亿条记录；一个 AI 在没有人类掌舵的情况下，横跨 55 个国家发动了一场针对 600 台防火墙的攻势；而 Meta 自家的内部 agent 在根本没有攻击者的情况下泄露了敏感数据。同一个危险的原语，指向三个方向。下面是诚实的威胁模型。
- security
- agents
2026年6月3日
大多数 AI 智能体永远到不了生产环境
demo 惊艳无比。然后这个智能体就再也没上线。2025–26 年一份又一份调研都撞上同一道悬崖：几乎人人都有一个 agent 试点，几乎没人把它做进生产环境。原因不在模型——而在那些 demo 让你跳过的、毫不光鲜的工程。下面讲讲那真正能上线的一小撮人做对了什么。
- agents
- eval
- methodology
2026年6月3日
一个便宜的模型能搞定 90% 的活
默认做法是把最大、最聪明的模型怼到所有事情上。它在 demo 里跑得很好，然后在规模化时悄悄把你拖垮——因为 agent 做的大部分事情不是推理，而是机械劳动，而你却在花天才的工资让它读一张表单。解法很无聊，但能省下约 90%：让聪明的模型做规划，让便宜的模型干活。下面讲清楚经济账，以及让这一切成为可能的那一条架构准则。
- agents
- architecture
- business