AI-NATIVE · 2026年6月11日

会记忆的智能体

2026 年智能体最大的突破不是更聪明的模型，而是记忆。谷歌的 ReasoningBank 让智能体从自己的成败中学习，把推理过程存下来，并随着时间推移变得越来越强。这是一次跃迁：从每天早上重置的工具，变成一个会复利成长的同事。但记忆有第二面刃：它把每一个错误都变成长期错误。一个错误的事实、一条被投毒的指令，或者一个悄悄过期的认知，如今会跨会话存活下来，日后反噬你。记忆不是一个开关，而是一个你必须治理的语料库。

眼下智能体身上最重要的变化，不是更大的模型，而是记忆——谷歌的一项研究让这个转变变得实在起来。ReasoningBank 让智能体能够从自己的经验中学习：它把成功和失败的运行都转化为可复用的推理策略，存下来，再在未来的决策中取出来指导自己。在网页和软件工程的多项基准测试中，这带来了最高 34% 的效果提升，同时步骤减少 16%—— 一个干得越多就越强的智能体。

停下来想想这意味着什么。到现在为止，大多数智能体都是失忆症患者：每次运行都从零开始，上周辛苦换来的教训忘得一干二净，同一个错误随时可以再犯一遍。记忆是一次跃迁——从每天早上重置的工具，变成一个会复利成长的东西：一个记得什么管用的同事，而不是一个每次会话都要重新带教的陌生人。这确实是今年智能体领域最让人兴奋的进展。而它同样带着第二面刃，一样锋利。

记忆给了智能体学习能力——也给了它一个持久、可被攻击的认知

这是没人会写在发布会幻灯片上的隐患。让记忆变得强大的那个特性——它会持续存在并影响未来行为——恰恰也是让它危险的那个特性。无状态智能体的错误会在对话结束时一起消亡。有记忆的智能体的错误则会住进来。一个错误的事实、一条糟糕的策略、一条恶意的指令——一旦进了记忆，它就会跨会话存活，并在几天甚至几周后左右决策。

这不是空谈。安全研究者现在已经把记忆投毒列为 2026 年最严重的智能体风险之一：与随聊天一起结束的提示注入不同，被投毒的记忆埋下的指令会在日后执行，由某次毫不相关的交互触发，而研究中的注入成功率高达 80% 以上，有时超过 95%。你赋予了智能体学习的能力，也就是被教的能力——任何能触及它记忆的人都能教它。

更隐蔽的危险是过期，而非蓄意破坏

戏剧化的版本是攻击者。真正会咬你一口的版本要无趣得多：曾经为真、却悄悄过期的记忆。正如一篇分析所说，一条关于用户雇主的高频检索记忆在他换工作之前都是准确的——而换工作那一刻起，它就理直气壮地错了，智能体却浑然不知。过期的定义、一个没人负责的术语表条目、一个被两个系统算法不同的指标——这些被记住、被取出、被据以行动，产出看起来没问题、能通过审查、还会影响那些没人能撤回的决策。

这就是智能体记忆的陷阱：它存的不只是知识，还有笃定。智能体不会记成「这在三月份是对的」。它把这件事记成对的，没有限定，然后在六月份据此行动。记忆让智能体更有能力，也更有把握——而这两者衰减的速度并不一样。

记忆是一个需要治理的语料库，而不是一个可以拨动的开关

观念上的转变才是关键。我们习惯把智能体理解为模型加提示。一旦它有了记忆，你就加进了第三样东西——一个不断累积的认知库——而这个库需要像任何你会用来做决策的数据一样去治理。由此引出几条原则：

管好进去的东西。 不是每次交互都配得上变成一条持久记忆。写入前先扫描、先核实——一次不加检查的写入，就是错误事实或被埋指令变成永久存在的途径。
给记忆加上来源和权限。 这个认知从哪来，它的来源可信吗？由不可信输入写入的记忆，不该和你核实过的记忆有同等分量。这就是身份与访问的纪律，只不过用在智能体所知道的东西上，而不只是它能触及的东西上。
把记忆当成有保质期的东西。 给新鲜度打分，检测漂移，让过期的认知失效或重新核验。曾经为真的事实不等于现在为真的事实；按这个前提去设计。
别让智能体的记忆成为自己唯一的裁判。 一条记下来的「这个办法管用」仍然只是一个声称，而不是经过验证的结果——重大决策要落在当下的、外部的依据上，而不只是智能体回想起来的东西。

归根结底

记忆是智能体所需要的那次升级，让它们不再是聪明的失忆者，而开始随时间真正派上用场——ReasoningBank 展示了当智能体从失败而非只从胜利中学习时，这能带来多少回报。这部分是真实的，值得追求。但让智能体变强的同一步，也让它能够持久地出错，无论是被人故意为之还是出于疏忽，以一种健忘的智能体永远做不到的方式出错。

所以当你给智能体一个记忆时，也给它配一个图书管理员。决定什么值得记住、每个认知从哪来、它何时过期——因为一个记住一切、对一切一视同仁地信任、永远忘不掉已经不再为真之事的智能体，并不更聪明。它只是理直气壮地过时，规模化地，永远如此。智能体的未来是记忆。让它安全的纪律，是治理它们被允许相信的东西。

暂无评论

登录以参与讨论。

做第一个分享想法的人。