Все заметки
Агенты, которые помнят

11 июня 2026 г.

Агенты, которые помнят

Главный прорыв агентов в 2026-м — не более умная модель, а память. ReasoningBank от Google позволяет агенту учиться на своих успехах и провалах, хранить рассуждения и измеримо становиться лучше со временем. Это скачок от инструмента, который сбрасывается каждое утро, к коллеге, который накапливает. Но у памяти есть второе лезвие: она превращает любую ошибку в постоянную. Неверный факт, отравленная инструкция или тихо устаревшее убеждение теперь переживают сессии и бьют по вам позже. Память — не фича, которую включают. Это корпус, которым надо управлять.

Самое важное, что происходит с агентами прямо сейчас, — не модель побольше. Это память — и исследование Google делает сдвиг конкретным. ReasoningBank позволяет агенту учиться на собственном опыте: он превращает и успешные, и провальные прогоны в переиспользуемые стратегии рассуждения, хранит их и извлекает, чтобы направлять будущие решения. На бенчмарках веба и программной инженерии это дало до 34% лучших результатов при 16% меньшем числе шагов — агент, становящийся лучше, чем больше работает.

Вдумайтесь, что это меняет. До сих пор большинство агентов были амнезиаками: каждый прогон с нуля, тяжело добытый урок прошлой недели забыт, та же ошибка снова доступна. Память — это скачок от инструмента, сбрасывающегося каждое утро, к чему-то, что накапливает, — к коллеге, который помнит, что сработало, а не к незнакомцу, которого онбордишь каждую сессию. Это правда самое волнующее развитие в агентах за год. И у него есть второе лезвие, такое же острое.

Память даёт агентам обучение — и постоянное, атакуемое убеждение

Вот загвоздка, которую не кладут на слайд запуска. Та же черта, что делает память мощной, — она сохраняется и влияет на будущее поведение, — ровно та, что делает её опасной. Ошибки агента без состояния умирают, когда заканчивается разговор. Ошибки помнящего агента въезжают жить. Неверный факт, плохая стратегия, вредоносная инструкция — попав в память, переживают сессии и формируют решения дни и недели спустя.

Это не теория. Исследователи безопасности теперь ставят отравление памяти в топ агентных рисков 2026: в отличие от prompt-инъекции, которая кончается с чатом, отравленная память сажает инструкции, исполняющиеся позже, запускаемые каким-то несвязанным взаимодействием, с долей успеха инъекции в исследованиях выше 80%, иногда за 95%. Вы дали агенту способность учиться, а это способность быть обученным — кем угодно, кто может дотянуться до его памяти.

Более тихая опасность — устаревание, а не саботаж

Драматичная версия — атакующий. Версия, которая реально вас укусит, куда обыденнее: память, что была правдой и тихо устарела. Как формулирует один разбор, часто извлекаемая память о работодателе пользователя точна, пока он не сменит работу, — после чего она уверенно неверна, а агент не подозревает. Устаревшие определения, термин из глоссария, которым никто не владеет, метрика, которую две системы считают по-разному, — это запоминается, извлекается и применяется, давая выводы, что выглядят верными, проходят ревью и информируют решения, которые никто не отыграет назад.

Вот ловушка памяти агента: она хранит не просто знание, а уверенность. Агент не помнит «это было верно в марте». Он помнит это как верное, точка, и действует на этом в июне. Память делает агента способнее и увереннее — и эти двое стареют не с одной скоростью.

Память — это корпус, которым управляют, а не тумблер

Ментальный сдвиг — в этом вся суть. Мы привыкли думать об агенте как о модели плюс промпт. Как только у него есть память, вы добавили третью вещь — накапливающийся склад убеждений, — и этим складом надо управлять, как любыми данными, которым вы доверили бы принимать решения. Несколько принципов:

  • Курируйте то, что входит. Не каждое взаимодействие достойно стать прочной памятью. Сканируйте и проверяйте перед записью — непроверенная запись это как неверный факт или подсаженная инструкция становится постоянной.
  • Ставьте провенанс и права на воспоминания. Откуда это убеждение и доверен ли его источник? Память, записанная недоверенным вводом, не должна нести тот же вес, что проверенная вами. Это дисциплина identity и доступа, применённая к тому, что агент знает, а не только к чему он может дотянуться.
  • Считайте память скоропортящейся. Оценивайте свежесть, ловите дрейф и истекайте или перепроверяйте убеждения, которые стареют. Факт, который был верен, — не факт, который верен; стройте под это.
  • Не давайте памяти агента быть его единственным судьёй. Запомненное «этот подход сработал» — это всё ещё заявление, а не проверенный результат: заземляйте значимые решения на что-то текущее и внешнее, а не только на то, что агент помнит.

Суть

Память — это апгрейд, который агентам был нужен, чтобы перестать быть умными амнезиаками и начать быть полезными во времени, — и ReasoningBank показывает, сколько это покупает, когда агент учится на провалах, а не только на победах. Эта часть реальна и стоит погони. Но тот же шаг, что даёт агенту становиться лучше, даёт ему и становиться постоянно неправым, нарочно или по небрежности, так, как забывчивый агент никогда не мог.

Так что когда даёте агенту память, дайте ему и библиотекаря. Решайте, что стоит помнить, откуда каждое убеждение и когда оно истекает, — потому что агент, который помнит всё, доверяет всему одинаково и никогда не забывает то, что перестало быть правдой, не умнее. Он просто уверенно устарел, в масштабе, навсегда. Будущее агентов — память. Дисциплина, делающая её безопасной, — управлять тем, во что им позволено верить.

Комментарии

Пока нет комментариев

Войдите, чтобы участвовать в разговоре.

Будьте первым, кто оставит мысль.