11 de junio de 2026
Agentes que recuerdan
El gran salto de los agentes en 2026 no es un modelo más inteligente: es la memoria. ReasoningBank de Google permite que un agente aprenda de sus propios aciertos y errores, guarde el razonamiento y mejore de forma medible con el tiempo. Ese es el salto de una herramienta que se reinicia cada mañana a un colega que va sumando. Pero la memoria tiene un segundo filo: convierte cada error en uno permanente. Un dato equivocado, una instrucción envenenada o una creencia que quedó obsoleta en silencio ahora sobrevive entre sesiones y actúa sobre ti más tarde. La memoria no es una función que enciendes. Es un corpus que tienes que gobernar.
Lo más importante que les está pasando a los agentes ahora mismo no es un modelo más grande. Es la memoria, y una investigación de Google hace concreto el cambio. ReasoningBank permite que un agente aprenda de su propia experiencia: convierte tanto las corridas exitosas como las fallidas en estrategias de razonamiento reutilizables, las guarda y las recupera para guiar decisiones futuras. En pruebas de referencia de web e ingeniería de software, eso produjo hasta 34% mejores resultados con 16% menos pasos: un agente que mejora mientras más trabaja.
Detente a pensar en lo que eso cambia. Hasta ahora, la mayoría de los agentes han sido amnésicos: cada corrida empieza desde cero, la lección difícil de la semana pasada olvidada, el mismo error disponible para volver a cometerse. La memoria es el salto de una herramienta que se reinicia cada mañana a algo que va sumando: un colega que recuerda lo que funcionó, no un desconocido al que vuelves a poner al día en cada sesión. Es genuinamente el avance más emocionante en agentes este año. Y viene con un segundo filo igual de afilado.
La memoria les da aprendizaje a los agentes, y una creencia persistente y atacable
Aquí está la trampa que nadie pone en la diapositiva de lanzamiento. La misma propiedad que hace poderosa a la memoria —que persiste e influye en el comportamiento futuro— es exactamente lo que la hace peligrosa. Los errores de un agente sin estado mueren cuando termina la conversación. Los errores de un agente que recuerda se mudan a vivir contigo. Un dato equivocado, una mala estrategia, una instrucción maliciosa: una vez que está en la memoria, sobrevive entre sesiones y moldea decisiones días o semanas después.
Esto no es teórico. Los investigadores de seguridad ya ubican el envenenamiento de memoria entre los principales riesgos agénticos de 2026: a diferencia de la inyección de prompts, que termina con el chat, la memoria envenenada planta instrucciones que se ejecutan después, disparadas por alguna interacción no relacionada, con tasas de éxito de inyección que en los estudios superan el 80%, a veces más del 95%. Le diste al agente la capacidad de aprender, que es la capacidad de ser enseñado, por cualquiera que pueda llegar a su memoria.
El peligro más silencioso es la obsolescencia, no el sabotaje
La versión dramática es el atacante. La versión que de verdad te va a morder es mucho más aburrida: memoria que era cierta y quedó obsoleta en silencio. Como lo plantea un análisis, una memoria muy consultada sobre el empleador de un usuario es precisa hasta que cambia de trabajo, momento en el que está confiadamente equivocada, y el agente no tiene idea. Definiciones obsoletas, un término de glosario que nadie posee, una métrica que dos sistemas calculan de forma distinta: estas se recuerdan, se recuperan y se actúa sobre ellas, produciendo resultados que se ven correctos, pasan la revisión e informan decisiones que nadie puede deshacer.
Esa es la trampa de la memoria de los agentes: no solo guarda conocimiento, guarda confianza. El agente no recuerda «esto era cierto en marzo». Lo recuerda como cierto, punto, y actúa sobre ello en junio. La memoria hace a un agente más capaz y más seguro, y esas dos cosas no se deterioran al mismo ritmo.
La memoria es un corpus que gobiernas, no un interruptor que activas
El cambio mental es el punto entero. Estamos acostumbrados a pensar en un agente como un modelo más un prompt. Una vez que tiene memoria, le has agregado una tercera cosa —un almacén creciente de creencias— y ese almacén necesita gobernarse como cualquier otro dato en el que confiarías para tomar decisiones. De ahí salen algunos principios:
- Cura lo que entra. No toda interacción merece convertirse en una memoria duradera. Revisa y verifica antes de escribir: una escritura sin control es como un dato equivocado o una instrucción plantada se vuelve permanente.
- Ponles procedencia y permisos a las memorias. ¿De dónde vino esta creencia, y es confiable su fuente? Una memoria escrita por una entrada no confiable no debería cargar el mismo peso que una que verificaste. Esta es la disciplina de identidad y acceso, aplicada a lo que el agente sabe, no solo a lo que puede alcanzar.
- Trata la memoria como perecedera. Puntúa la frescura, detecta la deriva y haz expirar o volver a revisar las creencias que envejecen. El dato que era cierto no es el dato que es cierto; construye para eso.
- No dejes que la memoria del agente sea su único juez. Un «este enfoque funcionó» recordado sigue siendo una afirmación, no un resultado verificado: ancla las decisiones de peso en algo actual y externo, no solo en lo que el agente recuerda.
En resumen
La memoria es la mejora que los agentes necesitaban para dejar de ser amnésicos ingeniosos y empezar a ser útiles con el tiempo, y ReasoningBank muestra cuánto puede rendir cuando el agente aprende de sus fracasos, no solo de sus aciertos. Esa parte es real y vale la pena perseguirla. Pero el mismo paso que le permite a un agente mejorar también le permite equivocarse de forma persistente, a propósito o por descuido, de una manera que un agente olvidadizo nunca podría.
Así que cuando le des memoria a tu agente, dale también un bibliotecario. Decide qué vale la pena recordar, de dónde vino cada creencia y cuándo expira, porque un agente que lo recuerda todo, confía en todo por igual y nunca olvida lo que dejó de ser cierto no es más inteligente. Es solo confiadamente obsoleto, a escala, para siempre. El futuro de los agentes es la memoria. La disciplina que lo hace seguro es gobernar lo que se les permite creer.
Comentarios
Aún no hay comentarios
Inicia sesión para unirte a la conversación.
Sé el primero en compartir una idea.