Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
4 de junio de 2026
La memoria es la nueva superficie de ataque
Todos corren por darle a los agentes memoria de largo plazo: es la mejora obvia. Pero una capacidad duradera es una vulnerabilidad duradera. Una prompt injection es un disparo único que se reinicia; el envenenamiento de memoria (memory poisoning) escribe una sola mentira en el almacenamiento del agente y viaja junto a él en cada sesión futura, para cada usuario, hasta que alguien la purga. Convierte en arma la función misma para la que existe la memoria: aprender del pasado. Acá te explico cómo funciona el ataque que espera, y cómo cercarlo.
- security
- architecture
- agents
4 de junio de 2026
Tus agentes son sin estado. Por eso mueren.
Tu agente termina de principio a fin en tu laptop, así que nunca ves el problema. Producción es un proceso largo de múltiples pasos sobre infraestructura que se reinicia, expira y muere a mitad de camino — y tu agente guardó todo su progreso en memoria. El 'ajuste de cuentas agéntico' de 2026 es el descubrimiento de que la falla no está en el modelo, está en el runtime. El arreglo es viejo y aburrido: durable execution (ejecución durable). Aquí va la versión honesta.
- architecture
- agents
- methodology
4 de junio de 2026
Llegó la factura
Durante dos años el costo de la IA se sintió como un error de redondeo. En 2026 llegó la factura — Uber quemó el presupuesto anual de IA en cuatro meses, Microsoft les quitó Claude Code a sus propios ingenieros, JPMorgan dice que los tokens se están comiendo las ganancias de internet. Esto no es un bache pasajero. La facturación por tokens invierte la economía sobre la que se construyó el software, y el giro cruel es que un agente mejor cuesta más. Esto es lo que realmente cambió, con honestidad.
- business
- ai-native
- agents
4 de junio de 2026
El año en que el agente se volvió el atacante
Hace un año, la seguridad de los agentes era un experimento mental: ¿qué pasa si engañan a tu agente? En 2026 se volvió concreta, de tres maneras: un aficionado usó Claude Code y GPT para vulnerar nueve agencias gubernamentales y 195 millones de registros; una IA llevó adelante una campaña contra 600 firewalls en 55 países sin un humano al volante; y el propio agente interno de Meta filtró datos sensibles sin atacante alguno. La misma primitiva peligrosa, apuntada en tres direcciones. Aquí va el modelo de amenazas honesto.
- security
- agents
3 de junio de 2026
La mayoría de los agentes de IA nunca llegan a producción
La demo deslumbra. Después, el agente nunca sale a producción. Encuesta tras encuesta en 2025–26 encuentran el mismo abismo: casi todos tienen un piloto de agente, casi nadie lo tiene en producción. La razón no es el modelo: es la ingeniería poco glamorosa que la demo te dejó saltarte. Esto es lo que hace distinto la pequeña minoría que sí lo lleva a producción.
- agents
- eval
- methodology
3 de junio de 2026
Un modelo barato puede hacer el 90% del trabajo
El movimiento por defecto es apuntar el modelo más grande e inteligente a todo. Funciona en la demo y, en silencio, te lleva a la quiebra a escala — porque la mayor parte de lo que hace un agente no es razonar, es mecánico, y estás pagando sueldo de genio por leer un formulario. La solución es aburrida y vale ~90%: deja que un modelo inteligente planifique, y que los modelos baratos hagan. Acá está la economía, y la única regla arquitectónica que lo hace posible.
- agents
- architecture
- business