Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
13 de junio de 2026
Una marca verde puede esconder un proceso roto por dentro
Este es el fallo que se come a los agentes de IA en producción: el agente ejecuta una tarea de varios pasos, se equivoca en algún punto a mitad de camino y aun así entrega una respuesta final que pasa tu chequeo. La salida se ve limpia. El razonamiento estaba roto. Los investigadores descubrieron que así es exactamente como fallan los agentes de varios pasos: un error en el paso tres se propaga sin que nadie lo vea hasta un resumen en el paso diez que se lee bien y está mal. Si solo calificas la respuesta final, eres ciego a la mayor parte de cómo se rompen los agentes de verdad. Aquí va el porqué, y qué revisar en su lugar.
- methodology
- agents
13 de junio de 2026
La ventana de contexto más grande no gana
Cada lanzamiento de un modelo presume de una ventana de contexto más grande: un millón de tokens, dos millones, todo el código de golpe. Pero un análisis de despliegues empresariales encontró que casi el 65% de los fallos de agentes venían de deriva de contexto o pérdida de memoria durante el trabajo de varios pasos, no de una ventana demasiado pequeña. Los equipos que en 2026 lanzan agentes fiables no son los que tienen la ventana más grande. Son los que curan con más rigor lo que el modelo realmente ve. Aquí está la diferencia, y por qué más suele ser peor.
- agents
- methodology
13 de junio de 2026
Tu agente funciona el 57% de las veces
Un informe de marzo de 2026 analizó 6.259 agentes de IA en producción real y encontró una tasa de éxito agregada del 56,6% — apenas mejor que tirar una moneda. Los mismos estudios muestran una brecha del 37% entre cómo puntúan los agentes en los benchmarks y cómo rinden en el mundo real. Esa brecha es toda la historia. La demo siempre funciona; el trabajo es lograr que el agente funcione el otro 43% de las veces. Aquí va por qué el número es tan bajo, y qué hacen distinto los equipos que están por encima.
- agents
- methodology
13 de junio de 2026
La página web puede darle órdenes a tu agente
Cuando le das a un agente de IA un navegador y dejas que lea páginas web, haga clic en botones y ejecute comandos, le has entregado el control a cada página que visita. Los investigadores han demostrado agentes secuestrados por instrucciones escondidas en el texto de un sitio, en enlaces de pastebin e incluso de forma invisible dentro de capturas de pantalla que el agente mira. Se llama inyección indirecta de prompts, y es el riesgo número uno en la lista de OWASP para aplicaciones con LLM. El agente no distingue tus instrucciones de las de la página. Aquí explico por qué esto es tan difícil de arreglar, y cómo construir para que una página hostil no pueda manejar a tu agente.
- security
- agents
13 de junio de 2026
Las tuberías de tu agente están de par en par
El primer escaneo a gran escala de servidores MCP remotos — los conectores que permiten a los agentes de IA llegar a tus herramientas y datos — encontró que cerca del 40% expone sus herramientas sin autenticación alguna. Censys contó 12.520 servicios MCP accesibles desde internet, la mayoría sin autenticar. Un barrido aparte de 40.000 repos de servidores produjo 67 CVE nuevos. El auge de los agentes metió en producción una nueva capa de tuberías más rápido de lo que nadie la aseguró, y ahora mismo buena parte está abierta. Aquí va el riesgo en términos claros y qué revisar hoy.
- security
- agents
12 de junio de 2026
Dale el error a tu agente de código y luego hazte a un lado
La mayor diferencia entre un agente de código que es útil y uno que te saca de quicio casi nunca es el modelo. Es si cerraste el ciclo. Un agente que escribe código y se detiene está adivinando. Un agente que ejecuta el código, lee el error real e intenta de nuevo hasta que los tests pasan juega en otra liga: las tasas de corrección superan el 90% en un par de iteraciones. El agente solo puede arreglar lo que puede ver, así que lo de mayor impacto que puedes hacer es darle ojos. Aquí te explico exactamente cómo.
- methodology
- agents