Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
13 de junio de 2026
La ventana de contexto más grande no gana
Cada lanzamiento de un modelo presume de una ventana de contexto más grande: un millón de tokens, dos millones, todo el código de golpe. Pero un análisis de despliegues empresariales encontró que casi el 65% de los fallos de agentes venían de deriva de contexto o pérdida de memoria durante el trabajo de varios pasos, no de una ventana demasiado pequeña. Los equipos que en 2026 lanzan agentes fiables no son los que tienen la ventana más grande. Son los que curan con más rigor lo que el modelo realmente ve. Aquí está la diferencia, y por qué más suele ser peor.
- agents
- methodology
13 de junio de 2026
Tu agente funciona el 57% de las veces
Un informe de marzo de 2026 analizó 6.259 agentes de IA en producción real y encontró una tasa de éxito agregada del 56,6% — apenas mejor que tirar una moneda. Los mismos estudios muestran una brecha del 37% entre cómo puntúan los agentes en los benchmarks y cómo rinden en el mundo real. Esa brecha es toda la historia. La demo siempre funciona; el trabajo es lograr que el agente funcione el otro 43% de las veces. Aquí va por qué el número es tan bajo, y qué hacen distinto los equipos que están por encima.
- agents
- methodology
13 de junio de 2026
2026 es el año del «show me the money» para la IA
Se prevé que el gasto global en IA llegue a 2,59 billones de dólares este año, un 47% más — y un estudio muy citado del MIT halló que el 95% de los pilotos de IA generativa en empresas no dieron ningún ROI medible. Esos dos números no pueden convivir para siempre. Un socio de Menlo Ventures llamó a 2026 el año del «show me the money», y las empresas están cambiando presupuestos abiertos por topes de gasto, paneles y filtros de ROI. Si construyes con IA, la era del «estamos experimentando» como pase libre se acaba. Esto es lo que el ajuste de cuentas cambia de verdad — y cómo quedar del lado correcto.
- business
13 de junio de 2026
La página web puede darle órdenes a tu agente
Cuando le das a un agente de IA un navegador y dejas que lea páginas web, haga clic en botones y ejecute comandos, le has entregado el control a cada página que visita. Los investigadores han demostrado agentes secuestrados por instrucciones escondidas en el texto de un sitio, en enlaces de pastebin e incluso de forma invisible dentro de capturas de pantalla que el agente mira. Se llama inyección indirecta de prompts, y es el riesgo número uno en la lista de OWASP para aplicaciones con LLM. El agente no distingue tus instrucciones de las de la página. Aquí explico por qué esto es tan difícil de arreglar, y cómo construir para que una página hostil no pueda manejar a tu agente.
- security
- agents
13 de junio de 2026
Escríbelo para la máquina
Ahora existe un archivo de texto plano que todo agente de programación serio lee antes de tocar tu repo: AGENTS.md. A principios de 2026 lo leen de forma nativa Claude Code, el Codex CLI de OpenAI, Cursor, Aider, Devin, GitHub Copilot, Gemini CLI, Windsurf y Amazon Q — lo más cercano a un formato universal de instrucciones para agentes que tiene la industria. Es la hora mejor invertida que puedes dedicar hoy a la programación con IA, y casi nadie lo hace. Esto es lo que va dentro y por qué funciona.
- methodology
- ai-native
13 de junio de 2026
Las tuberías de tu agente están de par en par
El primer escaneo a gran escala de servidores MCP remotos — los conectores que permiten a los agentes de IA llegar a tus herramientas y datos — encontró que cerca del 40% expone sus herramientas sin autenticación alguna. Censys contó 12.520 servicios MCP accesibles desde internet, la mayoría sin autenticar. Un barrido aparte de 40.000 repos de servidores produjo 67 CVE nuevos. El auge de los agentes metió en producción una nueva capa de tuberías más rápido de lo que nadie la aseguró, y ahora mismo buena parte está abierta. Aquí va el riesgo en términos claros y qué revisar hoy.
- security
- agents