Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
13 de junio de 2026
Las tuberías de tu agente están de par en par
El primer escaneo a gran escala de servidores MCP remotos — los conectores que permiten a los agentes de IA llegar a tus herramientas y datos — encontró que cerca del 40% expone sus herramientas sin autenticación alguna. Censys contó 12.520 servicios MCP accesibles desde internet, la mayoría sin autenticar. Un barrido aparte de 40.000 repos de servidores produjo 67 CVE nuevos. El auge de los agentes metió en producción una nueva capa de tuberías más rápido de lo que nadie la aseguró, y ahora mismo buena parte está abierta. Aquí va el riesgo en términos claros y qué revisar hoy.
- security
- agents
12 de junio de 2026
Dale el error a tu agente de código y luego hazte a un lado
La mayor diferencia entre un agente de código que es útil y uno que te saca de quicio casi nunca es el modelo. Es si cerraste el ciclo. Un agente que escribe código y se detiene está adivinando. Un agente que ejecuta el código, lee el error real e intenta de nuevo hasta que los tests pasan juega en otra liga: las tasas de corrección superan el 90% en un par de iteraciones. El agente solo puede arreglar lo que puede ver, así que lo de mayor impacto que puedes hacer es darle ojos. Aquí te explico exactamente cómo.
- methodology
- agents
11 de junio de 2026
Agentes que recuerdan
El gran salto de los agentes en 2026 no es un modelo más inteligente: es la memoria. ReasoningBank de Google permite que un agente aprenda de sus propios aciertos y errores, guarde el razonamiento y mejore de forma medible con el tiempo. Ese es el salto de una herramienta que se reinicia cada mañana a un colega que va sumando. Pero la memoria tiene un segundo filo: convierte cada error en uno permanente. Un dato equivocado, una instrucción envenenada o una creencia que quedó obsoleta en silencio ahora sobrevive entre sesiones y actúa sobre ti más tarde. La memoria no es una función que enciendes. Es un corpus que tienes que gobernar.
- ai-native
- agents
10 de junio de 2026
Por qué rechazan el pull request de tu agente
Unos investigadores estudiaron 33,000 pull requests escritos por agentes de IA, y cerca del 29% nunca se mergearon. Lo interesante es el porqué: no fue tanto porque el código estuviera mal, sino porque el PR era un mal artefacto de colaboración — demasiado grande, tocando demasiados archivos, juntando cambios que no tenían relación, fallando el CI y explicándose mal. Lograr que tu código sea aceptado resulta ser una habilidad distinta a la de escribirlo, y es justo la habilidad que los agentes no tienen por defecto. Esto es lo que significa para usarlos.
- methodology
- agents
9 de junio de 2026
Estás a punto de dirigir una plantilla de agentes
Este mes se lanzó una plataforma que permite a las empresas reclutar, incorporar, dirigir e incluso pagar a agentes de IA — de todos los modelos importantes — bajo un mismo pasaporte y un mismo registro de auditoría. Su eslogan es «tu próxima contratación no es humana». Quita el marketing y debajo hay un cambio real: el trabajo está pasando de usar una herramienta de IA a dirigir un equipo de ellas. Esa es una habilidad distinta a la de escribir prompts, casi nadie está listo para ella, y el modelo mental que elijas decide si funciona.
- agents
- methodology
9 de junio de 2026
Los agentes se volvieron más inteligentes. No se volvieron más confiables.
Un nuevo estudio pasó 14 modelos por pruebas de confiabilidad y encontró algo que la carrera de los benchmarks esconde: dos años de capacidad disparada produjeron solo mejoras pequeñas en confiabilidad. Más inteligente no es más estable. Y las matemáticas son brutales: incluso un paso confiable al 95%, ejecutado 20 veces seguidas, termina la tarea completa correctamente cerca de un tercio de las veces. Seguimos eligiendo agentes por su inteligencia cuando lo que decide si funcionan es algo completamente distinto, algo que apenas medimos.
- eval
- agents