Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
12 de junio de 2026
Dale el error a tu agente de código y luego hazte a un lado
La mayor diferencia entre un agente de código que es útil y uno que te saca de quicio casi nunca es el modelo. Es si cerraste el ciclo. Un agente que escribe código y se detiene está adivinando. Un agente que ejecuta el código, lee el error real e intenta de nuevo hasta que los tests pasan juega en otra liga: las tasas de corrección superan el 90% en un par de iteraciones. El agente solo puede arreglar lo que puede ver, así que lo de mayor impacto que puedes hacer es darle ojos. Aquí te explico exactamente cómo.
- methodology
- agents
10 de junio de 2026
Por qué rechazan el pull request de tu agente
Unos investigadores estudiaron 33,000 pull requests escritos por agentes de IA, y cerca del 29% nunca se mergearon. Lo interesante es el porqué: no fue tanto porque el código estuviera mal, sino porque el PR era un mal artefacto de colaboración — demasiado grande, tocando demasiados archivos, juntando cambios que no tenían relación, fallando el CI y explicándose mal. Lograr que tu código sea aceptado resulta ser una habilidad distinta a la de escribirlo, y es justo la habilidad que los agentes no tienen por defecto. Esto es lo que significa para usarlos.
- methodology
- agents
10 de junio de 2026
Tu proveedor de IA va a tener un mal día
Esta semana llegaron dos recordatorios. Anthropic va a retirar Claude Sonnet 4 y Opus 4 de la API el 15 de junio: si fijaste esas versiones, tus llamadas simplemente empiezan a devolver errores, sin ningún failover automático. Y esta mañana, Gemini se cayó. La misma lección desde direcciones opuestas: el modelo debajo de tu producto es un servicio de terceros que, en un calendario que no controlas, va a cambiar, desaparecer o fallar. La solución no es de estrategia. Es la aburrida ingeniería de resiliencia que la mayoría de los productos de IA se saltan.
- architecture
- methodology
9 de junio de 2026
Anthropic escribe el 80% de su código con IA. Tú no eres Anthropic.
Más del 80% del código que Anthropic mandó a producción en mayo lo escribió Claude. Ese número está por aparecer en cada discusión sobre «los programadores ya son obsoletos» y en cada reunión de presión por «ponerse al día». Así que léelo con cuidado, porque demuestra lo contrario de lo que la gente cree. Es la empresa con el mejor modelo, usando ese modelo sobre sí misma, revisado por algunos de los mejores ingenieros vivos. El porcentaje no es la lección. La lección es lo que hizo seguro mandar ese 80% a producción.
- methodology
- careers
9 de junio de 2026
Estás a punto de dirigir una plantilla de agentes
Este mes se lanzó una plataforma que permite a las empresas reclutar, incorporar, dirigir e incluso pagar a agentes de IA — de todos los modelos importantes — bajo un mismo pasaporte y un mismo registro de auditoría. Su eslogan es «tu próxima contratación no es humana». Quita el marketing y debajo hay un cambio real: el trabajo está pasando de usar una herramienta de IA a dirigir un equipo de ellas. Esa es una habilidad distinta a la de escribir prompts, casi nadie está listo para ella, y el modelo mental que elijas decide si funciona.
- agents
- methodology
8 de junio de 2026
La IA es brillante para las ideas y mala para acertar
Temíamos que la IA automatizara el trabajo aburrido y dejara a los humanos las alturas creativas. La investigación de 2026 dice que lo teníamos al revés. Cuando se soltó a agentes de IA sobre investigación real, generaron ideas novedosas y bien escritas, y luego fabricaron o invalidaron sus propios resultados experimentales en cerca del 80% de los casos. La IA resulta ser una fuente fantástica de ideas y un juez pésimo de si son ciertas. Una vez que ves esa división, cómo deberías usarla se vuelve obvio, y también el error que casi todos están cometiendo.
- methodology
- eval