Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
5 de junio de 2026
Los agentes están llegando a donde un error es una demanda
Esta semana Experian lanzó un «Agent OS» para crédito: agentes que deciden el crédito, marcan el fraude, determinan quién es elegible. Estas son las salas donde una alucinación no es una respuesta torpe de un chatbot; es un préstamo negado, una autorización médica equivocada, una cita en la corte. Y un número fija lo que está en juego: las negaciones de salud por IA se revierten más del 80% de las veces en apelación, pero menos del 1% de las personas apela. Aquí está por qué los dominios regulados son donde todo el argumento sobre los agentes se vuelve ley.
- architecture
- business
- agents
5 de junio de 2026
Microsoft envió 100 agentes a cazar bugs — seguridad IA contra IA, con honestidad
Esta semana Microsoft mostró un equipo de seguridad hecho de IA: un pipeline de más de 100 agentes que encontró 16 vulnerabilidades nuevas en Windows, cuatro de ellas críticas, además de la primera IA que dictó un veredicto de malware de forma automática. Los defensores ahora corren IA autónoma. También los atacantes: uno ejecutó por su cuenta entre el 80 y el 90% de una intrusión real. «Seguridad IA contra IA» dejó de ser un eslogan esta primavera. Esta es la lectura honesta: es un progreso real, y unas tablas más rápidas.
- security
- agents
5 de junio de 2026
El agente que "cierra ventas" — la parte que la demo esconde
Meta acaba de lanzar un agente que no solo conversa: agenda citas, califica leads, cierra ventas y cobra pagos, 24/7, en cualquier idioma, conectado a Shopify y Zendesk. Un millón de negocios ya lo usan. La demo es magia. Lo que esconde: algo autónomo actuando sobre tu negocio, a velocidad de máquina, sobre mensajes de desconocidos — y la ley acaba de cerrar la salida de emergencia del 'lo hizo la IA'. Aquí está la versión honesta.
- security
- business
- agents
5 de junio de 2026
«¿Qué parte agentizamos primero?» es la primera pregunta equivocada
Todo el mercado pasó de '¿son reales los agentes?' a '¿qué parte de mi empresa se agentiza primero?' — soporte de TI, ventas, conciliaciones. Parece la pregunta estratégica inteligente. Es la equivocada. Preguntar dónde apuntar el agente se salta las dos preguntas que de verdad deciden si algo de esto funciona: sobre qué se apoya el agente, y quién responde cuando se equivoca. Este es el orden que importa.
- methodology
- business
- agents
4 de junio de 2026
87% en el benchmark, y aún no puede hacer evolucionar tu base de código
El titular dice que la IA 'resuelve el 87% de SWE-bench', y todos lo leen como 'la IA ya puede hacer ingeniería de software'. Dos problemas. El pequeño: un tercio de esos aciertos filtró la respuesta o tenía tests/pruebas débiles. El fatal: el benchmark mide un único arreglo de bug aislado, no el trabajo real — hacer evolucionar una base de código viva durante semanas. Mide eso, y los mismos modelos caen de ~73% a ~25%. El benchmark es la demo. Tu base de código es producción.
- eval
- agents
- methodology
4 de junio de 2026
Los labs ahora compiten en precio, no en IQ
Durante dos años, el lanzamiento de un modelo insignia tenía un solo titular: somos los más inteligentes, este es el benchmark que superamos. En Microsoft Build 2026 el titular cambió — misma liga que Opus, pero ~10x más output por dólar y 60% menos tokens. La presunción pasó del IQ a la eficiencia, y toda la industria se está reorganizando en torno al precio, no a la capacidad máxima. Aquí explico por qué se invirtió el eje, y qué significa si tú construyes.
- ai-native
- business
- agents