Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
7 de junio de 2026
Para los agentes de larga duración, el costo por tarea es el único benchmark
El nuevo Nemotron 3 Ultra de NVIDIA no se vende por ser el modelo más inteligente. Se vende por ser barato de correr durante horas — pensado para agentes que planifican, llaman herramientas y razonan a lo largo de cientos de turnos. Ese enfoque es la verdadera historia. Cuando un agente corre por mucho tiempo, el número que importa deja de ser el puntaje del benchmark o el precio por token y pasa a ser el costo en dólares por tarea terminada. Dos modelos con el mismo precio por token pueden diferir 2x en un trabajo real. Acá explico por qué la tabla de líderes es lo equivocado para comparar una vez que tu agente corre por más de un instante.
- ai-native
- business
- eval
7 de junio de 2026
Escapaste del lock-in del modelo. Lo movieron a tu contexto.
Mantener el modelo intercambiable fue la victoria del año: ahora puedes cambiar de proveedor con una línea de configuración. Así que en Build 2026 Microsoft, con toda calma, reubicó el lock-in donde no lo puedes cambiar: el contexto de tu organización. Work IQ, Fabric IQ, Foundry IQ: la memoria, los permisos y el significado de tu empresa, viviendo dentro de la interpretación que un proveedor hace de tu negocio. Como dijo un analista: puedes cambiar el cerebro. Quizá no puedas cambiar la memoria. Aquí está la nueva trampa, y cómo mantener portátil lo que de verdad importa.
- architecture
- business
- ai-native
7 de junio de 2026
Cuando tu cliente es un bot
Los agentes de Google ya reservan y compran en tu nombre, Visa y Mastercard construyeron rieles para que los agentes paguen, y una ola de protocolos de «comercio agéntico» se lanzó con Shopify, Walmart y Target. La implicación silenciosa: lo que evalúa tu producto es cada vez más software, no una persona. Los agentes de IA no navegan: el 87% de sus solicitudes va a los datos del producto, y casi ninguna toca tu hermosa tienda. La web se construyó para ojos humanos, y el comprador acaba de cambiar de especie. Esto es lo que significa para cualquiera que venda, construya o publique algo en línea.
- business
- ai-native
6 de junio de 2026
Supabase vale 10.500 millones porque los agentes necesitan bases de datos aburridas
Supabase acaba de levantar 500 millones de dólares con una valoración de 10.500 millones — el doble en ocho meses — y la razón es casi graciosa: más del 60% de las nuevas bases de datos en su plataforma ahora las crea una herramienta de IA, no una persona. La parte vistosa del boom de la IA son los agentes que escriben el código. La parte que en silencio acuña dinero es el lugar aburrido y confiable donde ese código tiene que guardar sus datos. Eso no es casualidad: es toda la lección sobre dónde vive el valor duradero.
- business
- architecture
- ai-native
6 de junio de 2026
Microsoft puede despedir a su proveedor de modelos. ¿Y tú?
En Build 2026 Microsoft lanzó sus propios modelos de código y razonamiento — entrenados desde cero, con lo que su jefe de IA llamó «cero destilación» de OpenAI — directo dentro de GitHub Copilot. La empresa de software más rica del planeta acaba de gastar miles de millones para dejar de depender de un solo proveedor. Esa es toda la lección para el resto de nosotros, y no te cuesta nada: nunca dejes que el modelo sea la parte de tu sistema que no puedes reemplazar.
- architecture
- ai-native
- business
6 de junio de 2026
El vibe coding se acabó. Lo difícil nunca fue el demo.
Google ahora le enseña vibe coding a más de un millón de personas en un curso gratis de cinco días. Cuando aquello de lo que estabas orgulloso se convierte en una clase de fin de semana, esa habilidad deja de ser tu ventaja. Pero aquí está la parte que los titulares no ven: el vibe coding siempre fue bueno en el 80% fácil —el demo— e inútil en el 20% que decide si el software sobrevive. La habilidad que de verdad escasea ahora no es generar código. Es el criterio para saber si el código que recibiste sirve de algo.
- careers
- methodology
- ai-native