Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
5 de junio de 2026
La IA acaba de empezar a perfilarte en segundo plano
Hasta esta semana, ChatGPT solo recordaba lo que le pedías que recordara. Desde el 4 de junio 'sueña' — un proceso en segundo plano lee a través de todos tus chats anteriores y construye en silencio un modelo de ti, manteniéndolo actualizado por su cuenta. Es una mejora genuinamente útil y el momento en que un chatbot se convirtió en un perfilador. El regulador de datos de la UE dijo exactamente eso, hoy. Esto es lo que realmente cambió, en términos simples — y por qué es el problema del grounding apuntado hacia ti.
- ai-native
- security
5 de junio de 2026
Cuatro modelos insignia en cuatro semanas — «qué modelo gana» es un olor de diseño (design smell)
Este mes llega una ola de modelos insignia casi uno encima del otro — Gemini 3.5 Pro, un nuevo Claude, Grok 5, con Opus 4.8 ya disponible. Todos están refrescando leaderboards. Si esa ola te da ansiedad — ¿estamos en el mejor?, ¿deberíamos cambiar? — la ansiedad te está diciendo algo sobre tu arquitectura, no sobre los modelos. Acá va la lectura honesta, y lo que de verdad cuesta «mantenerse intercambiable».
- ai-native
- architecture
4 de junio de 2026
Un paywall de tokens no es SaaS
Los fundadores ponen precio a sus productos de IA con instintos de SaaS — tarifa plana mensual, por asiento (per-seat) — y sangran en silencio, porque lo que hacía mágico al SaaS desapareció. El costo marginal casi nulo está muerto: cada usuario quema tokens, para siempre, y el costo escala con el uso. GitHub Copilot perdía hasta $80 al mes por cada usuario intensivo con una tarifa plana de $10. Los productos de IA no son software con márgenes geniales; se parecen más a un servicio público (utility) con un costo de los bienes vendidos real. Ponles precio como tal.
- business
- ai-native
4 de junio de 2026
Los labs ahora compiten en precio, no en IQ
Durante dos años, el lanzamiento de un modelo insignia tenía un solo titular: somos los más inteligentes, este es el benchmark que superamos. En Microsoft Build 2026 el titular cambió — misma liga que Opus, pero ~10x más output por dólar y 60% menos tokens. La presunción pasó del IQ a la eficiencia, y toda la industria se está reorganizando en torno al precio, no a la capacidad máxima. Aquí explico por qué se invirtió el eje, y qué significa si tú construyes.
- ai-native
- business
- agents
4 de junio de 2026
El peldaño de abajo desapareció
Ya están los datos, y son específicos: la IA se comió al junior, no al senior. Las empresas no están despidiendo juniors; simplemente dejaron de contratarlos, en silencio, porque las tareas que hacían los juniors son exactamente lo que ahora hacen los agentes. Parece eficiente. Pero a los seniors no se los contrata, se los cultiva: un senior es un junior que sobrevivió a unos cuantos miles de bugs. Recorta los juniors para ahorrar ahora y estarás matando de hambre al pipeline (cantera) que produce a los seniors de los que dependes. Nos estamos comiendo la semilla.
- careers
- ai-native
- business
4 de junio de 2026
Llegó la factura
Durante dos años el costo de la IA se sintió como un error de redondeo. En 2026 llegó la factura — Uber quemó el presupuesto anual de IA en cuatro meses, Microsoft les quitó Claude Code a sus propios ingenieros, JPMorgan dice que los tokens se están comiendo las ganancias de internet. Esto no es un bache pasajero. La facturación por tokens invierte la economía sobre la que se construyó el software, y el giro cruel es que un agente mejor cuesta más. Esto es lo que realmente cambió, con honestidad.
- business
- ai-native
- agents