Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
5 de junio de 2026
El agente que "cierra ventas" — la parte que la demo esconde
Meta acaba de lanzar un agente que no solo conversa: agenda citas, califica leads, cierra ventas y cobra pagos, 24/7, en cualquier idioma, conectado a Shopify y Zendesk. Un millón de negocios ya lo usan. La demo es magia. Lo que esconde: algo autónomo actuando sobre tu negocio, a velocidad de máquina, sobre mensajes de desconocidos — y la ley acaba de cerrar la salida de emergencia del 'lo hizo la IA'. Aquí está la versión honesta.
- security
- business
- agents
5 de junio de 2026
La IA acaba de empezar a perfilarte en segundo plano
Hasta esta semana, ChatGPT solo recordaba lo que le pedías que recordara. Desde el 4 de junio 'sueña' — un proceso en segundo plano lee a través de todos tus chats anteriores y construye en silencio un modelo de ti, manteniéndolo actualizado por su cuenta. Es una mejora genuinamente útil y el momento en que un chatbot se convirtió en un perfilador. El regulador de datos de la UE dijo exactamente eso, hoy. Esto es lo que realmente cambió, en términos simples — y por qué es el problema del grounding apuntado hacia ti.
- ai-native
- security
5 de junio de 2026
Cuatro modelos insignia en cuatro semanas — «qué modelo gana» es un olor de diseño (design smell)
Este mes llega una ola de modelos insignia casi uno encima del otro — Gemini 3.5 Pro, un nuevo Claude, Grok 5, con Opus 4.8 ya disponible. Todos están refrescando leaderboards. Si esa ola te da ansiedad — ¿estamos en el mejor?, ¿deberíamos cambiar? — la ansiedad te está diciendo algo sobre tu arquitectura, no sobre los modelos. Acá va la lectura honesta, y lo que de verdad cuesta «mantenerse intercambiable».
- ai-native
- architecture
5 de junio de 2026
«¿Qué parte agentizamos primero?» es la primera pregunta equivocada
Todo el mercado pasó de '¿son reales los agentes?' a '¿qué parte de mi empresa se agentiza primero?' — soporte de TI, ventas, conciliaciones. Parece la pregunta estratégica inteligente. Es la equivocada. Preguntar dónde apuntar el agente se salta las dos preguntas que de verdad deciden si algo de esto funciona: sobre qué se apoya el agente, y quién responde cuando se equivoca. Este es el orden que importa.
- methodology
- business
- agents
4 de junio de 2026
Un paywall de tokens no es SaaS
Los fundadores ponen precio a sus productos de IA con instintos de SaaS — tarifa plana mensual, por asiento (per-seat) — y sangran en silencio, porque lo que hacía mágico al SaaS desapareció. El costo marginal casi nulo está muerto: cada usuario quema tokens, para siempre, y el costo escala con el uso. GitHub Copilot perdía hasta $80 al mes por cada usuario intensivo con una tarifa plana de $10. Los productos de IA no son software con márgenes geniales; se parecen más a un servicio público (utility) con un costo de los bienes vendidos real. Ponles precio como tal.
- business
- ai-native
4 de junio de 2026
87% en el benchmark, y aún no puede hacer evolucionar tu base de código
El titular dice que la IA 'resuelve el 87% de SWE-bench', y todos lo leen como 'la IA ya puede hacer ingeniería de software'. Dos problemas. El pequeño: un tercio de esos aciertos filtró la respuesta o tenía tests/pruebas débiles. El fatal: el benchmark mide un único arreglo de bug aislado, no el trabajo real — hacer evolucionar una base de código viva durante semanas. Mide eso, y los mismos modelos caen de ~73% a ~25%. El benchmark es la demo. Tu base de código es producción.
- eval
- agents
- methodology