Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
7 de junio de 2026
Para los agentes de larga duración, el costo por tarea es el único benchmark
El nuevo Nemotron 3 Ultra de NVIDIA no se vende por ser el modelo más inteligente. Se vende por ser barato de correr durante horas — pensado para agentes que planifican, llaman herramientas y razonan a lo largo de cientos de turnos. Ese enfoque es la verdadera historia. Cuando un agente corre por mucho tiempo, el número que importa deja de ser el puntaje del benchmark o el precio por token y pasa a ser el costo en dólares por tarea terminada. Dos modelos con el mismo precio por token pueden diferir 2x en un trabajo real. Acá explico por qué la tabla de líderes es lo equivocado para comparar una vez que tu agente corre por más de un instante.
- ai-native
- business
- eval
7 de junio de 2026
Agentes low-code conectados directo a tus datos en vivo
El nuevo Joule Studio de SAP construye un agente completo —flujo de trabajo, especificaciones, hasta la suite de evaluación— a partir de una sola frase, anclado directamente en los datos de tu negocio en vivo. OutSystems hace algo parecido. Esto es genuinamente poderoso: un analista de negocio ahora puede levantar un agente sobre el sistema de producción sin esperar en una cola de ingeniería. También es la forma de terminar con un agente de enorme radio de impacto que nadie puede explicar ni detener. La democratización es real. El peligro también, y la mayoría de las empresas no están listas para la segunda mitad.
- architecture
- business
- security
7 de junio de 2026
El 65% de las empresas ya tuvo un incidente de seguridad con un agente
Dos de cada tres organizaciones ya tuvieron un incidente de seguridad que involucró a un agente de IA — no es un desastre raro, es un martes cualquiera. Y la causa no es un modelo desalineado y rebelde haciendo algo malvado. Es un agente perfectamente bien portado accediendo a datos que nunca debió tener en primer lugar. La brecha de agentes de 2026 es aburrida: es una identidad con permisos de más haciendo exactamente lo que se le permitió. Y eso es buena noticia, porque los problemas aburridos tienen soluciones aburridas — si tratas al agente por lo que realmente es.
- security
- architecture
- business
7 de junio de 2026
“Lo hizo la IA” es la nueva forma de esquivar la culpa
La IA fue señalada en cerca de uno de cada cuatro recortes de empleo en EE. UU. esta primavera, y hasta Sam Altman admite que las empresas culpan a la IA 'sea o no realmente por la IA'. Los analistas tienen un nombre para esto: AI-washing. Pero la misma jugada se está colando silenciosamente en cómo operamos los agentes: cuando algo sale mal, 'el agente lo decidió' se vuelve el lugar donde va a morir la responsabilidad. La máquina no puede cargar con la rendición de cuentas. Un humano siempre lo hace. Aquí está por qué esto importa cada vez más a medida que les das a los agentes decisiones reales.
- business
- agents
- careers
7 de junio de 2026
La ley de IA más dura de Estados Unidos fue reescrita antes de empezar
La Ley de IA de Colorado iba a ser la grande: la primera ley integral de IA en Estados Unidos, con entrada en vigor en 2026 y deberes reales para prevenir la discriminación algorítmica. Entonces un juez la congeló, la legislatura la vació por dentro y todo terminó aplazado a 2027 y sin dientes. Si corriste a cumplir con la versión que ahora está muerta, acabas de aprender la verdadera lección sobre construir para la regulación de IA: no construyas para la fecha límite. Construye para el puñado de obligaciones que sobrevive a cada reescritura, porque esas eran, de todos modos, simplemente buena ingeniería.
- business
- methodology
7 de junio de 2026
Escapaste del lock-in del modelo. Lo movieron a tu contexto.
Mantener el modelo intercambiable fue la victoria del año: ahora puedes cambiar de proveedor con una línea de configuración. Así que en Build 2026 Microsoft, con toda calma, reubicó el lock-in donde no lo puedes cambiar: el contexto de tu organización. Work IQ, Fabric IQ, Foundry IQ: la memoria, los permisos y el significado de tu empresa, viviendo dentro de la interpretación que un proveedor hace de tu negocio. Como dijo un analista: puedes cambiar el cerebro. Quizá no puedas cambiar la memoria. Aquí está la nueva trampa, y cómo mantener portátil lo que de verdad importa.
- architecture
- business
- ai-native