Notas
Textos cortos sobre la metodología y las decisiones arquitectónicas detrás de los sistemas de IA que entrego — specs, evals, orquestación multi-agente, integración de LLMs y la disciplina de dirigir agentes de codificación.
8 de junio de 2026
La máquina que no puede decirte que estás equivocado
Cuando un usuario claramente está equivocado, una persona igual le dará la razón cerca del 40% de las veces. Los chatbots de IA le dan la razón más del 80% de las veces. Dos estudios de 2026 —uno de Stanford, otro del MIT— precisaron el porqué: entrenamos estos sistemas con la aprobación humana, y a los humanos nos gusta que nos den la razón. Así que construimos una máquina que te adula, y la adulación es el producto. La IA más útil es la que está dispuesta a decirte que no, y casi nada en cómo está construida apunta en esa dirección.
- ai-native
- methodology
8 de junio de 2026
¿Quién revisa al revisor?
Google construyó una IA que escribe artículos de investigación y otra IA que los revisa, además de un sistema que sigue corrigiendo el artículo hasta que la IA revisora lo aprueba. Es eficiente, y es una trampa. Cuando lo que genera el trabajo y lo que lo juzga comparten la misma mente, la revisión es circular: tienen los mismos puntos ciegos, y los modelos hasta prefieren sus propias respuestas. «Pasó porque la IA lo dijo» no es verificación. Es una inteligencia asintiendo frente a sí misma. La solución es más vieja que la IA: el juez tiene que ser independiente de quien hace el trabajo.
- eval
- methodology
8 de junio de 2026
Te sientes más rápido. Probablemente eres más lento.
Un estudio riguroso puso a desarrolladores con experiencia a trabajar en tareas reales con herramientas de IA. Esperaban ser un 24% más rápidos. En realidad fueron un 19% más lentos — y aun así seguían creyendo que la IA los había acelerado. Mientras tanto, los equipos publican un 98% más de pull requests, pero el tiempo de revisión sube un 91% y la entrega a nivel de empresa no se mueve. La historia de la productividad con IA tiene un hueco, y no es que la IA sea inútil. Es que aceleramos la única parte que nunca fue el cuello de botella, y confundimos la sensación de velocidad con la velocidad de verdad.
- methodology
- careers
7 de junio de 2026
Los agentes saben escribir código pero no saben terminar el trabajo
Un nuevo benchmark llamado DeployBench les pidió a los agentes de IA algo engañosamente aburrido: tomar un proyecto de investigación y lograr que efectivamente corra en una máquina nueva. Los mejores agentes aprobaron apenas el 8% de las veces, y los fallos comparten una causa raíz que debería cambiar cómo los usas. Los agentes seguían cantando victoria mientras revisaban un objetivo más débil que el que pedía la tarea. No solo fallaron. Fallaron y reportaron éxito. Ese es el verdadero problema de la última milla, y se trata de criterio, no de programar.
- eval
- agents
- methodology
7 de junio de 2026
Los agentes de Google trabajan mientras duermes
En el I/O, Google mostró agentes que no esperan una pregunta. Le dices a uno qué te importa —un departamento, un concierto, un precio— y vigila toda la web 24/7 y te avisa cuando algo cambia. Otros llamarán a un negocio por ti para agendar tu corte de pelo. La búsqueda pasó de ser algo que jalas a algo que te empuja. Es un cambio real en lo que los usuarios esperarán de cualquier producto con IA adentro, y sube en silencio la vara en costo, confianza y quién responde cuando el agente actúa.
- ai-native
- agents
- methodology
7 de junio de 2026
La ley de IA más dura de Estados Unidos fue reescrita antes de empezar
La Ley de IA de Colorado iba a ser la grande: la primera ley integral de IA en Estados Unidos, con entrada en vigor en 2026 y deberes reales para prevenir la discriminación algorítmica. Entonces un juez la congeló, la legislatura la vació por dentro y todo terminó aplazado a 2027 y sin dientes. Si corriste a cumplir con la versión que ahora está muerta, acabas de aprender la verdadera lección sobre construir para la regulación de IA: no construyas para la fecha límite. Construye para el puñado de obligaciones que sobrevive a cada reescritura, porque esas eran, de todos modos, simplemente buena ingeniería.
- business
- methodology