EVAL · 8 de junio de 2026

¿Quién revisa al revisor?

Google construyó una IA que escribe artículos de investigación y otra IA que los revisa, además de un sistema que sigue corrigiendo el artículo hasta que la IA revisora lo aprueba. Es eficiente, y es una trampa. Cuando lo que genera el trabajo y lo que lo juzga comparten la misma mente, la revisión es circular: tienen los mismos puntos ciegos, y los modelos hasta prefieren sus propias respuestas. «Pasó porque la IA lo dijo» no es verificación. Es una inteligencia asintiendo frente a sí misma. La solución es más vieja que la IA: el juez tiene que ser independiente de quien hace el trabajo.

Google presentó hace poco agentes de IA para ayudar con el trabajo académico: uno que genera figuras con calidad de publicación, y otro que hace revisión por pares. Por la misma época, un marco de investigación relacionado dio el paso obvio siguiente: usa un revisor de IA simulado para puntuar un artículo y luego sigue corrigiendo el manuscrito hasta que la puntuación de ese revisor sube, y lo acepta cuando la IA da el visto bueno. La IA escribe el artículo; la IA califica el artículo; el bucle se cierra.

Es una idea ordenada y eficiente, y es la ilustración más limpia de un error que está a punto de estar en todas partes. Porque en el momento en que necesitas revisar el trabajo de la IA —y siempre lo necesitas— la tentación es hacer que otra IA lo revise. Ese instinto es la trampa, y vale la pena entender exactamente por qué.

La revisión es circular cuando el revisor comparte la mente

Este es el problema central, dicho sin rodeos. Si lo que produce el trabajo y lo que juzga el trabajo son el mismo modelo —o dos modelos de la misma familia, entrenados con los mismos datos de la misma manera— comparten los mismos puntos ciegos. Un error que el generador no puede ver, el juez tampoco lo puede ver, porque están mirando con los mismos ojos. La verificación se siente rigurosa y no cambia nada, porque ambas mitades coinciden justo en las cosas en las que ambas se equivocan.

Es peor que neutral. La investigación sobre el uso de LLM como jueces encontró un sesgo de autopreferencia consistente: los modelos califican mejor sus propias salidas, y las salidas de su propia familia — y cuanto mejor es un modelo reconociendo su propia escritura, más fuerte es el sesgo. Así que una IA calificando a una IA no solo está ciega en los mismos lugares; está activamente inclinada a aprobar trabajo que se parece al suyo. El bucle cerrado no converge en «lo correcto». Converge en «lo que le gusta a este tipo de modelo».

Y no puedes salir de eso por ingeniería desde adentro. Como lo planteó un análisis, cuando la generación y la evaluación ocurren en el mismo espacio epistémico, la justificación es circular — no lo arreglas haciendo el modelo más inteligente o calibrando al juez, porque son el mismo tipo de cosa juzgándose a sí misma. Un cerebro mejor revisando su propia tarea sigue revisando su propia tarea.

Este es el mismo error con una docena de disfraces

Una vez que ves el patrón, lo notas en todo lo que sigo escribiendo. El agente que declara la victoria contra un objetivo más débil se está calificando a sí mismo. El modelo que fabrica un resultado y lo redacta con prolijidad es su propio revisor poco confiable. El adulador que te da la razón es la versión social. En todos los casos el fallo tiene la misma forma: lo que se confía para verificar está demasiado cerca de lo que se verifica como para atrapar el error.

Así que «que la IA lo revise» no resuelve el problema de la verificación. Lo reubica y lo esconde detrás de una marca de verificación verde.

Independiente no significa humano: significa diferente

Quiero ser justo, porque la sobrecorrección opuesta también está mal. Usar una IA como juez no es inútil; bien hecho, un juez LLM coincide con los revisores humanos cerca del 85% de las veces, mejor de lo que dos humanos coinciden entre sí. El problema nunca fue «la IA no sabe evaluar». Es que el evaluador no puede ser el generador, ni su gemelo. La regla es la independencia, no la humanidad:

No califiques un modelo consigo mismo ni con su propia familia. Si un modelo lo escribió, júzgalo con un modelo distinto de un linaje distinto. Entrenamiento compartido es puntos ciegos compartidos; la revisión entre linajes atrapa lo que la autorrevisión no puede.
Ancla al juez a una verdad de campo real, no a sensaciones. La revisión más fuerte no es otra opinión; es la realidad. ¿El código realmente corrió? ¿El experimento se reprodujo? ¿El número coincidió con la fuente? Conecta la verificación a algo fuera del espacio epistémico del modelo, donde equivocarse tiene consecuencias que no puede esquivar con argumentos.
Mantén a un humano en las cosas que importan. No para revisar todo —eso no escala— sino para calibrar a los jueces automáticos contra resultados reales, y para ser dueño de las decisiones donde un error circular se vuelve uno real.
Nunca cierres el bucle sobre nada importante. Un sistema que genera y aprueba su propio trabajo sin referencia externa derivará con confianza hacia el sinsentido y calificará el sinsentido muy alto. Deja siempre una puerta abierta a algo que el modelo no haya escrito.

En resumen

«Quién revisa al revisor» suena a acertijo, pero es la pregunta más práctica que hay en la IA ahora mismo, porque la respuesta por defecto a la que la industria se está aferrando — «otra IA, idealmente la misma»— es la equivocada. Un verificador que comparte la mente del generador no es una revisión; es un espejo, y los espejos son muy buenos para decirte lo que ya está frente a ellos.

Así que cuando necesites confiar en la salida de la IA, resiste el bucle fácil. Haz que el juez sea independiente —un modelo distinto, una prueba determinista, el mundo real, un humano— porque el sentido entero de la verificación es traer una perspectiva que el trabajo todavía no contenía. «La IA lo aprobó» solo tiene sentido si la IA que aprueba de verdad podía haber dicho que no. Construye de modo que pudiera.

Comentarios

Aún no hay comentarios

Inicia sesión para unirte a la conversación.

Sé el primero en compartir una idea.