ARCHITECTURE · 15 de junio de 2026

No fue el modelo. Fueron tus datos.

La mayoría de los proyectos de IA fracasan — MIT descubrió que el 95% de los pilotos de IA generativa no produjeron ninguna ganancia medible, y RAND situó la tasa de fracaso general en torno al 80%. Cuando algo sale mal, el instinto es culpar al modelo: no es lo bastante listo, elegimos mal, malos prompts. Los datos dicen otra cosa. La causa de fracaso más citada es la mala calidad de los datos, y solo alrededor del 12% de las organizaciones tienen datos lo bastante limpios como para sostener IA siquiera. Lo más probable es que no tengas un problema de modelo. Tienes un problema de datos disfrazado de problema de modelo. Aquí te explico cómo distinguirlo.

Las cifras de fracaso de la IA empresarial son brutales y vale la pena decirlas en voz alta. La investigación de MIT descubrió que el 95% de los pilotos de IA generativa no tuvieron ningún impacto medible en las ganancias, y RAND situó la tasa de fracaso general de los proyectos de IA en torno al 80%. La mayoría de los proyectos de IA no se quedan cortos en silencio. Fracasan.

Cuando eso ocurre, casi todo el mundo recurre a la misma explicación: el modelo. Elegimos el equivocado, no era lo bastante listo, los prompts estaban mal, deberíamos probar la nueva versión. Ese instinto reconforta porque se arregla con un cambio. Y también suele estar equivocado. La razón más citada por la que fracasan los proyectos de IA no es el modelo en absoluto — es la mala calidad de los datos, señalada en alrededor del 85% de los proyectos fallidos, y solo alrededor del 12% de las organizaciones tienen datos lo bastante limpios como para sostener IA en primer lugar. Déjame argumentarlo, porque esta es la diferencia entre un arreglo que funciona y un año perdido cambiando modelos.

El modelo es la parte visible, así que se lleva la culpa

Cuando una función de IA da malas respuestas, el modelo es lo que ves comportándose mal, así que es lo que culpas. Pero el modelo es el último eslabón de una cadena, y solo puede ser tan bueno como lo que fluye hacia él. Aliméntale a un modelo brillante datos dispersos, contradictorios, desactualizados, a medias accesibles, y produce tonterías con seguridad — no porque sea un mal modelo, sino porque está reflejando fielmente una mala entrada.

Por eso cambiar de modelo tantas veces no cambia nada. Pasas de un modelo de frontera a uno más nuevo, la demo sigue decepcionando, y concluyes que la IA «aún no está lista». Lo que en realidad pasó es que mejoraste la única parte que no estaba rota. Los datos eran el cuello de botella antes del cambio y siguen siendo el cuello de botella después, porque el nuevo modelo ahora lee el mismo desorden que leía el viejo.

Los datos son aburridos, así que son el trabajo que nadie quiere hacer

Hay una razón por la que esto sigue pasando: arreglar los datos es tedioso e invisible, y elegir un modelo es emocionante y rápido. Elegir el modelo se siente como progreso — hay una tabla de clasificación, un lanzamiento, una demo. Ordenar dónde viven tus datos, qué significan, si están vigentes, y si el sistema siquiera puede alcanzarlos es trabajo de pico y pala sin momentos destacados. Así que los equipos hacen la parte divertida y se saltan la parte que en realidad decide el resultado.

Y las cifras muestran el costo de saltársela. Gartner espera que una gran parte de los proyectos de IA sea abandonada a lo largo de 2026 precisamente porque los datos no estaban listos. No porque los modelos fueran demasiado débiles — nunca han sido más fuertes — sino porque la poco glamorosa base que tenían debajo nunca se construyó. La frontera corrió hacia adelante; la fontanería de datos se quedó donde siempre estuvo.

Qué hacer antes de culpar al modelo

La próxima vez que un proyecto de IA no rinda, pasa la lista de verificación de datos antes de tocar el modelo:

¿Son los datos precisos y actuales? Si la fuente está equivocada o desactualizada, un modelo más listo solo te da respuestas equivocadas más rápido y de forma más convincente.
¿Puede el sistema realmente alcanzarlos? Los datos atrapados en PDF, silos y sistemas que la IA no puede consultar bien podrían no existir. El acceso es la mitad de la batalla.
¿Significan lo que crees que significan? Definiciones inconsistentes, duplicados y contexto faltante rompen la IA en silencio — el resultado parece plausible y es sutilmente erróneo.
Y solo entonces, mira el modelo. Nueve de cada diez veces habrás encontrado tu problema antes de llegar aquí.

Arreglar los datos es lento y poco glamoroso. Y también es donde realmente vive el resultado.

En resumen

Los modelos de frontera son extraordinarios, que es exactamente por lo que tan rara vez son la razón por la que tu proyecto de IA fracasó. El eslabón débil es casi siempre la capa aburrida que tienen debajo.

Antes de culpar al modelo, revisa los datos — porque la causa más común de fracaso de la IA es la entrada, no la inteligencia. Cambiar de modelo es el arreglo que se siente productivo y normalmente no lo es. Limpiar tus datos es el arreglo que nadie quiere y el que funciona.

Comentarios

Aún no hay comentarios

Inicia sesión para unirte a la conversación.

Sé el primero en compartir una idea.