ARCHITECTURE · 15 июня 2026 г.

Виновата не модель. Виноваты твои данные.

Большинство ИИ-проектов проваливаются — MIT нашёл, что 95% генеративных пилотов не дали измеримой прибыли, а RAND оценил общий процент провалов примерно в 80%. Когда что-то идёт не так, инстинкт — винить модель: недостаточно умна, не та, плохие промпты. Данные говорят иначе. Самая часто называемая причина провала — плохое качество данных, и лишь около 12% организаций имеют данные, достаточно чистые, чтобы вообще тянуть ИИ. У тебя, скорее всего, не проблема с моделью. У тебя проблема с данными в одежде проблемы с моделью. Как это распознать.

Цифры провалов корпоративного ИИ беспощадны, и их стоит произнести вслух. Исследование MIT нашло, что 95% генеративных пилотов не дали измеримого влияния на прибыль, а RAND оценил общий процент провалов ИИ-проектов примерно в 80%. Большинство ИИ-проектов не тихо недотягивают. Они проваливаются.

Когда это случается, почти все тянутся к одному объяснению: модель. Выбрали не ту, недостаточно умна, промпты были кривые, надо попробовать новый релиз. Этот инстинкт утешает, потому что чинится заменой. И он же обычно неверен. Самая часто называемая причина провала ИИ-проектов — вовсе не модель, а плохое качество данных, названное примерно в 85% провальных проектов, и лишь около 12% организаций вообще имеют данные, достаточно чистые, чтобы тянуть ИИ. Доказываю, потому что это разница между починкой, которая работает, и годом, потраченным на замену моделей.

Модель — видимая часть, поэтому на неё и валят

Когда ИИ-фича даёт плохие ответы, ты видишь, как косячит именно модель, — на неё и валишь. Но модель — последнее звено цепи, и она может быть хороша лишь настолько, насколько хорошо то, что в неё втекает. Скорми блестящей модели разрозненные, противоречивые, устаревшие, наполовину недоступные данные — и она выдаст уверенную чушь. Не потому что модель плохая, а потому что она честно отражает плохой вход.

Вот почему замена модели так часто ничего не меняет. Ты переходишь с одной фронтир-модели на более новую, демка всё равно разочаровывает, и ты делаешь вывод, что ИИ «ещё не готов». А на деле ты проапгрейдил единственную часть, которая не была сломана. Данные были узким местом до замены и остаются им после, потому что новая модель теперь читает тот же бардак, что и старая.

Данные скучные, поэтому их работу никто не хочет делать

Это повторяется не зря: чинить данные нудно и невидимо, а выбирать модель — увлекательно и быстро. Выбор модели ощущается как прогресс — есть лидерборд, релиз, демка. Разобраться, где живут твои данные, что они значат, актуальны ли и может ли система до них вообще дотянуться, — это чёрная работа без красивой нарезки. Так что команды делают весёлую часть и пропускают ту, что реально решает исход.

И цифры показывают цену пропуска. Gartner ожидает, что большую долю ИИ-проектов забросят в течение 2026-го именно потому, что данные не были готовы. Не потому что модели были слишком слабы — они никогда не были сильнее, — а потому что неэффектный фундамент под ними так и не построили. Фронтир умчался вперёд; трубопровод данных остался там, где был.

Что сделать, прежде чем винить модель

В следующий раз, когда ИИ-проект недотянет, прогони чек-лист по данным, прежде чем трогать модель:

Данные точные и актуальные? Если источник неверен или устарел, более умная модель просто выдаст тебе неверные ответы быстрее и убедительнее.
Система реально до них дотягивается? Данные, запертые в PDF, силосах и системах, которые ИИ не может запросить, всё равно что не существуют. Доступ — половина дела.
Они значат то, что ты думаешь? Несогласованные определения, дубли и потерянный контекст ломают ИИ тихо — вывод выглядит правдоподобно и тонко неверен.
И только потом смотри на модель. В девяти случаях из десяти ты найдёшь проблему раньше, чем дойдёшь сюда.

Чинить данные медленно и неэффектно. И именно там живёт результат.

Итог

Фронтир-модели поразительны — ровно поэтому они так редко являются причиной провала твоего ИИ-проекта. Слабое звено почти всегда — скучный слой под ними.

Прежде чем винить модель, проверь данные — потому что самая частая причина провала ИИ это вход, а не интеллект. Замена моделей — починка, которая ощущается продуктивной и обычно ею не является. Чистка данных — починка, которую никто не хочет, и та, что работает.