15 июня 2026 г.
Пилот был дешёвым. Прод — не будет.
Твой ИИ-пилот отработал отлично и стоил почти ничего. Эта цифра тебя обманула. Когда команды тащат ИИ-фичу из пилота в прод, инфраструктурные затраты регулярно выходят в три-пять раз выше первоначальной оценки — и это большая причина, почему 95% генеративных пилотов так и не превращаются в то, что видно в P&L. Пилот дёшев, потому что он маленький, под присмотром и крутится на лёгких случаях. Прод — ни то, ни другое, ни третье. Разбираем, где прячется этот ×3–5 и как заложить его в цену, пока он не устроил засаду.
ИИ-пилот идёт красиво. Работает, демка заходит, а счёт настолько мал, что почти погрешность округления. И ты даёшь зелёный свет проду с этой цифрой в голове — а эта цифра самая обманчивая вещь во всём проекте. Когда команды реально масштабируют ИИ-фичу, затраты регулярно выходят в три-пять раз выше первоначальной оценки, и этот разрыв — большая причина, почему 95% генеративных пилотов так и не дают измеримого финансового результата.
Это не невезение и не кривая оценка. Пилот дёшев по структурным причинам, и каждая из них исчезает в момент выхода в прод. Если ты не знаешь, откуда берётся этот ×3–5, кажется, что проект подорожал. Он не подорожал. Он просто перестал прятать свою реальную цену. Покажу, где она живёт.
Пилот дёшев, потому что он маленький, под присмотром и лёгкий
Три вещи делают пилот дешёвым, и все три временные. Он маленький — горстка пользователей, ручеёк запросов, токен-счёт, который ты едва замечаешь. Он под присмотром — рядом человек, ловящий странные выводы, так что тебе ещё не нужны ограждения, ретраи и мониторинг, которые требуются, чтобы ловить их автоматически. И он крутится на лёгких случаях — чистых, happy-path входах, на которых ты естественно тестируешь сначала.
Прод переворачивает все три. Маленький становится тысячами запросов в день, и токен-счёт растёт вместе с ним линейно и вечно. Под присмотром становится без присмотра — и вот ты платишь за мониторинг, fallback-логику, вторую модель, что проверяет первую. А лёгкие случаи становятся реальными — грязными, длинными, враждебными входами, которым нужны окна контекста побольше, больше ретраев и более дорогие вызовы, чтобы выдать верное. Ничего этого не было в пилоте. Всё это есть в счёте.
Множители, которые никто не кладёт в оценку
×3–5 — это не один большой сюрприз. Это стопка тихих множителей, каждый разумный, которые накручиваются:
- Ретраи и сбои. Реальные входы падают и переотправляются. Каждый ретрай — ещё один платный вызов, а на масштабе доля сбоев никогда не ноль.
- Рост контекста. Happy-path промпт был коротким. Реальные запросы тянут историю, документы и контекст, и ты платишь за токен за всё это, каждый раз.
- Слой проверки. Проду нужно ловить свои же ошибки — вторая модель, проход валидации, ограждение. Это может удвоить вызовы за одним действием пользователя.
- Краевые случаи, которым нужна дорогая модель. Лёгкие 80% крутятся на дешёвой модели. Тяжёлые 20% тихо уходят на дорогую, а в реальном трафике их доля больше, чем в пилотном.
Каждый из них сам по себе разумен. Сложенные вместе — вот как пилот за копейки становится продом за реальные деньги.
Как заложить это в цену до засады
Сделать прод таким же дешёвым, как пилот, не выйдет, но перестать им удивляться — можно:
- Оценивай цену запроса на тяжёлых случаях, а не на лёгких. Посчитай грязный, длинный, переотправленный запрос — вот как выглядит прод.
- Добавь в математику вызовы на проверку и мониторинг. Если ловля ошибок удваивает вызовы — заложи удвоение сейчас, а не в счёте потом.
- Умножь на реалистичный объём, потом добавь запас. Возьми честную цену за запрос, масштабируй на реальный трафик и считай, что выйдет выше. Планировать ×3–5 — значит планировать то, что обычно и случается.
Продовая ИИ-фича вполне может стоить своих денег. Но только если ты знал цену на входе.
Итог
Дешёвый пилот — самая дорогая ложь в ИИ-проектах, потому что задаёт ожидание, которое прод не может выполнить, и заставляет реальную цифру выглядеть провалом, а не правдой.
Пилот дёшев, потому что он маленький, под надзором и протестирован на лёгких случаях, — а прод ни то, ни другое, ни третье, и вот откуда ×3–5. Оцени тяжёлый случай, посчитай скрытые вызовы и заложи множитель заранее. В засаду попадают не те, кто потратил слишком много. А те, кто поверил пилоту.
Комментарии
Пока нет комментариев
Войдите, чтобы участвовать в разговоре.
Будьте первым, кто оставит мысль.