Все заметки
Пилот был дешёвым. Прод — не будет.

15 июня 2026 г.

Пилот был дешёвым. Прод — не будет.

Твой ИИ-пилот отработал отлично и стоил почти ничего. Эта цифра тебя обманула. Когда команды тащат ИИ-фичу из пилота в прод, инфраструктурные затраты регулярно выходят в три-пять раз выше первоначальной оценки — и это большая причина, почему 95% генеративных пилотов так и не превращаются в то, что видно в P&L. Пилот дёшев, потому что он маленький, под присмотром и крутится на лёгких случаях. Прод — ни то, ни другое, ни третье. Разбираем, где прячется этот ×3–5 и как заложить его в цену, пока он не устроил засаду.

ИИ-пилот идёт красиво. Работает, демка заходит, а счёт настолько мал, что почти погрешность округления. И ты даёшь зелёный свет проду с этой цифрой в голове — а эта цифра самая обманчивая вещь во всём проекте. Когда команды реально масштабируют ИИ-фичу, затраты регулярно выходят в три-пять раз выше первоначальной оценки, и этот разрыв — большая причина, почему 95% генеративных пилотов так и не дают измеримого финансового результата.

Это не невезение и не кривая оценка. Пилот дёшев по структурным причинам, и каждая из них исчезает в момент выхода в прод. Если ты не знаешь, откуда берётся этот ×3–5, кажется, что проект подорожал. Он не подорожал. Он просто перестал прятать свою реальную цену. Покажу, где она живёт.

Пилот дёшев, потому что он маленький, под присмотром и лёгкий

Три вещи делают пилот дешёвым, и все три временные. Он маленький — горстка пользователей, ручеёк запросов, токен-счёт, который ты едва замечаешь. Он под присмотром — рядом человек, ловящий странные выводы, так что тебе ещё не нужны ограждения, ретраи и мониторинг, которые требуются, чтобы ловить их автоматически. И он крутится на лёгких случаях — чистых, happy-path входах, на которых ты естественно тестируешь сначала.

Прод переворачивает все три. Маленький становится тысячами запросов в день, и токен-счёт растёт вместе с ним линейно и вечно. Под присмотром становится без присмотра — и вот ты платишь за мониторинг, fallback-логику, вторую модель, что проверяет первую. А лёгкие случаи становятся реальными — грязными, длинными, враждебными входами, которым нужны окна контекста побольше, больше ретраев и более дорогие вызовы, чтобы выдать верное. Ничего этого не было в пилоте. Всё это есть в счёте.

Множители, которые никто не кладёт в оценку

×3–5 — это не один большой сюрприз. Это стопка тихих множителей, каждый разумный, которые накручиваются:

  • Ретраи и сбои. Реальные входы падают и переотправляются. Каждый ретрай — ещё один платный вызов, а на масштабе доля сбоев никогда не ноль.
  • Рост контекста. Happy-path промпт был коротким. Реальные запросы тянут историю, документы и контекст, и ты платишь за токен за всё это, каждый раз.
  • Слой проверки. Проду нужно ловить свои же ошибки — вторая модель, проход валидации, ограждение. Это может удвоить вызовы за одним действием пользователя.
  • Краевые случаи, которым нужна дорогая модель. Лёгкие 80% крутятся на дешёвой модели. Тяжёлые 20% тихо уходят на дорогую, а в реальном трафике их доля больше, чем в пилотном.

Каждый из них сам по себе разумен. Сложенные вместе — вот как пилот за копейки становится продом за реальные деньги.

Как заложить это в цену до засады

Сделать прод таким же дешёвым, как пилот, не выйдет, но перестать им удивляться — можно:

  • Оценивай цену запроса на тяжёлых случаях, а не на лёгких. Посчитай грязный, длинный, переотправленный запрос — вот как выглядит прод.
  • Добавь в математику вызовы на проверку и мониторинг. Если ловля ошибок удваивает вызовы — заложи удвоение сейчас, а не в счёте потом.
  • Умножь на реалистичный объём, потом добавь запас. Возьми честную цену за запрос, масштабируй на реальный трафик и считай, что выйдет выше. Планировать ×3–5 — значит планировать то, что обычно и случается.

Продовая ИИ-фича вполне может стоить своих денег. Но только если ты знал цену на входе.

Итог

Дешёвый пилот — самая дорогая ложь в ИИ-проектах, потому что задаёт ожидание, которое прод не может выполнить, и заставляет реальную цифру выглядеть провалом, а не правдой.

Пилот дёшев, потому что он маленький, под надзором и протестирован на лёгких случаях, — а прод ни то, ни другое, ни третье, и вот откуда ×3–5. Оцени тяжёлый случай, посчитай скрытые вызовы и заложи множитель заранее. В засаду попадают не те, кто потратил слишком много. А те, кто поверил пилоту.

Комментарии

Пока нет комментариев

Войдите, чтобы участвовать в разговоре.

Будьте первым, кто оставит мысль.