Все заметки
Эпоха одной модели на всё заканчивается

10 июня 2026 г.

Эпоха одной модели на всё заканчивается

Microsoft выпустила сразу семь ИИ-моделей — не один мозг побольше, а модель для рассуждений, для кода, для транскрипции, для голоса и другие, каждая под одну задачу. А передовые универсалы тем временем продолжают становиться способнее. Оба факта верны, и разрыв между ними — в этом и суть: гонка заголовков про одну модель, делающую всё, но в продакшене реально работает курируемый стек специалистов. «Какая модель лучшая» — теперь неправильный вопрос.

Две истории этого месяца странно соседствуют. Anthropic выпустила Claude Fable 5, свою самую способную модель, доступную публике — передовой универсал, растущий как всегда. А Microsoft выпустила не одну модель, а семь сразу: модель для рассуждений, поменьше для рассуждений, для кода, для изображений, для транскрипции и две для голоса — каждая под одну способность, а не под общую широту.

Это не противоречие; это две половины того, куда всё идёт. Гонка, за которой все следят, — про то, как одна модель становится лучше во всём. А то, что реально едет в продакшен, — противоположность: стек специализированных моделей, каждая делает одну работу, в которой лучшая. И как только увидишь этот раскол, «какая модель лучшая» перестаёт быть осмысленным вопросом.

Эпоха одной модели-на-всё закрывается

Пару лет ментальная модель была проста: есть лучшая модель, ты используешь её для всего, а когда выходит лучше — переключаешься. Это тихо заканчивается. Как сформулировал один обзор, поле фрагментировалось на специализированные модели, каждая доминирует в своей модальности, — и дни, когда одна модель справлялась со всем, прошли. Практики, строящие реальные системы, всё чаще крутят курируемый стек моделей, выбранных под задачу, а не одного помазанного чемпиона.

Запуск семи моделей у Microsoft — это тот же тезис, сделанный конкретным компанией, которая продаёт наибольшему числу предприятий на земле. Они не пытались построить одну модель, которая транскрибирует, рассуждает, кодит и генерирует голос одинаково хорошо. Они построили модель транскрипции, отличную в транскрипции, и модель кода, настроенную быть дешёвой и быстрой в коде, и спроектировали их работать вместе. Это не хедж — это заявление, что лучшие результаты дают специалисты, собранные вместе.

Почему «лучшая модель» — неправильный вопрос

Вот ловушка, в которую входит мышление одной модели. Универсальная передовая модель почти по определению переквалифицирована и неэффективна для большинства отдельных работ. Использовать самую мощную модель рассуждений, чтобы транскрибировать аудио или переформатировать дату, — это как нанять хирурга, чтобы наклеить пластырь: работает и абсурдно. Фестиваль ИИ в Каннах вытащил ровно это — предприятия проваливаются не потому, что ИИ недостаточно мощен, а потому, что продолжают пихать универсальные модели в продакшен-системы, которые наказывают неэффективность.

Так что у вопроса «какая модель лучшая» нет ответа, потому что в нём не хватает второй половины: лучшая в чём. Правильная модель транскрипции плоха в коде. Самая дешёвая модель кода бесполезна в зрении. Передовой универсал сильнее всех в по-настоящему сложном, открытом — и избыточен, медлен и дорог везде ещё. Это модельная версия того же урока, что верен для агентов: узкий инструмент под одну работу обыгрывает универсальный, пытающийся делать все.

Стройте стек, а не ставку

Практический ход — перестать выбирать одну модель и начать собирать стек, и ровно для этого паттерн маршрутизации. Вы мапите работы на модели: специалист там, где он выигрывает, дешёвая модель для рутины, передовой универсал зарезервирован для сложного ядра. Несколько принципов:

  • Подбирайте модель под работу, намеренно. Транскрипцию — модели транскрипции, массовую классификацию — маленькой быстрой, по-настоящему сложное рассуждение — передовой. Не отправляйте всё по умолчанию в самую мощную модель — это дорогой, медленный способ лениться.
  • Маршрутизируйте, а не выбирайте. Продукт — это не один вызов модели; их много. Отправляйте каждый в наименьшую подходящую модель, что справится, и эскалируйте, только когда надо. Стек, а не единственный выбор, — это архитектура.
  • Берегите универсала для того, что может только он. Передовая модель окупает свою стоимость на открытых, многошаговых, новых задачах. Для всего узкого и хорошо определённого специалист быстрее, дешевле и часто лучше.
  • Держите каждый слот заменяемым. Специалистов меняют даже быстрее, чем универсалов. За чистым швом замена модели транскрипции или модели кода — правка конфига, и ваш стек тихо улучшается по частям.

Суть

Заголовки продолжат короновать «лучшую модель», потому что одно растущее число — это хорошая история. Но то, как реально строится ценность, движется в другую сторону: к стеку специалистов, каждый превосходен в одном, собранных в систему, — ровно то, о чём Microsoft просигналила, выпустив семь моделей вместо одной. Передовой универсал всё ещё важен; он просто один слот в стеке теперь, а не весь ответ.

Так что когда тянетесь за «лучшей моделью», остановитесь и задайте вопрос получше: лучшая в какой из работ, что реально делает мой продукт? Ответьте на это под задачу, соберите специалистов и маршрутизируйте между ними — и получите продукт дешевле, быстрее и лучше, чем тот, что пытается заставить одного блестящего универсала делать всё. Эпоха одной модели была проще. Эпоха стека просто лучше.

Комментарии

Пока нет комментариев

Войдите, чтобы участвовать в разговоре.

Будьте первым, кто оставит мысль.