10 июня 2026 г.
«Управляемые агенты» удобны, пока вы не захотите уйти
Google, Anthropic и другие толкают самую лёгкую подачу в ИИ: один вызов API, и мы крутим вашего агента целиком — песочницу, инструменты, память, состояние — на нашей инфраструктуре. Это правда удобно, и для прототипа это отлично. Но заметьте, что вы отдали. Управляемый API модели сдаёт вам в аренду мозг, который остаётся заменяемым. Управляемый агент сдаёт всю нервную систему вашего продукта, а это куда более глубокий крючок. Удобство и привязка здесь — одна и та же покупка, и счёт приходит позже.
Самая горячая подача в ИИ сейчас — управляемый агент. Google в этом сезоне сделала официальными Managed Agents в Gemini API: один вызов API поднимает агента в изолированной облачной песочнице, где он рассуждает, планирует, вызывает инструменты, выполняет код, управляет файлами и держит состояние, — а инфраструктура Google делает всё это, так что вы ничего не провижените. Anthropic выпустила свои Claude Managed Agents как единое окно. Обещание всюду одно: пропусти сантехнику, отгрузи агента за день.
Это правда удобно, и я не хочу делать вид, что нет. Для прототипа, выброса, штуки с низкими ставками управляемый агент — отличная сделка. Но стоит ясно понимать, что вы на самом деле покупаете, потому что удобство и привязка здесь — ровно одна и та же сделка, а цена всплывает куда позже, чем удобство.
Вы больше не арендуете модель. Вы арендуете нервную систему.
Вот различие, которое важно. Я уже писал, что модель за чистым швом остаётся заменяемой — вы арендуете мозг и можете менять мозги значением в конфиге. Управляемый агент — другая покупка. Вы арендуете не только модель; вы арендуете рантайм (где агент исполняется), память и состояние (что он помнит между запусками), слой инструментов (как он действует) и наблюдаемость (как вы видите, что он сделал). Это не один компонент. Это вся операционная система вашего продукта, работающая внутри стен одного вендора.
И в отличие от модели, эти части накапливаются. Как формулирует разбор этой волны, вы в итоге вшиваете архитектуру агента в рантайм, governance и наблюдаемость платформы так, что со временем это накапливается и всё труднее распутывается. Чем дольше он крутится, тем больше памяти и поведения вашего продукта живёт там, откуда вы не легко это унесёте. Это проблема контекстной привязки пару недель назад, протолкнутая на слой глубже: не просто ваши данные, а вся машина, что на них действует.
Тест на 10%
Есть жестокая цифра, которую стоит держать в кармане. Одна оценка 2026-го нашла, что примерно 90% запусков «агентов» — это управляемые вендором обёртки над фичами — им не хватает контролируемого вами постоянного состояния, переносимости модели и внешней аудируемости. Лишь около 10% — настоящие переносимые платформы, где агент реально может работать независимо от инфраструктуры вендора.
Это даёт чистую проверку для любого продукта с управляемыми агентами: можете ли вы взять память, инструменты и определение своего агента и запустить их где-то ещё? Если да — это настоящая платформа, и удобство бесплатно. Если нет — если мозг, память, навыки и рантайм вашего агента целиком вендорские, без экспорта, — то это не платформа, а фича с платой за выход, и плата — весь ваш продукт.
Берите ради скорости, отвязывайте то, что накапливается
Это не аргумент «никогда не пользуйтесь управляемыми агентами» — это было бы глупо, скорость реальна. Это аргумент «знай, какую сделку заключаешь». Паттерн самых острых команд — отвязать накапливающиеся части от рантайма вендора: держать слой памяти, библиотеку инструментов/навыков и оркестрацию в форматах, которые вы контролируете, чтобы можно было сменить рантайм, не теряя накопленное состояние продукта. Несколько практических строк:
- Управляемое нормально для низких ставок и прототипов; отвязывайте для всего ядрового. Чем быстрее вам навредит невозможность уйти, тем меньше вашей нервной системы должно жить в рантайме вендора.
- Владейте своей памятью и инструментами. Накопленное состояние агента и определения его инструментов/навыков — части с гравитацией. Держите их экспортируемыми и в открытых форматах, опираясь на открытые слои вроде MCP для инструментов, чтобы они не застряли в одном рантайме.
- Применяйте тот же тест на выход, что и к модели. Я всё время спрашиваю про провайдера: если он завтра удвоит цену или закроет сервис, сколько уходить? Спросите то же про агентный рантайм. Если честный ответ «не смогли бы», вы купили не удобство — вы купили зависимость.
- Следите за данными, а не только за рантаймом. Логи, трассы и любой fine-tuning где-то живут; если они существуют только внутри управляемого сервиса без экспорта — это привязка в обличье дашборда.
Суть
Управляемые агенты — самое соблазнительное предложение в ИИ, потому что убирают самую нудную работу — рантайм, сантехнику, управление состоянием — одним вызовом. И именно поэтому они заслуживают второго взгляда. Сантехника, которую они убирают, — это та же часть, которую, наполнившись памятью и поведением вашего продукта, не вернёшь без пересборки.
Так что берите удобство там, где ставки низки, а где нет — помните, что отдаёте: не модель, которую можно сменить, а всю машину, которой ваш продукт думает. Стройте так, чтобы накапливающиеся части — память, инструменты, оркестрация — были вашими и переносимыми, и пусть вендор крутит скучное исполнение под ними. Проведите эту границу правильно — и управляемые агенты чистый рычаг. Проведите неверно — и один удобный вызов API станет причиной, по которой вы никогда не сможете уйти.
Комментарии
Пока нет комментариев
Войдите, чтобы участвовать в разговоре.
Будьте первым, кто оставит мысль.