Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

4 июня 2026 г.
Tokenmaxxing, или закон Гудхарта добрался до ИИ
Компании хотели «внедрения ИИ», поэтому измерили самый простой прокси — использование токенов, повесили его на лидерборд и получили ровно то, что измеряли: люди жгут токены ради рейтинга, а не ради лучшей работы. Пятидесятилетний закон съедает свежую стратегию, и теперь это дорого вдвойне: ты платишь за впустую сожжённые токены и отравляешь сигнал, который хотел получить. Починка тоже старая — мерь результат, а не активность.
- methodology
- business
4 июня 2026 г.
Твой оргчарт не умеет в агентов
Каждый руководитель спрашивает: «модель уже достаточно хороша?» Свежие данные MIT говорят, что вопрос не тот: 85% организаций хотят быть agentic, но 76% признают, что их собственные операции этого не вытянут. Блокер — не возможности модели, а то, что компании прикручивают работника нового типа к оргчарту, нарисованному для людей. У агента нет менеджера, нет карьерной лестницы, есть scoped-права и уровень галлюцинаций. Вот клетка, которой не хватает в твоей схеме.
- business
- methodology
- ai-native
3 июня 2026 г.
Большинство ИИ-агентов так и не доходят до прода
Демо ослепляет. А потом агент так и не выходит в релиз. Опрос за опросом в 2025–26 находят один и тот же обрыв: пилот есть почти у всех, в проде — почти ни у кого. И дело не в модели, а в неблагодарной инженерии, которую демо позволило пропустить. Вот что делает иначе то меньшинство, которое реально доводит до прода.
- agents
- eval
- methodology
3 июня 2026 г.
Дешёвая модель справится с 90% работы
Дефолтный ход — навести самую большую и умную модель на всё подряд. В демо работает, на масштабе тихо разоряет — потому что бо́льшая часть того, что делает агент, это не рассуждение, а механика, и ты платишь зарплату гения за чтение анкеты. Починка скучная и стоит ~90%: умная модель планирует, дешёвые — делают. Вот экономика и единственное архитектурное правило, без которого это невозможно.
- agents
- architecture
- business
3 июня 2026 г.
Я перестал одобрять решения агента. Теперь я их наблюдаю.
Когда я начинал строить агентов, я одобрял каждое действие — это ощущалось ответственным. Это было не так: к тридцатому «да» я уже штамповал, а это хуже, чем отсутствие чекпоинта. Настоящий надзор — не трогать каждое решение, а задать политику и наблюдать за результатами. Вот сдвиг от in-the-loop к on-the-loop и архитектура, которая делает «отпустить» по-настоящему безопасным.
- agents
- methodology
- ai-native
3 июня 2026 г.
Заземление — это не фича. Это ограничение.
LLM по своей природе — угадыватель: она всегда будет что-то выдумывать, и промптом это не вылечить. Единственный надёжный приём — архитектурный: поставить за факты детерминированный источник, а модель понизить до пересказчика, которому запрещено их авторствовать. «Прикрутить RAG» — это не оно. Вот в чём разница и почему это граница между ИИ, который уверенно звучит, и тем, которому можно доверять.
- architecture
- agents
- methodology