Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

4 июня 2026 г.
Память — это новая поверхность атаки
Все наперегонки дают агентам долговременную память — очевидный апгрейд. Но долговечная возможность — это долговечная уязвимость. Prompt injection одноразова и сбрасывается; memory poisoning записывает одну ложь в хранилище агента, и она едет с ним сквозь каждую будущую сессию, для каждого пользователя, пока кто-то её не вычистит. Она оружием делает саму суть памяти — обучение на прошлом. Вот как работает «атака, которая ждёт», и как её огородить.
- security
- architecture
- agents
4 июня 2026 г.
Твои агенты без состояния. Поэтому они умирают.
На твоём ноуте агент проходит путь от начала до конца за один заход, и проблемы ты не видишь. Прод — это длинный многошаговый процесс на инфраструктуре, которая перезапускается, ловит таймауты и падает на полпути, — а агент держал весь свой прогресс в памяти. «Agentic reckoning» 2026-го — это открытие, что сбой не в модели, а в рантайме. Починка старая и скучная: durable execution. Вот честная версия.
- architecture
- agents
- methodology
4 июня 2026 г.
Счёт пришёл
Два года стоимость ИИ ощущалась как погрешность округления. В 2026-м пришёл инвойс — Uber сжёг годовой AI-бюджет за четыре месяца, Microsoft отобрал Claude Code у своих же инженеров, JPMorgan говорит, что токены съедают прибыль интернета. Это не временный всплеск. Токен-биллинг переворачивает экономику, на которой построен софт, и злая ирония в том, что агент получше стоит дороже. Вот что реально изменилось — честно.
- business
- ai-native
- agents
4 июня 2026 г.
Год, когда агент стал атакующим
Год назад безопасность агентов была мысленным экспериментом — а что если твоего агента обманут? В 2026-м она стала конкретной, в трёх видах: один любитель с помощью Claude Code и GPT взломал девять госагентств и 195 миллионов записей; ИИ провёл кампанию против 600 файрволов в 55 странах без человека за рулём; а внутренний агент Meta слил чувствительные данные вообще без атакующего. Один и тот же опасный примитив, наведённый в три стороны. Вот честная модель угроз.
- security
- agents
3 июня 2026 г.
Большинство ИИ-агентов так и не доходят до прода
Демо ослепляет. А потом агент так и не выходит в релиз. Опрос за опросом в 2025–26 находят один и тот же обрыв: пилот есть почти у всех, в проде — почти ни у кого. И дело не в модели, а в неблагодарной инженерии, которую демо позволило пропустить. Вот что делает иначе то меньшинство, которое реально доводит до прода.
- agents
- eval
- methodology
3 июня 2026 г.
Дешёвая модель справится с 90% работы
Дефолтный ход — навести самую большую и умную модель на всё подряд. В демо работает, на масштабе тихо разоряет — потому что бо́льшая часть того, что делает агент, это не рассуждение, а механика, и ты платишь зарплату гения за чтение анкеты. Починка скучная и стоит ~90%: умная модель планирует, дешёвые — делают. Вот экономика и единственное архитектурное правило, без которого это невозможно.
- agents
- architecture
- business