Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
4 июня 2026 г.
Лаборатории теперь гонятся за ценой, а не за IQ
Два года у запуска флагманской модели был один заголовок: мы самые умные, вот побитый бенчмарк. На Microsoft Build 2026 заголовок сменился — та же лига, что Opus, но ~10x больше output на доллар и на 60% меньше токенов. Хвастовство сместилось с IQ на эффективность, и вся индустрия перестраивается вокруг цены, а не пика возможностей. Вот почему ось перевернулась и что это значит, если ты строишь.
- ai-native
- business
- agents
4 июня 2026 г.
Память — это новая поверхность атаки
Все наперегонки дают агентам долговременную память — очевидный апгрейд. Но долговечная возможность — это долговечная уязвимость. Prompt injection одноразова и сбрасывается; memory poisoning записывает одну ложь в хранилище агента, и она едет с ним сквозь каждую будущую сессию, для каждого пользователя, пока кто-то её не вычистит. Она оружием делает саму суть памяти — обучение на прошлом. Вот как работает «атака, которая ждёт», и как её огородить.
- security
- architecture
- agents
4 июня 2026 г.
Твои агенты без состояния. Поэтому они умирают.
На твоём ноуте агент проходит путь от начала до конца за один заход, и проблемы ты не видишь. Прод — это длинный многошаговый процесс на инфраструктуре, которая перезапускается, ловит таймауты и падает на полпути, — а агент держал весь свой прогресс в памяти. «Agentic reckoning» 2026-го — это открытие, что сбой не в модели, а в рантайме. Починка старая и скучная: durable execution. Вот честная версия.
- architecture
- agents
- methodology
4 июня 2026 г.
Нижняя ступень исчезла
Данные пришли, и они конкретны: ИИ съел джуна, а не сеньора. Компании не увольняют джунов — они тихо перестали их нанимать, потому что задачи джунов это ровно то, что теперь делают агенты. Выглядит эффективно. Но сеньоров не нанимают, их выращивают — сеньор это джун, переживший пару тысяч багов. Сократи джунов ради экономии сейчас — и заморишь конвейер, который делает сеньоров, на которых ты опираешься. Мы съедаем посевное зерно.
- careers
- ai-native
- business
4 июня 2026 г.
Счёт пришёл
Два года стоимость ИИ ощущалась как погрешность округления. В 2026-м пришёл инвойс — Uber сжёг годовой AI-бюджет за четыре месяца, Microsoft отобрал Claude Code у своих же инженеров, JPMorgan говорит, что токены съедают прибыль интернета. Это не временный всплеск. Токен-биллинг переворачивает экономику, на которой построен софт, и злая ирония в том, что агент получше стоит дороже. Вот что реально изменилось — честно.
- business
- ai-native
- agents
4 июня 2026 г.
Год, когда агент стал атакующим
Год назад безопасность агентов была мысленным экспериментом — а что если твоего агента обманут? В 2026-м она стала конкретной, в трёх видах: один любитель с помощью Claude Code и GPT взломал девять госагентств и 195 миллионов записей; ИИ провёл кампанию против 600 файрволов в 55 странах без человека за рулём; а внутренний агент Meta слил чувствительные данные вообще без атакующего. Один и тот же опасный примитив, наведённый в три стороны. Вот честная модель угроз.
- security
- agents