Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
Избранное
Свежее
1 июля 2026 г.
Удвой задачу — учетверишь провал
Все хотят агента, который работает целый рабочий день. Математика против. Свежая статья 2026 года показывает: удвоение длины задачи не удваивает частоту провала — оно её примерно учетверяет, потому что крошечная ошибка на шаге компаундится. 2% промаха на шаг превращаются в 33% шанс завалить всю задачу за 20 шагов. Долгая автономность — это не «дождись модели поумнее». Это архитектура: декомпозируй, ставь чекпоинты, проверяй.
- agents
- architecture
1 июля 2026 г.
Perplexity уходит от MCP — и они правы
MCP выиграл войну стандартов так быстро, что почти никто не успел спросить: а он вообще хорош в проде? А потом CTO Perplexity вслух сказал, что они уходят от него внутри — потому что метаданные инструментов могут съедать 40–50% окна контекста ещё до того, как агент сделает хоть что-то полезное. Мечта «просто воткни 50 MCP-серверов» разбивается об экономику контекста. Инструменты — это зависимость, а не шведский стол.
- architecture
- agents
1 июля 2026 г.
Голосовые агенты наконец прошли порог задержки
Годами голосовые ИИ-агенты спотыкались об одно — паузу. Те полсекунды мёртвого воздуха после того, как ты договорил, делали любого телефонного бота сломанным. В 2026-м паузы больше нет: сквозной стриминг речи, новые голосовые модели на state-space с 40 мс и round trip меньше 500 мс укладывают голос в окно, где разговор ощущается живым. Модель никогда не была сложной частью. Сложным был тайминг — а тайминг теперь инженерная задача, не исследовательская.
- ai-native
- agents
1 июля 2026 г.
«Workslop» — это не продуктивность. Это налог.
ИИ должен был забирать рутину. Во многих командах он делает обратное: производит правдоподобный на вид результат, который человек ниже по потоку вынужден распознавать, расшифровывать и переделывать. Исследователи назвали это «workslop», и цифры некрасивые — 53% офисных работников получали такое, каждый случай стоит ~2 часа на разбор, и это тихо отравляет доверие между коллегами. Это не прирост продуктивности. Это её перенос — и счёт оплачивает кто-то ниже по потоку.
- business
- methodology
1 июля 2026 г.
У твоих агентов есть логины, которыми никто не владеет
В этом году компании наплодили миллионы ИИ-агентов, и каждому нужны креды, чтобы вообще что-то делать — прочитать базу, отправить письмо, дёрнуть API. Слоя управления этими кредами пока нет. Итог: 68% организаций не могут надёжно отличить действия агента от действий человека, а живые креды пишут в прод без единого ответственного. Настоящая проблема безопасности агентного предприятия — не prompt injection. Это identity.
- security
- agents
23 июня 2026 г.
Фейковый баг-репорт угнал кодинг-агента
Исследователи показали новую атаку «Agentjacking»: отправь фейковую ошибку в Sentry компании — и её ИИ-агент для кода читает «шаги по исправлению» и выполняет их, отдавая атакующему твои креды с твоими же привилегиями. В тестах на это попались Claude Code, Cursor и Codex. Урок шире одного инструмента: всё недоверенное, что читает твой агент, — это место, куда можно вставить команды.
- security
- agents