Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

13 июня 2026 г.
Самое большое окно контекста не побеждает
Каждый запуск модели хвастается окном контекста побольше — миллион токенов, два миллиона, вся кодовая база разом. Но анализ корпоративных внедрений нашёл, что почти 65% сбоев агентов шли от дрейфа контекста и потери памяти на многошаговой работе, а не от слишком маленького окна. Команды, что выпускают надёжных агентов в 2026-м, — не те, у кого окно больше. Это те, кто жёстче всех курирует то, что модель реально видит. Вот в чём разница и почему «больше» часто хуже.
- agents
- methodology
13 июня 2026 г.
Ваш агент работает в 57% случаев
Отчёт за март 2026-го посмотрел на 6259 ИИ-агентов в реальном проде и нашёл совокупную успешность 56,6% — чуть лучше монетки. Те же исследования показывают разрыв в 37% между тем, как агенты набирают на бенчмарках, и тем, как справляются в реальности. Этот разрыв и есть вся суть. Демо работает всегда; работа — заставить агента работать в остальных 43% случаев. Вот почему цифра так низка и что команды над ней делают иначе.
- agents
- methodology
13 июня 2026 г.
2026-й — год «покажи деньги» для ИИ
Мировые расходы на ИИ в этом году прогнозируют в 2,59 триллиона долларов, рост на 47% — а широко цитируемое исследование MIT нашло, что 95% корпоративных пилотов генеративного ИИ не дали измеримого ROI. Эти две цифры не могут сосуществовать вечно. Партнёр Menlo Ventures назвал 2026-й годом «покажи деньги», и компании меняют открытые бюджеты на потолки расходов, дашборды и ROI-гейты. Если вы строите с ИИ, эпоха «мы экспериментируем» как бесплатного пропуска заканчивается. Вот что реально меняет эта расплата — и как оказаться на правильной её стороне.
- business
13 июня 2026 г.
Веб-страница может отдавать приказы вашему агенту
Когда вы даёте ИИ-агенту браузер и позволяете читать страницы, кликать кнопки и выполнять команды, вы передали контроль над ним каждой странице, что он посещает. Исследователи показывали агентов, угнанных инструкциями, спрятанными в тексте сайта, в pastebin-ссылках, даже невидимо внутри скриншотов, на которые агент смотрит. Это называется непрямой инъекцией промпта, и это риск номер один в списке OWASP для LLM-приложений. Агент не отличит ваши инструкции от инструкций страницы. Вот почему это так трудно починить и как строить, чтобы враждебная страница не могла рулить вашим агентом.
- security
- agents
13 июня 2026 г.
Запишите это для машины
Теперь есть простой текстовый файл, который каждый серьёзный кодовый агент читает прежде, чем тронуть ваш репозиторий: AGENTS.md. На начало 2026-го его читают нативно Claude Code, Codex CLI от OpenAI, Cursor, Aider, Devin, GitHub Copilot, Gemini CLI, Windsurf и Amazon Q — это ближайшее к универсальному формату инструкций для агентов. Это самый рычажный час, который сейчас можно потратить на ИИ-кодинг, и почти никто его не тратит. Вот что туда кладут и почему это работает.
- methodology
- ai-native
13 июня 2026 г.
Сантехника вашего агента нараспашку
Первое крупномасштабное сканирование удалённых MCP-серверов — коннекторов, через которые ИИ-агенты дотягиваются до ваших инструментов и данных, — нашло, что около 40% выставляют свои инструменты вообще без аутентификации. Censys насчитал 12 520 доступных из интернета MCP-сервисов, большинство без защиты. Отдельный обход 40 000 репозиториев серверов дал 67 новых CVE. Агентный бум выкатил новый слой сантехники в прод быстрее, чем кто-либо его защитил, и прямо сейчас многое из неё открыто. Вот риск простыми словами и что проверить сегодня.
- security
- agents