Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

15 июня 2026 г.
Скучная победа ИИ — это бумажки
NHS только что подписала контракт на £120 млн, чтобы дать 505 000 сотрудников ИИ-ассистента. Не диагностировать болезни — делать бумажную работу. На тестах средний человек экономил 43 минуты в день, а одно отделение срезало завал с выписными письмами на 62% за месяц. Это та ИИ-история, которую никто не ставит в кейноут: устойчивая, внедряемая ценность обычно в нудной, объёмной рутине, а не в эффектной демке. Разбираем, почему скучный сценарий — тот, что реально окупается, и почему стоит искать свой.
- business
- methodology
14 июня 2026 г.
Ускорение от ИИ в коде меньше, чем кажется
В контролируемом исследовании опытные разработчики, использовавшие ИИ на собственных кодовых базах, были измеримо медленнее на сложных задачах — и всё это время чувствовали себя на 20% быстрее. Уточнённое исследование 2026 года с лучшей методологией дало небольшой плюс, а не большой. При этом ИИ-инструментами пользуются около 93% разработчиков, а общая производительность почти не сдвинулась. Это не значит, что ИИ в коде — фикция. Это значит, что ощущение скорости и факт скорости разошлись, и если управлять по ощущению — будешь управлять неверно. Разбираемся, как отличить одно от другого.
- methodology
- careers
13 июня 2026 г.
Зелёная галочка может скрывать сломанную середину
Вот режим сбоя, что съедает ИИ-агентов в проде: агент выполняет многошаговую задачу, где-то в середине сворачивает не туда — и всё равно выдаёт финальный ответ, что проходит вашу проверку. Вывод выглядит чисто. Рассуждение было сломано. Исследователи нашли, что именно так и падают многошаговые агенты: ошибка на третьем шаге незаметно протекает в сводку на десятом, что читается нормально и при этом неверна. Если вы оцениваете только финальный ответ, вы слепы к большей части того, как агенты реально ломаются. Вот почему и что проверять вместо этого.
- methodology
- agents
13 июня 2026 г.
Самое большое окно контекста не побеждает
Каждый запуск модели хвастается окном контекста побольше — миллион токенов, два миллиона, вся кодовая база разом. Но анализ корпоративных внедрений нашёл, что почти 65% сбоев агентов шли от дрейфа контекста и потери памяти на многошаговой работе, а не от слишком маленького окна. Команды, что выпускают надёжных агентов в 2026-м, — не те, у кого окно больше. Это те, кто жёстче всех курирует то, что модель реально видит. Вот в чём разница и почему «больше» часто хуже.
- agents
- methodology
13 июня 2026 г.
Ваш агент работает в 57% случаев
Отчёт за март 2026-го посмотрел на 6259 ИИ-агентов в реальном проде и нашёл совокупную успешность 56,6% — чуть лучше монетки. Те же исследования показывают разрыв в 37% между тем, как агенты набирают на бенчмарках, и тем, как справляются в реальности. Этот разрыв и есть вся суть. Демо работает всегда; работа — заставить агента работать в остальных 43% случаев. Вот почему цифра так низка и что команды над ней делают иначе.
- agents
- methodology
13 июня 2026 г.
Запишите это для машины
Теперь есть простой текстовый файл, который каждый серьёзный кодовый агент читает прежде, чем тронуть ваш репозиторий: AGENTS.md. На начало 2026-го его читают нативно Claude Code, Codex CLI от OpenAI, Cursor, Aider, Devin, GitHub Copilot, Gemini CLI, Windsurf и Amazon Q — это ближайшее к универсальному формату инструкций для агентов. Это самый рычажный час, который сейчас можно потратить на ИИ-кодинг, и почти никто его не тратит. Вот что туда кладут и почему это работает.
- methodology
- ai-native