Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
13 июня 2026 г.
Сантехника вашего агента нараспашку
Первое крупномасштабное сканирование удалённых MCP-серверов — коннекторов, через которые ИИ-агенты дотягиваются до ваших инструментов и данных, — нашло, что около 40% выставляют свои инструменты вообще без аутентификации. Censys насчитал 12 520 доступных из интернета MCP-сервисов, большинство без защиты. Отдельный обход 40 000 репозиториев серверов дал 67 новых CVE. Агентный бум выкатил новый слой сантехники в прод быстрее, чем кто-либо его защитил, и прямо сейчас многое из неё открыто. Вот риск простыми словами и что проверить сегодня.
- security
- agents
12 июня 2026 г.
Дайте кодинг-агенту ошибку и отойдите в сторону
Главная разница между полезным кодинг-агентом и бесящим — обычно не модель. А то, замкнули ли вы петлю. Агент, который пишет код и останавливается, — гадает. Агент, который запускает код, читает настоящую ошибку и пробует снова, пока тесты не пройдут, — в другой лиге: доля исправлений переваливает за 90% за пару итераций. Агент может починить только то, что видит, так что самое мощное, что вы можете сделать, — дать ему глаза. Вот ровно как.
- methodology
- agents
11 июня 2026 г.
Агенты, которые помнят
Главный прорыв агентов в 2026-м — не более умная модель, а память. ReasoningBank от Google позволяет агенту учиться на своих успехах и провалах, хранить рассуждения и измеримо становиться лучше со временем. Это скачок от инструмента, который сбрасывается каждое утро, к коллеге, который накапливает. Но у памяти есть второе лезвие: она превращает любую ошибку в постоянную. Неверный факт, отравленная инструкция или тихо устаревшее убеждение теперь переживают сессии и бьют по вам позже. Память — не фича, которую включают. Это корпус, которым надо управлять.
- ai-native
- agents
10 июня 2026 г.
Почему пул-реквест вашего агента отклоняют
Исследователи изучили 33 000 пул-реквестов, написанных ИИ-кодинг-агентами, и около 29% так и не были смёржены. Интересно почему: в основном не потому, что код был неверным, а потому, что PR был плохим артефактом сотрудничества — слишком большим, трогал слишком много файлов, мешал несвязанные правки, валил CI и плохо себя объяснял. Добиться, чтобы код приняли, оказывается, — другой навык, чем его написать, и ровно тот навык, которого у агентов по умолчанию нет. Разбираю, что это значит.
- methodology
- agents
9 июня 2026 г.
Вы вот-вот станете руководить штатом агентов
В этом месяце запустилась платформа, позволяющая компаниям нанимать, онбордить, управлять и даже платить ИИ-агентам — по всем крупным моделям — под одним паспортом и одним аудит-следом. Её слоган: «ваш следующий наём — не человек». Уберите маркетинг — и под ним реальный сдвиг: работа переезжает с использования ИИ-инструмента на управление их командой. Это другой навык, чем промптинг, большинство к нему не готовы, и выбранная ментальная модель решает, сработает ли это.
- agents
- methodology
9 июня 2026 г.
Агенты стали умнее. Надёжнее они не стали.
Новое исследование прогнало 14 моделей через тесты на надёжность и нашло то, что прячет гонка бенчмарков: два года взлёта возможностей дали лишь небольшой прирост надёжности. Умнее не значит стабильнее. И математика беспощадна — даже шаг с надёжностью 95%, выполненный 20 раз подряд, доводит всю задачу до верного конца примерно в трети случаев. Мы выбираем агентов по интеллекту, когда решает, работают ли они, совсем другое — то, что мы почти не измеряем.
- eval
- agents