Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

1 июля 2026 г.
У твоих агентов есть логины, которыми никто не владеет
В этом году компании наплодили миллионы ИИ-агентов, и каждому нужны креды, чтобы вообще что-то делать — прочитать базу, отправить письмо, дёрнуть API. Слоя управления этими кредами пока нет. Итог: 68% организаций не могут надёжно отличить действия агента от действий человека, а живые креды пишут в прод без единого ответственного. Настоящая проблема безопасности агентного предприятия — не prompt injection. Это identity.
- security
- agents
1 июля 2026 г.
Твоё окно на миллион токенов тебе врёт
Вендоры продают длину контекста как RAM: больше — строго лучше, просто впихни всё. Но внимание не равномерно. Исследования снова и снова находят одну и ту же U-образную кривую: модель надёжно использует начало и конец окна и тихо игнорирует середину, а точность падает на 30%+, как только важное закопано туда, — иногда уже после 10k токенов. Контекст — не ведро, которое наполняешь. Это дефицитный, позиционный ресурс, который проектируешь. «Впихни всё в промпт» — это новая преждевременная оптимизация.
- architecture
- methodology
1 июля 2026 г.
Твоя модель — это вендор, а не инфраструктура
Основатели относятся к фронтир-модели как к электричеству — коммуналке, которая всегда в розетке. Это не так. Это вендор с укорачивающимся сроком жизни и рубильником, который не у тебя, — и в 2026-м мы видели, как топовую модель отключили по всему миру через считанные дни после запуска по причинам, не имевшим отношения ни к кому, кто на ней строил. Портируемость модели — не оверинжиниринг. Это минимальная поза для бизнеса, который живёт на API, которым не владеет.
- business
- architecture
23 июня 2026 г.
Фейковый баг-репорт угнал кодинг-агента
Исследователи показали новую атаку «Agentjacking»: отправь фейковую ошибку в Sentry компании — и её ИИ-агент для кода читает «шаги по исправлению» и выполняет их, отдавая атакующему твои креды с твоими же привилегиями. В тестах на это попались Claude Code, Cursor и Codex. Урок шире одного инструмента: всё недоверенное, что читает твой агент, — это место, куда можно вставить команды.
- security
- agents
23 июня 2026 г.
Победила не лучшая модель. Победил дефолт.
ChatGPT впервые упал ниже 50% рынка ИИ-ассистентов — против 65% полтора года назад. Gemini рвёт вверх, и главная причина не в том, что он умнее. А в том, что Gemini — это дефолт, встроенный в Android и Google Workspace. Для всех, кто строит ИИ-продукты, это и есть урок: дистрибуция почти всегда бьёт модель.
- ai-native
- business
23 июня 2026 г.
Дефицитный ресурс — это люди, которые проектируют архитектуру
Ноам Шазир — соавтор «Attention Is All You Need», статьи, на которой стоит практически каждая современная модель, — ушёл из Google в OpenAI меньше чем через два года после того, как Google заплатил $2,7 млрд, чтобы его вернуть. За три дня Google потерял двух тяжеловесов ИИ. Убери драму — и останется ясный сигнал: бутылочное горлышко в ИИ не вычисления и не данные. Это горстка людей, которые проектируют архитектуру.
- architecture
- business