Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
5 июня 2026 г.
Агент, который «закрывает продажи» — то, что прячет демо
Meta только что выпустила агента, который не просто болтает — он бронирует встречи, квалифицирует лиды, закрывает продажи и проводит платежи, 24/7, на любом языке, подключённый к Shopify и Zendesk. Миллион бизнесов уже на нём. Демо — магия. Что оно прячет: автономную штуку, действующую на твой бизнес, на машинной скорости, по сообщениям незнакомцев, — и закон только что закрыл лазейку «это сделал ИИ». Вот честная версия.
- security
- business
- agents
5 июня 2026 г.
ИИ только что начал профилировать тебя в фоне
До этой недели ChatGPT помнил только то, что ты сам велел запомнить. С 4 июня он «видит сны» — фоновый процесс читает все твои прошлые чаты и тихо строит твою модель, сам поддерживая её в актуальном виде. Это правда полезный апгрейд — и момент, когда чат-бот стал профайлером. Европейский регулятор данных сказал ровно это, сегодня. Вот что реально изменилось, простыми словами, — и почему это проблема заземления, наведённая на тебя.
- ai-native
- security
5 июня 2026 г.
Четыре флагмана за четыре недели — «какая модель победит» это запах дизайна
В этом месяце волна флагманских моделей валится почти одна на другую — Gemini 3.5 Pro, новый Claude, Grok 5, и уже вышедший Opus 4.8. Все обновляют лидерборды. Если эта волна тебя тревожит — на лучшей ли мы модели, не пора ли переключаться — тревога говорит кое-что о твоей архитектуре, а не о моделях. Вот честное прочтение и что реально требует «оставайся swappable».
- ai-native
- architecture
5 июня 2026 г.
«Какую часть агентизировать первой?» — неправильный первый вопрос
Весь рынок перешёл от «агенты вообще реальны?» к «какую часть компании агентизировать первой?» — IT-саппорт, продажи, сверки. Звучит как умный стратегический вопрос. Это не тот вопрос. Спрашивая, куда навести агента, ты пропускаешь два вопроса, которые реально решают, заработает ли хоть что-то: на чём агент стоит и кто отвечает, когда он неправ. Вот порядок, который важен.
- methodology
- business
- agents
4 июня 2026 г.
Токен-пейволл — это не SaaS
Основатели оценивают ИИ-продукты по инстинктам SaaS — фиксированная подписка, плата за место — и тихо истекают кровью, потому что то, что делало SaaS волшебным, исчезло. Почти нулевая предельная стоимость мертва: каждый пользователь жжёт токены, вечно, и стоимость растёт с использованием. GitHub Copilot терял до $80 в месяц на тяжёлом пользователе при флэте $10. ИИ-продукты — не софт с шикарной маржой, они ближе к коммунальной услуге с реальной себестоимостью. Оценивай соответственно.
- business
- ai-native
4 июня 2026 г.
87% на бенчмарке — и всё ещё не вывозит эволюцию твоего кода
Заголовок гласит, что ИИ «решает 87% SWE-bench», и все читают это как «теперь ИИ умеет в инженерию ПО». Две проблемы. Маленькая: треть этих успехов слила ответ или прошла на слабых тестах. Фатальная: бенчмарк мерит один изолированный багфикс, а не настоящую работу — эволюцию живого кода неделями. Померь это — и те же модели падают с ~73% до ~25%. Бенчмарк — это демо. Твой код — это прод.
- eval
- agents
- methodology