Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
1 июля 2026 г.
Голосовые агенты наконец прошли порог задержки
Годами голосовые ИИ-агенты спотыкались об одно — паузу. Те полсекунды мёртвого воздуха после того, как ты договорил, делали любого телефонного бота сломанным. В 2026-м паузы больше нет: сквозной стриминг речи, новые голосовые модели на state-space с 40 мс и round trip меньше 500 мс укладывают голос в окно, где разговор ощущается живым. Модель никогда не была сложной частью. Сложным был тайминг — а тайминг теперь инженерная задача, не исследовательская.
- ai-native
- agents
23 июня 2026 г.
Победила не лучшая модель. Победил дефолт.
ChatGPT впервые упал ниже 50% рынка ИИ-ассистентов — против 65% полтора года назад. Gemini рвёт вверх, и главная причина не в том, что он умнее. А в том, что Gemini — это дефолт, встроенный в Android и Google Workspace. Для всех, кто строит ИИ-продукты, это и есть урок: дистрибуция почти всегда бьёт модель.
- ai-native
- business
23 июня 2026 г.
Инструмент, на котором ты строишь, только что купили
SpaceX покупает Cursor — ИИ-редактор кода, в котором теперь живёт куча команд, — за $60 млрд акциями, через считанные дни после крупнейшего IPO в истории. Это крупнейшая в истории покупка венчурного стартапа. Урок для строителей не в сумме. А в том, что инструмент под всем твоим рабочим процессом может за ночь сменить владельца — и к этому стоит быть готовым.
- business
- ai-native
19 июня 2026 г.
Apple сделала модель пунктом настроек
На WWDC в этом месяце Apple пересобрала Siri на Gemini от Google — а потом разрешила вместо него подставить Claude или ChatGPT. Самая вертикально интегрированная компания на планете только что превратила ИИ-модель в выпадающее меню. Это самый ясный сигнал, что модель — заменяемая деталь, а не ров. И строить вам стоит ровно так же.
- architecture
- ai-native
19 июня 2026 г.
Поиск перестал слать вам трафик
Google AI Mode теперь отвечает прямо на странице на Gemini 3.5 Flash, и клики испаряются: по одному исследованию люди кликают по ссылке лишь примерно в 8% визитов, где есть ИИ-ответ, против около 15% без него. Быть первым в выдаче мало что значит, если никто не переходит. Игра смещается от ранжирования на странице к тому, чтобы быть источником, из которого собран ответ.
- ai-native
- business
19 июня 2026 г.
Бутылочное горлышко переехало в энергосеть
OpenAI законтрактовала 10 гигаватт с NVIDIA и ещё 6 с AMD; дата-центру Stargate в Мичигане только что согласовали 1,4 гигаватта — вопреки яростным возражениям местных. Ограничение ИИ давно перестало быть моделью. Это электричество, земля и политика вокруг них. Это переопределяет, сколько стоит эффективность, — и это тот же урок, что управляет системами куда меньше дата-центра.
- architecture
- ai-native