Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
19 июня 2026 г.
Поиск перестал слать вам трафик
Google AI Mode теперь отвечает прямо на странице на Gemini 3.5 Flash, и клики испаряются: по одному исследованию люди кликают по ссылке лишь примерно в 8% визитов, где есть ИИ-ответ, против около 15% без него. Быть первым в выдаче мало что значит, если никто не переходит. Игра смещается от ранжирования на странице к тому, чтобы быть источником, из которого собран ответ.
- ai-native
- business
19 июня 2026 г.
Бутылочное горлышко переехало в энергосеть
OpenAI законтрактовала 10 гигаватт с NVIDIA и ещё 6 с AMD; дата-центру Stargate в Мичигане только что согласовали 1,4 гигаватта — вопреки яростным возражениям местных. Ограничение ИИ давно перестало быть моделью. Это электричество, земля и политика вокруг них. Это переопределяет, сколько стоит эффективность, — и это тот же урок, что управляет системами куда меньше дата-центра.
- architecture
- ai-native
19 июня 2026 г.
У вашей модели срок годности — шесть недель
За одно двухнедельное окно в этом месяце индустрия выпустила Claude Mythos 5, GPT-5.6, Gemini 3.2 и стену китайских фронтир-моделей — Qwen 3.7, DeepSeek V4.1, GLM-6 и не только. Новые фронтир-модели теперь выходят по метроному примерно раз в шесть недель. Если преимущество вашего продукта — «мы используем лучшую модель», оно истекает быстрее квартала. Разбираем, как строить под движущуюся мишень.
- ai-native
- architecture
15 июня 2026 г.
Приложение, которое сжигало $15 млн в день
OpenAI построила самое распиаренное ИИ-видео-приложение в истории и через полгода тихо его закрыла. Sora, по оценкам, сжигала около $15 млн в день на компьют, а собрала примерно $2.1 млн — не в день, всего. Люди его обожали, и оно всё равно теряло деньги на каждом ролике. Это урок, которому классический софт нас не учил: у генеративной фичи есть реальная цена за каждое использование, и «вирусность» не лечит «теряем деньги на каждом клике». Вот как проверить свою ИИ-фичу, пока она не повторила это.
- business
- ai-native
15 июня 2026 г.
Нишевая модель обходит гиганта
Агент, за которого Salesforce только что заплатила $3.6 млрд, работает не на самой большой и умной модели за любые деньги. Он работает на Apex — модели поменьше, заточенной под одну задачу, поддержку, которая, по словам Salesforce, обходит топовые фронтир-модели в реальном закрытии тикетов. Вот деталь, что дороже ценника. Для узкой, чётко заданной задачи модель, обученная именно под неё, бьёт универсального гиганта, который знает всё и не мастер ни в чём. Разбираем, почему хвататься за самую большую модель — обычно неверный рефлекс.
- ai-native
- business
14 июня 2026 г.
ИИ-агенты получили вашу банковскую карту
10 июня 2026 года Visa встроила свою платёжную сеть прямо в ChatGPT. Теперь ИИ-агент может сам делать покупки и платить в любом магазине, принимающем Visa — выбрать товар, пройти оформление, оплатить — используя привязанные к этому агенту реквизиты с лимитами трат и категориями магазинов, которые вы задаёте заранее. McKinsey считает, что агентская коммерция к 2030 году может занять до триллиона долларов розницы США. Два года агенты могли рекомендовать; теперь они могут тратить. Разбираем, что меняется, когда карта в руках у софта, и какой вопрос задать, прежде чем её отдать.
- business
- ai-native