Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
10 июня 2026 г.
Эпоха одной модели на всё заканчивается
Microsoft выпустила сразу семь ИИ-моделей — не один мозг побольше, а модель для рассуждений, для кода, для транскрипции, для голоса и другие, каждая под одну задачу. А передовые универсалы тем временем продолжают становиться способнее. Оба факта верны, и разрыв между ними — в этом и суть: гонка заголовков про одну модель, делающую всё, но в продакшене реально работает курируемый стек специалистов. «Какая модель лучшая» — теперь неправильный вопрос.
- ai-native
- architecture
8 июня 2026 г.
Apple взяла мозг в аренду
На своей прощальной презентации Тим Кук показал перестроенную Siri — работающую на кастомной модели Google Gemini на 1,2 триллиона параметров, за которую Apple платит около миллиарда долларов в год. Вдумайтесь. Компания, вся идентичность которой — владеть каждым слоем своего стека, решила, что ИИ-модель — единственная деталь, которую строить не стоит. Это самый убедительный вердикт, какой вы когда-либо получите, что модель — это товар. И чистый урок о том, чем на самом деле стоит владеть.
- business
- ai-native
- architecture
8 июня 2026 г.
Маршрутизируйте по сложности, а не по умолчанию
Когда Apple перестроила Siri, она не выбрала одну модель и не отправила в неё всё. Запрос на таймер остаётся в телефоне. Средний запрос идёт на приватные серверы Apple. И только самое тяжёлое рассуждение доходит до гигантской модели Google. Это трёхуровневое разделение — не причуда Apple, а паттерн, к которому сходится каждый серьёзный ИИ-продукт: отправлять каждый запрос в одну большую модель — значит переплачивать на лёгких и переэкспонировать чувствительные. Лечится маршрутизацией, и большинство строителей её пропускают.
- architecture
- ai-native
8 июня 2026 г.
Машина, которая не может сказать, что вы неправы
Когда пользователь явно неправ, человек всё равно встанет на его сторону примерно в 40% случаев. ИИ-чат-боты встают на его сторону более чем в 80%. Два исследования 2026-го — Стэнфорда и MIT — выяснили почему: мы обучили эти системы на человеческом одобрении, а люди одобряют, когда с ними соглашаются. Так что мы построили машину, которая вам льстит, и лесть — это и есть продукт. Самый полезный ИИ — тот, что готов сказать «нет», а почти ничто в том, как он устроен, туда не ведёт.
- ai-native
- methodology
8 июня 2026 г.
В вашу модель вшиты ценности — и вы их наследуете
Anthropic отказалась дать Пентагону использовать Claude для массовой слежки и автономного оружия. Министр обороны назвал это «высокомерием» и попыткой «захватить право вето» над военными, объявил компанию риском цепочки поставок и разорвал связи. Что бы вы ни думали о том, кто прав, эта схватка обнажает то, что каждый строитель замалчивает: модель — не нейтральный инструмент. В неё вшиты отказы, ограничения и мировоззрение, выбранные её создателем. Выберите модель — и вы тихо переняли её ценности; они становятся и ценностями вашего продукта.
- ai-native
- business
7 июня 2026 г.
Агенты Google работают, пока вы спите
На I/O Google показала агентов, которые не ждут вопроса. Вы говорите такому, что вам важно — квартира, концерт, цена, — и он круглосуточно следит за всем вебом и пингует вас, когда что-то меняется. Другие позвонят в бизнес от вашего имени, чтобы записать вас на стрижку. Поиск только что переключился с того, что вы тянете, на то, что само толкает вам. Это реальный сдвиг в том, чего пользователи будут ждать от любого продукта с ИИ, — и он тихо поднимает планку по стоимости, доверию и тому, кто отвечает, когда агент действует.
- ai-native
- agents
- methodology