Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
14 июня 2026 г.
Быстрая модель только что поумнела
Два года при выборе модели вы шли на компромисс: быстро и дёшево — или умно и медленно. Gemini 3.5 Flash его сломала. Тир «Flash» — дешёвый и быстрый — теперь набирает 55 в Artificial Analysis Intelligence Index, обгоняя Grok 4.3 и Claude Sonnet 4.6, и при этом выдаёт больше 280 токенов в секунду. Быстрая модель больше не глупая. Это повод заново открыть решение, которое большинство команд тихо заморозили год назад: какая модель у вас по умолчанию и та ли она. Разбираем, как думать об этом — включая подвох.
- ai-native
- business
13 июня 2026 г.
Агенты становятся фичей, а не продуктом
Gartner ждёт, что 40% корпоративных приложений встроят задачных ИИ-агентов к концу 2026-го — против менее 5% год назад. Агентный ИИ — самый быстрорастущий корпоративный приоритет, рост на 31,5% за год. Вместе эти цифры говорят нечто неуютное для многих стартапов: агент превращается в фичу внутри софта, которым люди уже пользуются, а не в отдельный продукт, на который они переходят. Если «мы построили агента, что делает X» — весь ваш питч, то приложение, что владеет X, вот-вот построит то же. Вот что это значит для того, что вы строите.
- business
- ai-native
13 июня 2026 г.
Сначала тянись к маленькой модели
Рефлекс — слать каждую задачу в самую большую, самую умную модель. Цифры говорят, что это обычно неверный дефолт. Маленькая модель на 7 миллиардов параметров работает в 10–30 раз дешевле, чем на 70–175B, Phi от Microsoft держит уровень GPT-3.5 при 98% меньшем вычислении, а больше двух миллиардов телефонов уже гоняют годные модели локально без всякого облака. Gartner ждёт, что задачные маленькие модели будут использоваться втрое чаще общих LLM к 2027-му. Вот почему «сначала маленькая» становится умным дефолтом — и когда всё же тянуться к большой.
- ai-native
- business
13 июня 2026 г.
Запишите это для машины
Теперь есть простой текстовый файл, который каждый серьёзный кодовый агент читает прежде, чем тронуть ваш репозиторий: AGENTS.md. На начало 2026-го его читают нативно Claude Code, Codex CLI от OpenAI, Cursor, Aider, Devin, GitHub Copilot, Gemini CLI, Windsurf и Amazon Q — это ближайшее к универсальному формату инструкций для агентов. Это самый рычажный час, который сейчас можно потратить на ИИ-кодинг, и почти никто его не тратит. Вот что туда кладут и почему это работает.
- methodology
- ai-native
12 июня 2026 г.
ChatGPT больше не выбор по умолчанию
Год назад «ИИ» по сути означал ChatGPT — около трёх четвертей всего трафика чат-ботов, а слой моделей был почти монополией. На июнь 2026-го у него 54,7%, Gemini взлетел до 27,4% (около +104% за полгода), а Claude, Grok и длинный хвост делят остальное. Монокультура закончилась, и это меняет и то, как выбирать, и то, как строить. «Лучший ИИ» теперь вопрос под конкретную задачу, а ставить продукт на одного провайдера стало заметно рискованнее.
- ai-native
- business
11 июня 2026 г.
Агенты, которые помнят
Главный прорыв агентов в 2026-м — не более умная модель, а память. ReasoningBank от Google позволяет агенту учиться на своих успехах и провалах, хранить рассуждения и измеримо становиться лучше со временем. Это скачок от инструмента, который сбрасывается каждое утро, к коллеге, который накапливает. Но у памяти есть второе лезвие: она превращает любую ошибку в постоянную. Неверный факт, отравленная инструкция или тихо устаревшее убеждение теперь переживают сессии и бьют по вам позже. Память — не фича, которую включают. Это корпус, которым надо управлять.
- ai-native
- agents