Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
7 июня 2026 г.
Для долгоиграющих агентов единственный бенчмарк — цена за задачу
Новую Nemotron 3 Ultra от NVIDIA продают не как самую умную модель. Её продают как дешёвую в работе часами — построенную для агентов, которые планируют, вызывают инструменты и рассуждают через сотни шагов. Эта подача и есть настоящая история. Когда агент работает долго, важной становится не оценка в бенчмарке и не цена за токен, а доллары за завершённую задачу. Две модели с одинаковой ценой за токен могут отличаться в реальной работе вдвое. Вот почему лидерборд — неправильное, на что смотреть, как только агент работает дольше мгновения.
- ai-native
- business
- eval
7 июня 2026 г.
Вы сбежали от привязки к модели. Её перенесли в ваш контекст.
Сохранить модель заменяемой было победой года — теперь провайдера можно сменить одной строкой конфига. Поэтому на Build 2026 Microsoft спокойно перенесла привязку туда, где её не поменять: в контекст вашей организации. Work IQ, Fabric IQ, Foundry IQ — память, права и смысл вашей компании, живущие внутри вендорской интерпретации вашего бизнеса. Как сказал один аналитик: мозг поменять можно. Память — возможно, уже нет. Вот новая ловушка и как сохранить переносимым то, что реально важно.
- architecture
- business
- ai-native
7 июня 2026 г.
Когда ваш покупатель — бот
Агенты Google теперь бронируют и покупают за вас, Visa и Mastercard построили рельсы, чтобы агенты платили, а волна протоколов «агентной коммерции» запустилась с Shopify, Walmart и Target. Тихий вывод: то, что оценивает ваш продукт, всё чаще софт, а не человек. ИИ-агенты не разглядывают — 87% их запросов идут в данные о товаре, и почти ничего в вашу красивую витрину. Веб строили под человеческие глаза, а покупатель только что сменил вид. Вот что это значит для всех, кто что-то продаёт, строит или отгружает онлайн.
- business
- ai-native
6 июня 2026 г.
Supabase стоит $10,5 млрд, потому что агентам нужны скучные базы данных
Supabase только что подняла $500 млн при оценке в $10,5 млрд — вдвое больше, чем восемь месяцев назад, — и причина почти смешная: больше 60% новых баз на её платформе теперь создаёт ИИ-инструмент, а не человек. Яркая часть ИИ-бума — агенты, пишущие код. А тихо печатает деньги скучное надёжное место, куда этот код обязан положить свои данные. Это не совпадение — это весь урок о том, где живёт долговечная ценность.
- business
- architecture
- ai-native
6 июня 2026 г.
Microsoft может уволить своего поставщика модели. А вы?
На Build 2026 Microsoft выпустила собственные модели для кода и рассуждений — обученные с нуля, с «нулевой дистилляцией» из OpenAI, как выразился её AI-директор, — прямо внутрь GitHub Copilot. Богатейшая софтверная компания на планете потратила миллиарды, чтобы перестать зависеть от одного поставщика. В этом весь урок для остальных, и стоит он вам ноль: никогда не делайте модель той частью системы, которую нельзя заменить.
- architecture
- ai-native
- business
6 июня 2026 г.
Вайбкодинг закончился. Сложным было никогда не демо.
Google теперь учит вайбкодингу больше миллиона человек на бесплатном пятидневном курсе. Когда то, чем ты гордился, становится курсом выходного дня, этот навык перестаёт быть твоим преимуществом. Но вот что упускают заголовки: вайбкодинг всегда был хорош в лёгких 80% — в демо — и бесполезен в тех 20%, что решают, выживет ли софт. Реально дефицитный теперь навык — не генерировать код. Это суждение: понять, хорош ли код, который ты получил.
- careers
- methodology
- ai-native