Заметки
Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.
7 июня 2026 г.
Для долгоиграющих агентов единственный бенчмарк — цена за задачу
Новую Nemotron 3 Ultra от NVIDIA продают не как самую умную модель. Её продают как дешёвую в работе часами — построенную для агентов, которые планируют, вызывают инструменты и рассуждают через сотни шагов. Эта подача и есть настоящая история. Когда агент работает долго, важной становится не оценка в бенчмарке и не цена за токен, а доллары за завершённую задачу. Две модели с одинаковой ценой за токен могут отличаться в реальной работе вдвое. Вот почему лидерборд — неправильное, на что смотреть, как только агент работает дольше мгновения.
- ai-native
- business
- eval
7 июня 2026 г.
Low-code агенты, подключённые прямо к вашим живым данным
Новая Joule Studio от SAP строит целого агента — воркфлоу, спеки, даже набор evals — из одного предложения, заземлённого прямо в ваших живых бизнес-данных. OutSystems делает похожее. Это по-настоящему мощно: бизнес-аналитик теперь может поднять агента на боевой системе, не стоя в очереди к инженерам. Это же — способ получить агента с огромным радиусом поражения, которого никто не может объяснить или остановить. Демократизация реальна. Опасность тоже, и к её второй половине большинство компаний не готовы.
- architecture
- business
- security
7 июня 2026 г.
У 65% компаний уже был инцидент безопасности с агентом
У двух третей организаций уже случился инцидент безопасности с участием ИИ-агента — не редкая катастрофа, а обычный вторник. И причина не в сошедшей с ума, рассогласованной модели, делающей что-то злое. Это идеально послушный агент, получивший доступ к данным, которых ему вообще нельзя было давать. Агентная утечка 2026-го скучна: это сверхпривилегированная identity, делающая ровно то, что ей разрешили. И это хорошая новость, потому что у скучных проблем — скучные решения, если относиться к агенту как к тому, чем он является.
- security
- architecture
- business
7 июня 2026 г.
«Это ИИ виноват» — новый способ уйти от ответственности
Этой весной ИИ называли причиной примерно каждого четвёртого увольнения в США, и даже Сэм Альтман признаёт, что компании винят ИИ «независимо от того, правда ли дело в ИИ». У аналитиков для этого есть название — AI-washing. Но тот же приём тихо переползает в то, как мы управляем агентами: когда что-то ломается, «так решил агент» становится местом, где умирает ответственность. Машина не может нести ответственность. Её всегда несёт человек. Почему это важнее по мере того, как вы отдаёте агентам реальные решения.
- business
- agents
- careers
7 июня 2026 г.
Самый жёсткий ИИ-закон Америки переписали ещё до старта
ИИ-закон Колорадо должен был стать тем самым — первым комплексным ИИ-законом США, вступающим в силу в 2026-м, с реальными обязанностями против алгоритмической дискриминации. Потом судья его заморозил, легислатура выпотрошила, а всё это перенесли на 2027-й с вырванными зубами. Если вы в панике готовились соблюдать версию, которая теперь мертва, вы только что усвоили настоящий урок про строительство под ИИ-регуляции: стройте не под дедлайн. Стройте под горстку обязанностей, что переживают любую переписку, — потому что они и так были просто хорошей инженерией.
- business
- methodology
7 июня 2026 г.
Вы сбежали от привязки к модели. Её перенесли в ваш контекст.
Сохранить модель заменяемой было победой года — теперь провайдера можно сменить одной строкой конфига. Поэтому на Build 2026 Microsoft спокойно перенесла привязку туда, где её не поменять: в контекст вашей организации. Work IQ, Fabric IQ, Foundry IQ — память, права и смысл вашей компании, живущие внутри вендорской интерпретации вашего бизнеса. Как сказал один аналитик: мозг поменять можно. Память — возможно, уже нет. Вот новая ловушка и как сохранить переносимым то, что реально важно.
- architecture
- business
- ai-native