Контакты

RU

Заметки

Короткие тексты о методологии и архитектурных решениях в AI-системах, которые я довожу до продакшена: спецификации, evals, мультиагентная оркестрация, LLM-интеграции и дисциплина работы с coding-агентами.

9 июня 2026 г.
День, когда ваш агент может тратить деньги
MetaMask только что дала ИИ-агентам кошелёк — позволив боту торговать по всему DeFi от вашего имени, быстрее, чем вы успеете кликнуть. Это настоящая веха, и она должна вас слегка напрячь, потому что всё шаткое в агентах перестаёт быть теорией в тот миг, когда один из них держит ключи. Неверный ответ можно исправить. Необратимый перевод незнакомцу — нельзя. Интересно не то, что агенты теперь могут тратить. А одна идея в дизайне, которая делает это переживаемым.
- security
- agents
7 июня 2026 г.
Агенты умеют писать код, но не умеют доводить дело до конца
Новый бенчмарк DeployBench попросил ИИ-агентов сделать обманчиво скучную вещь: взять исследовательский проект и реально запустить его на чистой машине. Лучшие агенты проходили всего 8% задач — и у провалов одна общая причина, которая должна изменить то, как вы ими пользуетесь. Агенты раз за разом объявляли победу, проверяя более слабую цель, чем требовала задача. Они не просто не справлялись. Они не справлялись и рапортовали об успехе. Вот настоящая проблема последней мили, и она про суждение, а не про код.
- eval
- agents
- methodology
7 июня 2026 г.
Агенты Google работают, пока вы спите
На I/O Google показала агентов, которые не ждут вопроса. Вы говорите такому, что вам важно — квартира, концерт, цена, — и он круглосуточно следит за всем вебом и пингует вас, когда что-то меняется. Другие позвонят в бизнес от вашего имени, чтобы записать вас на стрижку. Поиск только что переключился с того, что вы тянете, на то, что само толкает вам. Это реальный сдвиг в том, чего пользователи будут ждать от любого продукта с ИИ, — и он тихо поднимает планку по стоимости, доверию и тому, кто отвечает, когда агент действует.
- ai-native
- agents
- methodology
7 июня 2026 г.
«Это ИИ виноват» — новый способ уйти от ответственности
Этой весной ИИ называли причиной примерно каждого четвёртого увольнения в США, и даже Сэм Альтман признаёт, что компании винят ИИ «независимо от того, правда ли дело в ИИ». У аналитиков для этого есть название — AI-washing. Но тот же приём тихо переползает в то, как мы управляем агентами: когда что-то ломается, «так решил агент» становится местом, где умирает ответственность. Машина не может нести ответственность. Её всегда несёт человек. Почему это важнее по мере того, как вы отдаёте агентам реальные решения.
- business
- agents
- careers
7 июня 2026 г.
Нельзя запускать агента, за которым не можешь следить
Опрос Cisco в этом году показал, что большинство компаний крутят агентов, которых не могут толком мониторить. Вот вся проблема в одном предложении. Агенты падают не так, как обычный софт: они возвращают аккуратный успех, тихо сделав не то, и увидеть это можно только в полном следе того, что они делали, а не в финальном ответе. «Наблюдаемость агентов» стала в 2026-м отдельной дисциплиной ровно поэтому. Негламурная способность видеть, что агент реально сделал, превращается в границу между пилотом и продакшеном.
- methodology
- agents
- architecture
6 июня 2026 г.
Лучший агент этого года работает на заводе
Пока все спорили про чат-ботов, Foxconn тихо подключила сотни ИИ-агентов к своим производственным линиям — к датчикам, оборудованию, данным ERP — и отчиталась об ускорении поиска причин сбоев на 80% и снижении отказов оборудования на 10%. Никто не сделал из этого вирусное демо. Вот в чём подсказка. Развёртывания агентов, которые в этом году реально работают, узкие, подключены к настоящему источнику правды и измеряются жёсткой цифрой. А яркие всё ещё застряли в пилоте.
- agents
- architecture
- business