Сейчас веду AI agent architecture для биотех-клиента из США — собираем multi-agent системы для автоматизации scientific research workflows. Day-to-day: пишу спеки, ревьюю agent output, проектирую evaluations, делаю custom MCP-серверы.
Оркестрирую coding-агентов (Claude Code на Opus) как implementation layer; владею архитектурой, методологией и качеством. Двадцать лет production-судейства уходит в дизайн спецификаций.
Строю
- Multi-agent оркестрационные паттерны для research workflows — planner с типизированной декомпозицией sub-tasks, executor агенты, выполняющие tool calls через MCP.
- Evaluation framework — публичные agent benchmarks плюс holdout scenario suite, который агенты не видят во время разработки.
- Этот сайт, открыто. Исходники на GitHub. Собран оркестрацией coding-агентов — каждую строку кода ревьюю, очень мало строк печатаю руками.
Читаю
- Последние статьи Anthropic про agentic capabilities и evaluations.
- Designing Data-Intensive Applications (Kleppmann) — перечитываю главы про consistency / consensus, держа в голове multi-agent state.
Думаю о
- Когда specification-driven development масштабируется за пределы одного агента — координационная стоимость между спеками, дедупликация guardrails, паттерны наследования спек.
- Что есть правильная единица теста для агента — scenario suite, property test, или и то и другое на разных слоях.
Открыт к
- Разговорам с фаундерами и CTO, которые тащат AI в production и хотят вторую пару глаз на архитектуре.
- Long-form консалтингу, где задача — спроектировать что должно быть построено, а не печатать строки в файл.
- Senior AI architecture ролям в компаниях, где engineering quality воспринимают всерьёз и «ship it» — это вторая фраза, а не первая.