Двадцать лет production-инжиниринга, сейчас фокус на AI-системах — LLM-powered приложения, RAG-пайплайны, multi-agent архитектуры, и подложка вокруг них. Беру работу, где результат — суждение, а не нажатия клавиш: проектирую то, что нужно построить, ревьюю то, что строится, и владею архитектурой под этим.
Форматы сотрудничества
AI-архитектура, embedded
3–6 месяцев, встроенно в одну команду. Проектирую AI-систему — retrieval, tool use, оркестрация, evaluations, MCP-интеграции, data layer, security-границы — и ревьюю имплементацию по мере выкатки. Single LLM в петле или полная multi-agent топология, что задача реально требует. Я оркестрирую coding-агентов для сборки; спека, review и design — мои. Подходит когда вы прошли прототип и следующая версия должна пережить контакт с production.
Architecture review
1–3 недели, письменный deliverable. Взгляд senior'а на систему, которую вы уже спроектировали, или на ту, что ведёт себя не так как хотелось. На выходе — письменный отчёт: что несёт нагрузку, что хрупко, что я бы изменил в первую очередь и почему. Короткий engagement, без обязательств на длинную дистанцию.
Full-time
Senior AI architecture позиции в компаниях, где относятся к инженерному качеству серьёзно и "ship it" — второе предложение, а не первое. Открыт в принципе, селективен на практике.
Как работаю
- Артефакт — это спецификация, а не промпт и не код. Чёткая спека бьёт умную имплементацию, и именно о ней команда фактически рассуждает.
- Eval или не шипнул. Поведение, которое стоит шиппить, стоит зафиксировать — я ожидаю holdout-набор сценариев для любого агента, которого планируется выпустить на реальную работу. Почему именно так.
- Один источник правды на факт. Дублирование стейта — это дублирование багов. Активно ищу это на ревью.
- Скучные технологии там где можно. Postgres, FastAPI, Next.js. Новизна принадлежит AI-слою; подложка должна быть предсказуемой.
- Async по умолчанию. Длинный текст > коротких митингов. Решения приземляются в документах, чтобы следующему не пришлось переоткрывать.
Чего я не беру
- Роли, где результат — нажатия клавиш, а не суждение: staff augmentation, IC-имплементация с фиксированной спекой. Не потому что это плохая работа — потому что не там моё преимущество.
- Engagement'ы без production-цели. Мне интересны системы, которые должны пережить утро понедельника, а не демо, которым нужно пережить вечер вторника.
- Всё что требует чтобы я был тем, кто печатает. Весь смысл того как я работаю сейчас — в том, что я этим не занимаюсь.
Бэкграунд
Двадцать лет в backend-системах, распределённых данных, платежах, LLM-powered SaaS, а теперь production AI-архитектуре. Шиппил в маленьких стартапах и в скейле; вёл команды и контрибьютил как individual contributor. Сквозная линия — инженерное суждение в реальных констрейнтах. Полный CV по запросу после первого разговора.
Как связаться
Самый быстрый путь — контактная форма. Напиши что строишь, на какой стадии и по чему именно нужен second opinion. Я читаю всё и отвечаю в течение нескольких дней; длинные письма приветствуются.