METHODOLOGY · 4 июня 2026 г.

Tokenmaxxing, или закон Гудхарта добрался до ИИ

Компании хотели «внедрения ИИ», поэтому измерили самый простой прокси — использование токенов, повесили его на лидерборд и получили ровно то, что измеряли: люди жгут токены ради рейтинга, а не ради лучшей работы. Пятидесятилетний закон съедает свежую стратегию, и теперь это дорого вдвойне: ты платишь за впустую сожжённые токены и отравляешь сигнал, который хотел получить. Починка тоже старая — мерь результат, а не активность.

В 2026-м несколько крупных техкомпаний начали ранжировать собственных сотрудников по тому, сколько ИИ-токенов те использовали. Amazon построил внутренний лидерборд; работники в ответ весь день гоняли бессмысленные, малоценные задачи, чтобы накрутить очки — не потому, что работу надо было делать, а потому, что активность двигала цифру. В Meta сотрудник построил дашборд под названием «Claudeonomics», который ранжировал ~85 000 работников компании по потреблению токенов; за одно 30-дневное окно он насчитал свыше 60 триллионов токенов (ни Цукерберг, ни CTO не пробились в топ-250). Люди стали называть это tokenmaxxing, и это один из самых чистых управленческих автоголов, что я видел за годы.

Это просто закон Гудхарта, на более быстром счётчике

То, что здесь произошло, — не ново и не загадочно. Это пятидесятилетний принцип под названием закон Гудхарта: когда мера становится целью, она перестаёт быть хорошей мерой. В тот миг, когда «использованные токены» превратились из цифры, на которую кто-то поглядывал, в цифру, по которой людей ранжируют, она перестала измерять продуктивность и начала измерять нечто совсем другое — человеческую способность обыгрывать лидерборд. Как сформулировал один анализ, метрика теперь измеряет ровно это и ничего больше.

Почему умные компании влетели в это в лоб? Потому что «внедрение ИИ» — это то, что хотел видеть совет директоров, а использование — самое простое на свете, что можно посчитать. Токены видимы, считаемы, выводимы на дашборд. А сделал ли ИИ работу лучше — измерить трудно. Так что они измерили лёгкий прокси вместо трудной правды — и получили прокси, максимизированный. Проще говоря: когда измеряешь использование, получаешь отходы.

Эту самую ошибку мы делаем вечно

Если это кажется знакомым — так и должно быть. Плати инженерам за строки кода — получишь раздутый, набитый ватой код. Поставь квоты на коммиты — разработчики разобьют одно изменение на пять кусков. Оцени колл-центр по времени обработки — получишь клиентов, которых спихнули с линии, ничего не решив. Tokenmaxxing — это ИИ-эпохальный рескин старейшей управленческой ошибки: награждать активность, потому что её легко считать, и получать активность вместо результата. Нового в нём нет ничего, кроме того, что счётчик крутится быстрее.

Только теперь метрика тщеславия ещё и жжёт деньги

Вот что делает ИИ-версию хуже строк кода. Плохая метрика раньше просто тратила усилия. Эта буквально жжёт деньги — каждый накрученный токен это токен, за который ты заплатил, и это не последняя причина, почему паника по затратам 2026-го стала такой громкой. Так что ты платишь дважды: раз за впустую сожжённый compute, и ещё раз — испорченным сигналом. Ты купил цифру, которая ничего не говорит о том, помогает ли ИИ, и сам же выставил её себе в инвойс. Замечательный способ тратить деньги — финансировать уничтожение собственных данных.

Починка — скучный правильный ответ: мерь результаты

Выход — не более хитрая метрика использования. Использование — вообще не то, что надо мерить. Мерить надо результаты — реально ли сделана работа, хорош ли итог, решена ли проблема клиента — а это труднее считать и куда труднее обыграть. Данные это подтверждают: организации, привязавшие ИИ к реальным результатам, оказались почти вчетверо более склонны сообщать о росте выручки за счёт ИИ, чем те, кто застрял в пилотах, — и отличием было явно не то, у кого больше использования.

Это та же дисциплина, к которой я постоянно призываю в отношении моделей, наведённая на твою организацию. Ты не судишь агента по тому, сколько раз он запустился; ты судишь его по отложенному набору реальных результатов. То же правило для людей и команд: награждай результат, а не счётчик токенов. И есть тихая человеческая цена, которую дашборд использования никогда не покажет: опросы нашли, что примерно четверть работников задумалась бы об уходе из-за того, что их толкают использовать ИИ так, как они не считают правильным, — при том что лишь крошечная доля работодателей вообще заметила какое-либо сопротивление. Люди подчиняются видимо и сопротивляются тихо, а твой лидерборд бодро рапортует подчинение как успех.

Вывод

ИИ не сломал твои метрики. Он взял старейшую ошибку измерения и сделал её быстрее и дороже. Использование никогда не было целью — лучшая работа была. Правило неизменно и беспощадно: какую цифру ни повесь на дашборд, кто-нибудь её заоптимизирует, так что убедись как следует, что эта цифра — то, что ты действительно хотел, а не просто то, что было легко посчитать. Мерь, стала ли работа лучше, — или плати по высшему разряду за то, чтобы смотреть, как лезет вверх лидерборд, пока не лезет ничего больше.