Футболономика в России. Часть 1

Первый пост задает как общую картинку современного российского футбола, так и горизонт ожидания для читателей. В фокусе внимания – дюжина сезонов Российской Премьер-Лиги с сезона 2004 г. по сезон 2015–2016 гг. Объяснительная модель – модель британского экономиста и теоретика спорта Cтефана Шимански (см. тут). Концептуализируем ее так: в среднесрочной и долгосрочной перспективах заработная плата объясняет около 90% вариации положения клуба в лиге. Если совсем упростить, можно понять это так: за 20 лет существования футбольной лиги 18 раз ее выиграет тот клуб, который тратит больше других на зарплату игрокам (для тех, кого это упрощение возмутило, см. Проблема № 1 ниже). Эта модель стала результатом анализа зарплатных ведомостей и итоговых позиций клубов Английской Премьер-Лиги (т.е. в Англии так и есть)

Когда я впервые прочитал книгу Шимански, я сразу же подумал, что в России его модель работать не будет. Во-первых, выводы британского ученого говорят о том, что рынок зарплат в АПЛ эффективен, т.е. чем лучше игрок, тем больше он получает. В России лимитной эпохи это казалось нереальным – у нас рынок зарплат неэффективен просто потому, что лимит создает условия для «надбавки за паспорт». Во-вторых, довольно часто у нас случаются «странные матчи» (хотя мне больше по душе определение Василия Уткина – договорняки), а потому представлялось, что положение в лиге зачастую определяется вмешательством административного ресурса, а не спортивными показателями. К моему удивлению, я ошибался (причем оба сомнения, как догадается мой мудрый читатель, можно было снять логически, т.е. без обращения к нижеследующему анализу).

Перед тем как перестать Вас томить, я вынужден сделать две оговорки. Делаю я их потому, что посчитал нечестным их не сделать. Одна часть касается нескольких, на мой взгляд, серьезных недостатков модели. Вторая – происхождения и обоснования моих данных. Я выделяю эти пункты звездочками (***), и если Вас не интересуют методологические пояснения, то можете смело пропустить эту часть и смотреть графики и таблички (enjoy!)

***

Проблема № 1: Статистика против реальности. Выше, для привлечения внимания, было сказано, что за 20 сезонов 18 раз лигу выиграет тот клуб, который тратит на зарплату больше всех. Само собой, это не так. В лучшем случае – за 20 сезонов клуб с наибольшей игроцкой зарплатной ведомостью выиграет 10 раз. Остальные 10 раз выиграют клубы, скажем, со 2-й, 3-й или 4-й зарплатными ведомостями (или, если хотите, 9 раз, а на 10-й выиграет Лестер). Все дело в том, что, зарплатные ведомости 1-й, 2-й, 3-й и 4-й команд могут разниться совсем немного. Потому, когда выигрывает 2-я, 3-я или 4-я команда, закономерность все равно будет подтверждаться, хотя и не 1-я команда окажется чемпионом. Это говорит о том, что к любому статистическому исследованию стоит относиться с осторожностью.

Проблема № 2: Математика против спорта. Речь идет о том, что в этой модели результат команды (итоговое место) – это просто число. Потому команда может занимать за 10 сезонов, в среднем, место равное 1,7, или место равное 4,2. Раз место – это просто число, то разница между 1-м и 2-м местом такая же, как между, скажем, 4 и 5, т.е. единица. Но в спорте действует принцип «все или ничего». И в этом смысле, разница между 1 и 2 местом огромная – ты либо Чемпион, либо нет. Кроме того, разница между 2 и 3 местом, скажем, в РФПЛ, тоже огромная. Потому что 2 место – это шанс на Лигу Чемпионов, а 3 место – это Кубок Европы. Стоит ли говорить, какая большая разница между 5 и 6 местами (это разница в евротурнир), 7 и 8 местами (эта разница всем до лампочки) и 14 и 15 местами (это шанс на сохранение места в лиге)? Итак, к любому статистическому исследованию стоит относиться взвешенно.

*За четкое понимание этих двух проблем я благодарен комментариям Виктора Смита

Проблема № 3: Космос против статистики. Это самая большая методологическая проблема данной модели (по крайней мере, как смог ее эксплицировать я). Зарплата игроков складывается из окладов и бонусов. Бонусы зависимы от итогового места в команде. Следовательно, зарплата (независимая переменная нашей модели) зависит от места (зависимая переменная нашей модели). Это т.н. эндогенность модели, т.е. наша независимая переменная зависима от чего это еще, что мы бы должны объяснить, но не объясняем. Это проблема, которую я не представляю как можно здесь исключить. Но как мне объяснили, эта проблема возникает почти всегда: мы живем в мире (или, как сказали бы мудрые эллины, в космосе), где все, так или иначе, зависит от всего. Иными словами, все связано. Потому, хотя скепсис это нормальная реакция почти на любое статистическое исследование, мы все же можем сделать значимые для нас выводы и увидеть, как применимо исследование.

***

Теперь о данных. Данные взяты мной из серии спортивных симуляторов Football Manager. Я не буду расхваливать этот блестящий симулятор (кто знает, тот поймет), но назову три причины, по которым, мне кажется, мы можем считать эти данные релевантными.

Во-первых, никаких других данных за этот период получить невозможно. Наш футбол, во многих смыслах, герметичен. Не является исключением и финансовые показатели клубов. Потому, если мы хотим понять наш футбол (в надежде изменить его к лучшему), мы должны быть готовы ориентироваться на любые систематические данные, какие можем получить.

Во-вторых, в самой футбольной сфере, данные симулятора котируются высоко. Ряд профессиональных клубов имеет партнерские отношения с FM (например, Эвертон, Уотфорд или Удинезе), т.е. платят разработчикам большие деньги, дабы получить используемые данные раньше ежегодного релиза. Это говорит о том, что в профессиональной среде данные считаются релевантными. Конечно, «феномен Цыгалко» это не отменяет. Но если мы хотим понять наш футбол (в надежде изменить его к лучшему), мы должны быть готовы ориентироваться на любые систематические данные, какие можем получить.

В-третьих, скуднейшие официальные данные клубов РФПЛ, которыми мы обладаем, в целом, соответствуют данным FM. Я смог проверить по Зениту в 2014 году (данные УЕФА) и по Кубани в 2013, 2014 и 2015 финансовых годах (данные ФК Кубань). Данные сравнительно сходятся, хотя я был удивлен, что наши клубы по данным УЕФА тратят больше, чем это предполагают разработчики симулятора.

Я думаю, что эти три аргумента, вкупе, позволяют нам относиться к дальнейшему анализу со всей серьезностью.

***

Надеюсь, что кто-то дотерпел (ибо думаю, что методологические детали все равно читали все). Теперь будут картинки, теперь будет веселее.

Итак, первая табличка – среднее место клубов по зп, среднее итоговое место.

Таблица 1. Среднее итоговое место, среднее место клубов по зп

alt

Далее – график. На графике ось x – это среднее место по игроцкой зарплатной ведомости, ось y – это средняя позиция в лиге. Коэффициент детерминации (R2) равен 0, 85, что, во-первых, хорошо для модели (это значит, что зарплаты, т.е. независимая переменная, аж на 85% объясняет вариацию позиции в лиге, т.е. независимую переменную), во-вторых, это хорошо для нашего футбола (это значит, что результат дает качество игроков, а не подковёрные игры). Грубо говоря, команды, оказавшиеся по левую сторону от линии усредненного значения – это «отстающие» (underachievers), т.е. чем дальше влево от линии, тем большие эти команды неудачники. У них либо плохое управление (т.е. так себе игрокам систематически переплачивают), либо плохой подбор тренеров (т.е. норм игроки не показывают по каким-то причинам свой уровень). Соответственно, команды, оказавшиеся по правую сторону от линии – это «преуспевающие» (overachievers), т.е. чем дальше вправо, тем круче команда использует свои ресурсы. Либо управленческие (ищут игроков, которые недооценены, а значит не раздувают запросы по зп), либо тренерские (тренеры выжимают из игроков больше их максимума).

График 1. среднее место клубов по зп, среднее итоговое место

 

alt

В целом, думаю, ничего удивительного для любителей российского футбола. Зенит и ЦСКА в лидерах последних лет, хотя фанаты Зенита должны быть чуть более несчастны и требовательны к своей команде, а фанаты ЦСКА – очень довольны выступлениями команды. Болельщики Спартака, если они реалисты, должны быть довольны, потому что команда играет даже лучше, чем должна бы была. Хотя славное прошлое наверняка делает их слегка несчастными идеалистами (верим в Валеру, Диму, Карреру). Краснодар явно делает все с умом и идет с опережением графика. Наверное, удивит почивший ФК Москва (хотя, если вспомнить, что Слуцкого уволили за 4 место, то может и нет), потому что этот клуб умел «делать» футбол. И совсем не удивит Ротор, Сибирь и Арсенал – единожды замеченные за 12 лет, им и рассчитывать с такими бюджетами на зарплату игрокам было не на что.

Все, что показывают эта табличка и график интересно (оставляю простор для интерпретации). Но такой подход убог: разница между 1й и 2й командами в рейтинге зарплат может быть больше, чем сумма всех разниц оставшихся команд. Т.е. если 1я команда тратит на зарплаты в 10 раз больше, чем вторая, то психика болельщиков «богатеев» будет уничтожена, займи их команда 3-е место. Иными словами, нужно как-то соотнести «мест по зп» с реальными тратами.

Сделать это на раз-два нельзя. Некоторые команды за 12 лет провели в РФПЛ 12 сезонов, другие – по одному. Да и очевидно, что в далеком 2004 сразу несколько команд могли содержать всех своих игроков на годовую зарплату Халка-2014 (Зарплата Халка в 2014 г. составила 7 млн. евро, в 2004 году на эти деньги можно было содержать всех игроков клубов Ротор, Кубань, Алания и Амкар). Здесь необходимо нормирование. Я сделал его так: в каждый год определил какой процент от общей зарплатной ведомости лиги составляет зарплатная ведомость каждого клуба, а затем вывел средний процент. Речь везде, напомню, идет именно и только о зарплатах игроков, но не персонала и пр.

Соответственно, табличка получается намного интереснее, потому что позволяет сравнивать конкретные величины (разница между 1-м и 2-м средним местом по зп кажется маленькой, а вот разница в средние 10% от общей зарплатной ведомости ЛИГИ – это намного серьезнее).

Таблица 2. среднее итоговое место, средний процент от общей зп ведомости лиги

alt

Ну и график. Ось x – это средний процент от общей зарплатной ведомости лиги, ось y – это средняя позиция в лиге. Коэффициент детерминации (R2) равен 0,82, опять же, по двум вышеозначенным причинам это хорошо. Чтобы было не скучно, я изменил направление графика, соответственно, здесь слева от линии усредненного значения - «преуспевающие» (overachievers) клубы, а справа - «отстающие» (underachievers). Обращает на себя внимание, что Зенит тратит таааак много, что делает среднюю позицию в лиге ЦСКА почти неприличной. Опять молодцами выглядят Краснодар и ФК Москва. Стоит ли говорить про транжирство Анжи и Динамо? Обратите внимание на Ростов – прошлогодняя феерия стала расплатой за 11 лет отставания, если бы не прошлогоднее 2-е место, Ростов бы оказался среди отстающих.

График 2. Средний процент от общей зп ведомости лиги, среднее итоговое место

alt

О некоторых вещах хочется сказать подробнее. Например, когда руководство Зенита говорило о том, что они выстраивают команду с прицелом на победы в Европе, оно подтверждает это делом. ЗП Зенита сопоставима с европейскими грандами (в прошлом сезоне – в 20ке самых больших зп ведомостей в Европе), правда это накладывает отпечаток на восприятие результатов клуба в РФПЛ. Такая гигантская зп ведомость в России попросту не нужна, это вопиющее транжирство. Даже если бы Зенит продал бы не только Халка и Гарая, но и еще 5-6 стабильных игроков основной обоймы, то они все равно бы должны были бы бороться за чемпионство. Если нет – у болельщиков должны появиться серьезные вопросы к тому, как обращается с деньгами их руководство.

Другой пример, Спартак. Когда один тренер Спартака говорит, что ему нужно еще 2-3 игрока уровня Промеса, а один руководитель Спартака говорит, что он делает все для того, чтобы Спартак стал чемпионом (я не оспариваю значение постройки стадиона, речь здесь только о подборе игроков), Федун один из них точно врет. Спартак может стать чемпионом, но без 2-3 Промесов – это будет стечение обстоятельств, удача, а в следующем году произойдет откат назад в лиге и опять станет уныло. При всем при этом, стоит отметить, что Спартак живет вполне по средствам. Какой есть подбор игроков, такой и результат. Т.е. вложенные в клуб, в игроков деньги дают адекватный результат. Только ностальгия пилит сердце и заставляет желать большего.

Еще один пример, Терек. Как мы видим, Терек немного недовыполняет свою норму, т.е. занимает место ниже, чем можно ожидать исходя из зарплат. Здесь есть очевидное объяснение – руководству приходится несколько переплачивать игрокам, дабы они согласились ехать в Грозный (хотя бы просто в силу стереотипов). Но если предположить, что за Тереком стоит некий административный ресурс, то результаты команды с 2004 года должны быть выше, чем они есть. Я согласен, что в некоторых случаях, отрицать попрание спортивного принципа, на мой взгляд, невозможно (иначе руководство Урала стоит уволить, а команду расформировать – но об этом в будущем). Но в целом, т.е. в среднесрочной перспективе, Терек играет именно так, как должен (или даже чуть хуже, если мое объяснение переплат через стереотипы Вас не удовлетворило).

Наконец, контрадикторный случай Ротора и Арсенала. Два клуба использовали принципиально разные стратегии вылета: агония Ротора (убрать тренера, убрать другого, убрать третьего, вернуть второго, вернуть первого) и стоицизм Арсенала (достойный, стоит сказать; мб, именно поэтому два года назад болельщики болели до последнего, а сейчас почти потеряли веру после 14 туров). Вывод один – если вы не обладаете достаточными средствами, чтобы набрать игроков уровня РФПЛ (не то что уровень высок, просто у игроков с паспортом запросы серьезные) – вам нечего делать в РФПЛ (этой темы я тоже коснусь в ближайшем будущем).

Итак, это не все выводы, которые можно сделать. На мой взгляд, модель Шимански (при всех ее недостатках) и мое миниисследование (при всех его недостатках) достаточно наглядны. Что важнее, здесь есть пища для размышления. У меня нет ответов на все вопросы, потому буду рад услышать ваши мнения в комментариях!

В заключение немного логики без эмпирики (почему мое представление о том, что модель Шимнаского в РФПЛ не сработает, было логически неоправданным). Первое, про рынок зарплат. Хотя модель на данных РФПЛ и работает, это не значит, что рынок наших зарплат эффективен. Это значит, что лимит вынуждает переплачивать, но переплачивают все, а потому ситуация выравнивается. Второе, про административный ресурс. Да, он применяется, да, это омерзительно. И да,  иногда это влияет на спортивные результаты (например, получив взаймы 3 очка, команда может остаться в РФПЛ). Но если вы взяли взаймы три очка, то вы должны будете их отдать. И если каждый сезон вы берете взаймы по три очка, то через 10 лет вам придется отдать 30, что невозможно. Хотя в некоторых случаях спортивный принцип оказывается у нас попран (а это недопустимо в принципе), в целом, т.е. в среднесрочной и долгосрочной перспективах, спортивный принцип в РФПЛ торжествует. Время все расставляет по местам. Собственно, оба этих логических вывода подтверждаются и проведенным анализом.

Если Вам понравился этот материал, пожалуйста, поставьте плюс, подпишитесь на мой блог и расскажите друзьям.

Далее план будет такой (ориентировочно):

  1. Почему приход богатых спонсоров угрожает нашему спорту?
  2. Влияют ли трансферы на позицию в лиге?
  3. Кто из тренеров РФПЛ круче всех, а кто переоценен больше всех (а также, кто крут, как и Бердыев, но Вы об этом не знали)?
  4. Стоит ли руководству клуба делать ставку на возвращение болельщиков или почему популистские решения неэффективны.
  5. Очко в огне: сколько в среднем стоит одно очко в РФПЛ или почему, если странный матч – не договорняк, Екатеринбургу стоит требовать расформирование Урала.
  • Vkontakte comments
  • Facebook comments