«При Личке «Динамо» — самая бьющая команда». Крутые истории о статистике в РПЛ
Компания РУСТАТ – партнёр «Советского спорта». Не только предоставляет углублённую статистику в российском футболе, но и совместно с нашей редакцией собирает символическую сборную РПЛ после каждого тура и месяца.
Мы попросили коллегу в лице Дмитрия рассказать нам о том, что же такое пресловутый xG и как он соотносится с реальностью, для чего нужна фитнес-статистика, где провисают показатели «Спартака», сколько аналитиков работало на Владимира Ивича и, конечно, о том, как же мы собираем символическую сборную тура.
Материал подготовлен специально для журнала «Советский Спорт – Футбол». Ещё больше про российский и мировой футбол читайте в свежем выпуске. Оформите подписку или приобретайте в киосках вашего города.
«Охватываем все наши лиги профессионального футбола»
— Как происходит расчёт статистики РУСТАТ?
— Методология расчёта существует уже давно. Изначально идёт разбор матча в режиме лайв – происходит тегирование определённых эпизодов вручную: передачи, удары и прочие тактико-технические действия (ТТД). И уже по окончании матча происходит пересчёт статистики – все теги, которые были вбиты по ходу матча, уже пересчитываются автоматически.
Разберу на примере передач: сделали теги по передачам, и уже автоматически расписывается длина передачи – делится на короткие, средние, длинные и сверхдлинные по метражу и направлению (поперёк, назад, вперёд). В конечном итоге получается то, что мы видим в статистических данных.
За матч бывает порядка двух-двух с половиной тысяч тегов.
— Какие показатели труднее всего подвергаются подсчёту?
— Чисто логически самыми сложными будут спорные эпизоды, когда, например, надо посчитать выигранные единоборства, отборы или удачные обводки. Такие неоднозначные эпизоды, когда происходит мгновенное действие и его надо правильно посчитать.
Бывает, за две секунды происходит очень большой объём действий. Например, два защитника пошли в отбор, нападающий одного обыграл, но второй совершил перехват, нападающий вернул мяч, но защитник снова его отобрал. И ещё в этом эпизоде кто-то нарушил правила. Такие эпизоды требуют максимально быстрого тегирования с разбивкой на определённые ТТД. Суета, говоря обычными словами. Но всё равно это всё считается.
— Какой у вас охват в российском футболе?
— Мы охватываем все наши лиги профессионального футбола: РПЛ, Первую лигу, Молодёжную футбольную лигу, Юношеские футбольные лиги 1, 2 и 3, юношеские лиги с разбивкой по возрасту и регионам, абсолютно все подгруппы Второй лиги, женскую Суперлигу, женскую Молодёжную лигу, Кубок страны, а также различные турниры, такие как Зимний кубок РПЛ. Это разбирается.
— Такой большой объём – результат желания охватить всю статистику российского футбола?
— Тут одного желания мало, нужны ещё возможности. Ни для кого не секрет, что с уходом Instat наши клубы, по сути, остались без статистики, потому что больше никто её не считал. Совместно с РФС было принято решение, появился РУСТАТ. В кратчайшие сроки мы наладили все алгоритмы работы, начали всё это считать, и клубы не заметили потери бойца.
Безусловно, это оказывает влияние на наш футбол. Развивать молодёжный футбол намного проще, когда у тебя есть цифры и данные. Наша платформа носит не только цифровой характер обозначения. У нас все цифры кликабельны. Тренеры и аналитики открывают платформу, смотрят матчи, разбирают эпизоды на видео. Это максимально удобно и лучше, чем искать матчи в записи, нажимать паузы, нарезать отрезки и так далее. Здесь можно всё посмотреть с разбивкой на действия – как командные, так и отдельных игроков.
— Статистика лежит в общем доступе?
— Нет, сайт – не открытая платформа. Зарегистрированные пользователи имеют доступ, но зарегистрироваться могут не все. Клубы и лиги получают статистику, а просто по желанию зайти нельзя. Но мы взаимодействуем с крупными СМИ и блогерами. Они к нам обращаются, и мы делимся статистикой. В этом плане мы абсолютно открыты. А так тоже надо понимать, что продвинутую статистику с таким большим количеством параметров и объёмом работы всем давать будет не совсем правильно.
— Был ли кейс, когда к вам обращались из клуба с просьбой разобрать профиль того или иного игрока?
— Конкретно таких случаев не было, потому что у тренеров, аналитиков и в целом у клуба есть доступ к платформе. То есть они всё это могут сами посмотреть, все цифры и видео.
«Ростов» забил на 10 мячей меньше ожидаемых»
— Что такое фитнес-статистика?
— Фитнес-статистика — это все действия игрока на поле с учётом его бега, ускорений, пройденной дистанции пешком, на рывках и спринтах (выше 25,2 км/ч). Это всё, что связано с движением игроков, отражённое в метрах и километрах в час.
Также есть и дополнительные показатели по просьбе тренерского штаба. Прежде всего это физическая готовность команды. Но повторюсь, что фитнес-статистику нужно смотреть вместе с другой статистикой. Если человек за матч отбегал 11-12 км за матч, но совершил всего 30 действий, то по большей части всё это было лишним.
И по этому поводу, скажу это вам первым. Сейчас мы совместно с экспертами из РФС ведём проект, который будет в части фитнес-статистики коррелировать с тактико-техническими действиями игроков. По проекту, он будет называться индексом интенсивности. В нём есть определённые формулы. Мы уже пробовали его на матчах сборной России, и самый большой показатель был зафиксирован в игре с Камеруном.
На наш взгляд, это очень полезная штука, которая будет подчёркивать, помимо фитнес-статистики как таковой, что игрок сделал на этой дистанции и с этой скоростью. Думаю, это понравится и простым болельщикам, и тренерскому штабу.
— Как высчитывается xG?
— Хороший вопрос, потому что про xG в наших социальных сетях тоже часто спрашивают. Начнём с того, что xG оценивает опасность удара – от нуля до единицы. Например, пенальти – 0,75 xG. Остальные моменты уже не объяснить на пальцах. Мы пользуемся моделью Пола Райли, в соответствии с которой присваиваем каждому нанесённому удару уровень опасности, обозначаемый цифровым значением. В данный момент, несмотря на критику и множество вопросов, лучше показателя оценить именно опасность в игре не придумано.
Нет, сейчас разрабатывается новая методика, которая, скорее всего, скоро появится в широком формате – опасность моментов без удара. Это когда голевой момент был, а нанесённого удара не последовало. Со временем это тоже будет считаться.
Но пока что xG – единственное, на что можно опираться. Опять же, если команда нанесла 20 ударов, кажется, что она классно атаковала, однако при ближайшем рассмотрении может оказаться, что 15 ударов были нанесены с 25-30 метров. У подобных ударов, бывает, цифры не доходят даже до 0,1, так что за 15 ударов можно даже единицу не набить. Как раз для корреляции этих показателей и придуман xG.
Сейчас есть хороший пример: в матче «Манчестер Юнайтед» и «Манчестер Сити» Эрлинг Холанд промахнулся буквально с ленточки. Этот удар оценивается в диапазоне от 0,6 до 0,66 xG – он даже менее опасен, чем пенальти. То есть если взять за единицу расчётов 100 ударов с этой точки, то реализуют их 66 раз.
— Каким должен быть удар, чтобы его оценили на единицу?
— Единица – это гарантированный гол. Соответственно, такого 100% удара не существует, даже из, на первый взгляд, самой выгодной позиции.
— В прошлом сезоне по xG чемпионом стал «Спартак», а фактически он финишировал третьим. Насколько этот показатель вообще отражает реальную картину?
— Естественно, нет одного такого параметра, который полностью отображал бы картину. Статистику нужно смотреть суммарно, всеобъемлюще и, естественно, нудно совмещать её с матчем. Нельзя, просто посмотрев на цифры, понять, как сыграли команды.
Например, недавно в Первой лиге «Алания» в Тюмени набила 2,65 xG, и люди, которые не смотрели матч, увидев статистику, могли бы сказать: «Вот это была доминация!» Но не факт, что это было так. На практике гости там пробили два пенальти, которые в сумме дали 1,5 xG. И в результате забили вполне рядовой один гол.
xG – не единственный параметр, из так называемой «продвинутой» статистики, который считает РУСТАТ. Есть ещё много интересных параметров, как например «конверсия xG» и «xG на удар». Именно последний может дать нам понять, насколько эффективными удары являлись в среднем. Мы даём своим пользователем огромную палитру данных, которую они могут использовать в своём анализе.
Есть еще такое понятие, как оверперфоманс. Это когда, например, команда набила 8 xG, а забила 12 голов, то есть на несколько больше ожидаемого. А бывает и наоборот. В текущем сезоне лидер по ожидаемым голам у нас как раз «Ростов» (38,06 xG), но, как мы видим, они забили 28. То есть «Ростов» забил на 10 голов меньше ожидаемого. На это тоже надо обращать внимание, называется андерперфоманс.
«Чемпионская команда – нечто большее, чем сопоставление цифр и фактов»
— Можете выделить самых везучих и невезучих игроков РПЛ по xG?
— Тут, наверное, нужно брать не только xG, но и смотреть голевые моменты. Но если говорить о xG, то самый большой показатель у нас в лиге у Константина Тюкавина – 11,35 (на его счету 9 голов). А Матео Кассьерра (9,4 xG) забил 15. Кстати, он является у нас одним из лучших по реализации голевых моментов.
У Джона Кордобы, Фёдора Чалова и Кассьерры xG примерно на одном уровне – 9,1-9,7. Мохамед Конате неожиданно залетел в этот топ (9,3 xG), но он, как и Чалов, часто бил пенальти, а это автоматом 0,75 xG за удар. Или Чалов – пять из восьми голов с пенальти. Получается, из 9 xG он с пенальти набил 3,8. У Конате xG выше, но четыре гола из пяти – с пенальти.
Всё нужно смотреть в совокупности, и это есть на платформе. Мы можем смотреть карту ударов игроков и оценивать, а просто оторвать xG от другой статистики – нельзя.
— Можно ли исключительно по статистике собрать топ-команду, как это сделал герой Брэда Питта в фильме «Человек, который изменил всё»?
— Нет. Чемпионская команда требует чего-то большего, чем сопоставления фактов и статистики. Фильм хороший, на реальных событиях, но надо понимать, что бейсбол – более результативная игра. Если сравнивать бейсбол, футбол и баскетбол, то футбол – самый нерезультативный. Бывают матчи, когда забивают восемь голов, но в основном это три-четыре за игру.
Если поискать связь с фильмом, то по статистике можно поднять игроков, которые в какой-то команде чувствуют себя некомфортно, выполняют не свою роль, а затем приобрести их в другую команду, которая стилистически подходит по схеме игры и тренеру, и игрок получает удобную для себя роль на поле.
Вот, например, Йозуа Киммих. Его можно поставить опорником или крайним защитником. Он на обеих позициях будет одним из лучших. Но сейчас в «Баварии» Томас Тухель, у них какие-то конфликты. Естественно, это тоже влияет на игру, и Киммих выпадает из общего объёма, хотя за ним очередь из топ-клубов. Он вольётся в «Ливерпуль» Юргена Клоппа и отлично подойдёт Хосепу Гвардиоле. Статистика может помочь подсветить определённые показатели. Например, человек играет в защите, но у него хороший отбор, передача и навык развития атак, и тренер может попробовать его в полузащите, потому что видит показатели, которые ценятся на данной позиции.
Если говорить про нападение, то есть несколько видов нападающих. Есть чистые форварды, как Гарри Кейн и Роберт Левандовски, которые не только много забивают, но ещё что-то умеют. Есть, например, Эрлинг Холанд, который был исключительно голеадором, а сейчас учится многому: может играть на линии офсайда или отдать на Кевина Де Брёйне голевую. Он выбрал себе карьеру обучения, хотя ни для кого не секрет, что, если бы он сейчас перешёл в «Баварию», забил бы не меньше Кейна.
Есть же эффект Бундеслиги – когда форвард уходит в другой чемпионат, он долго привыкает, показывая свою реальную статистику. Холанд ушёл и показал, что действительно умеет забивать. На него многие жалуются, что он не реализует моменты, но для начала их нужно создать. Если он их создаёт, можно сделать вывод, что он и команда играют правильно.
Чисто на статистике чемпионскую команду построить нельзя, но есть другой пример – «Брайтон». Он построен на математических моделях, поэтому иногда туда приходят игроки, которых никто не знает, но при этом они показывают лучшую форму. Понятное дело, что это не чемпионская команда, но «Брайтон» в сентябрьском матче с «МЮ» вышел составом, который обошёлся им в € 18 млн. Там на одного Гарри Магуайра потратили € 85 млн, а здесь целый состав, который их обыграл. Это работает в определённых моделях.
Про чемпионство, основанное на статистике, пока говорить рано, но пример, что это прекрасно работает, у нас есть. Каору Митома пришёл в «Брайтон» за € 3 млн, но в 33 матчах 7+6 по системе «гол+пас». Ещё более очевидный пример – Алексис Мак Аллистер. «Брайтон» продал его в «Ливерпуль» за € 42 млн, а приобретал – всего за € 8 млн. В отдельно взятых случаях это работает.
«Личка раскрыл Лаксальта и помог росту Тюкавина»
— Давайте пройдёмся по новым наставникам в РПЛ. Как статистически с приходом Марцела Лички преобразовалось «Динамо»?
— Футбол Марцела я охарактеризовал бы как романтичный. Человек был заточен на атакующий футбол и с тем же «Оренбургом» не отсиживался в обороне, старался играть от себя. У него это получалось, и он оказался в «Динамо», которое к 20-му туру держится в чемпионской гонке и лидирует по многим позициям.
При нём «Динамо» стало самой бьющей командой и лидером чемпионата по количеству голевых моментов. Это самый яркий маркер прихода Марцела. В прошлом сезоне такого не было. Команда нанесла больше на 31 удар в целом, и на 11 – в створ, чем ближайший преследователь.
Количество ударов выросло в среднем на два за матч, соответственно, растёт и количество угловых. На стандартах у «Динамо» есть кому забивать. Могут и разыграть, потому что есть ребята с хорошим ударом. Стало чуть больше быстрых атак, потому что они стараются играть побыстрее.
В плане скорости «Динамо» было вторым по дистанции на спринтах. Спринты – это скорость выше 25,2 км/ч, то есть рывки на больших скоростях. У Лички бодрая команда. Она бежит на высоких скоростях, прессингует, перехватывает, быстро переходит в атаку. Все показатели говорят об этом.
Количество обводок тоже немного выросло. Динамовцы стали реже идти в верховые единоборства, стараются больше низом играть, а самое главное – в лиге они дают меньше всех передач в борьбу. То есть стараются сыграть понадёжнее, отдать передачу не так, чтобы форвард за неё боролся, а спокойно покатать от ворот низом, растянуть атаку и прочувствовать всё. Это тоже его особенность. По средней длине передач «Динамо» на третьем месте в лиге. Короче играют только «Зенит» и «Спартак».
При нём хорошо раскрылся Диего Лаксальт. Многие знают его как флангового игрока, а Личка сделал из него опорника. Лаксальт часто попадал в топы тура. Для меня опорник – одна из ключевых позиций в футболе. Это универсальный игрок, который может обороняться, разгонять атаки, подключаться к ним, а если он ещё и с ударом – вообще прекрасно. Лаксальт – один из таких.
Также мы видим прекрасный рост Тюкавина. Он много забивает, ассистирует, создаёт моменты, сам получает такие моменты, лидирует по xG в лиге. Основной штрих Марцела – добавить жизни команде.
«Футбол «Спартака» – не чемпионский»
— Сейчас одна из главных тем в нашем футболе – возможная отставка Гильермо Абаскаля. Если обращаться к цифрам, там всё так же печально, как и в некоторых матчах «Спартака»?
— Нужно обозначить, что это один из клубов, который постоянно вызывает на себя реакцию в любом СМИ. Однако ситуацию надо рассматривать в совокупности. «Спартак», как и «Динамо», старается действовать за счёт коротких передач, идёт на втором месте в лиге по ударам, на четвёртом – по ударам в створ и на шестом – по количеству голевых моментов. Абаскаль нацеливает свою команду бить по воротам, и с атакующими показателями всё, в принципе, нормально.
С другой стороны, «Спартак» всего лишь 10-й по xG. По этому показателю выше даже «Оренбург», «Ахмат», «Крылья Советов» и «Ростов». Эти команды наносят меньше ударов, зато они намного опаснее. По количеству передач «Спартак» на третьем месте в лиге, а точность составляет 84%.
Также у нас есть такой показатель, как разница между своими ожидаемыми голами и соперника. По этой разнице красно-белые находятся в минусовой зоне – ожидаемых голов у их соперников больше, чем у самого «Спартака». Если учесть, что на практике красно-белые забили только на один больше, чем пропустили, можем предположить, что некоторые игроки Абаскалю не подходят. Возможно, он и сам ошибся с их выбором. Взять того же Хесуса Медину в ЦСКА и «Спартаке» – это как будто два абсолютно разных игрока.
Есть проблема с позицией опорного полузащитника, которую закрывают Руслан Литвинов, Наиль Умяров и даже Кристофер Мартинс, который смещается на фланг.
У меня нет однозначного ответа по поводу Абаскаля. Многие показатели команды в норме, но разница созданных и допущенных моментов у команды, претендующей на чемпионство, не может быть отрицательной.
— Отставку Владимира Ивича из «Краснодара» многие подали как увольнение лучшего тренера в истории клуба. С точки зрения цифр это утверждение соответствует реальности?
— Всё-таки он провёл в «Краснодаре» не полный сезон, и тяжело рассуждать о том, что было бы дальше. По количеству набранных очков с момента его прихода «Краснодар» обошли только «Зенит» и «Локомотив», что является хорошим показателем. У команды были медали только при Олеге Кононове и Мураде Мусаеве. Велика вероятность, что Ивич составил бы им компанию.
Сравнивать тренеров сложно, поскольку надо учитывать ещё и то, какие составы были у Кононова и Мусаева, но по целостности картинки (не хочу сейчас никого обидеть) Ивич, на мой взгляд, действительно превосходил предшественников.
Тут ещё надо добавить, что у команды хороший аналитический отдел. Если не ошибаюсь, в нём работают 29 человек – больше, чем в любом другом клубе РПЛ. Думаю, это являлось одной из составляющих успехов Ивича. «Краснодар» хорошо готовится ко встрече со своими соперниками и подбирает игроков. Тот же Кордоба – один из лучших нападающих РПЛ.
«Индекс не является оценкой»
— Как вы составляете сборную тура РПЛ?
— Нас часто об этом спрашивают в комментариях, и тут надо расставить все точки над «i». После каждого тура РПЛ у нас формируется отчёт по нему. Не буду полностью рассказывать о его содержании, но у нас есть несколько страниц, где игроки на своих позициях распределены по индексу РУСТАТ. На его основе мы рассчитываем сборную тура, выбирая игроков по позициям.
Учитывая, что мы работаем коллективно, также подбираем и игровую схему. Когда-то может выйти сборная с тремя центральными защитниками или двумя нападающими, зависит от индекса. По сути, наш индекс нельзя назвать оценкой.
Индекс игрока формируется на основании его игры в конкретном матче и зависит в первую очередь от конкретной позиции игрока. Стоит понимать, что на индекс сильно влияет контекст игры – процент тех или иных удачных или неудачных действий игрока относительно общего количествава действий этого же типа, которые совершили его партнёры.
Помимо этого берётся в расчёт и количество времени, проведённое игроком на поле. Многие не задумываются об этом, а ведь при выставлении индекса приходится в том числе сравнивать игроков, которые провели на поле, скажем 90 и 30 минут. За 90 минут игрок имеет больший шанс устать и иметь больший брак в передачах или единоборствах, нежели футболист, который играет на поле в три раза меньше времени.
Часто тренеры, у которых возникает вопрос про индекс, забывают о наличии игрока желтой карточки, голевых ошибок, большого количества фолов или потерь на своей половине поля. А ведь это важные факторы. Классический пример - игра Луиса Суареса рукой на ЧМ-2010. Она в последствии сделала Луиса героем нации, однако на индекс эта игра рукой (как результат – красная карточка и пенальти в ворота его команды) повлияли негативно.
В целом же, из-за огромного количества факторов, которые мы учитываем при расчёте индекса, корректнее смотреть его на протяжении турнира, а не в конкретной игре, где ни один статистический провайдер не может учесть тренерского задания, выданного игроку. Например, по индексу лучшие в РПЛ прямо сейчас Дуглас Сантос, Клаудиньо, Вендел и Квинси Промес. Не думаю, что кто-то скажет, что эти игроки имеют такие показатели случайно.
Бывает так, что в отчёте мы видим небольшую разницу между игроками из-за количества сыгранных ими минут и в таком случае обращаемся к дополнительным показателям. К примеру: Тормена совершил 120 действий, из которых 98 – передачи, а Кирилл Гоцук совершил 80 действий, из которых 30 – передачи, а всё остальное – отборы и перехваты. Естественно, что он будет выше, особенно если ещё и забил при этом.
Несмотря на вариативность, в этом плане у нас всё объективно, поскольку над символической сборной работают семь человек и обязательно больше половины смотрели тур. Так что индекс за нас считает компьютер, а мы берём из отчёта фамилии и расставляем их в выбранную схему. Например, в сборную 19-го тура попало очень много защитников. У нас тогда было пять ничьих, но невозможно поставить в команду пять-шесть центральных защитников. Хотя по индексу многие центральные защитники были выше остальных полевых игроков.
Сборная месяца составляется точно так же, исходя из отчёта за месяц.