Не так давно вышло интервью с аналитиком «Оренбурга» - Евгением Шевелевым. Помимо интересного рассказа о внутренней кухне там прозвучала интересная цитата, вынесенная в заголовок, но на мой взгляд она не совсем верна. Давайте разберёмся.
Итак, существует огромное количество разного рода статистики.
Когда-то и ТТД считались прорывом. Однако, любая статистика бесполезна вне контекста, я бы сравнил это с анализами, нежели с гомеопатией. Возьмём ситуацию, вы относительно здоровый человек (в медицинской терминологии это означает «человек без жалоб и патологий, обнаруженных ранее»), я, будучи вашим врачом назначаю вам с десяток анализов, и я абсолютно уверен, что минимум два из них будут выходить за пределы нормы. О! Голубчик, да вы больны, у вас что-то «не в норме». Несмотря на полное отсутствие клиники. Как так? Всё очень просто, «нормой» мы считаем определённый референс, интервал. Но откуда он взялся? Взяли большую группу всё тех же относительно здоровых людей и взяли у них анализы, «обрубили» слишком сильные отклонения. В таком случае за «норму» будет принят самый часто встречающийся признак в распределении и представлять собой кривую Гаусса (среднее значение встречаются наиболее часто, а чем больше они отличны от среднего – тем реже).
Однако, здесь существует сразу целый ряд проблем:
1. Не каждая аномалия – патология. Если мы взяли за «норму» среднее значение будь, то xG, давление или глюкоза крови, как нам понять, где же начинается «патология». Смотрите: нормальное давление 120/80, а если оно 129/84 это ещё нормальное или уже нормальное повышенное?
Не думаю, что человек с таким давлением чувствует себя сильно лучше или хуже, чем он же при 130/85. Всё зависит от того, как меняется его самочувствие в зависимости от этих цифр. То же можно легко спроецировать на футбол: команда набила 0.21 xG это мало? Очень мало. Но она забила, а соперник набрал 0.1 xG и не попал даже в створ? Значит этого достаточно. Тогда и гол с 0.21 xG это нормально? Ведь команда победила! Так как это вообще интерпретировать. Как говорится: «А-а сложна-а».Давайте чуть проще: на тренировке 3 человека бегут на тренировке с пульсом 130. Один – только восстановившийся от травмы средний игрок, другой – молодой, только-только со сборов и уже в форме, подходящей для сезона, третий – возрастной, только из отпуска. Уж даже не говорю об их разнице в росте и весе. Такой пульс для одного – показатель, что он выходит на оптимальный уровень, для другого – недостаточно высокой нагрузки, для третьего – слишком высокой интенсивности нагрузки и только специалист может правильно интерпретировать эти показатели и дать верное указание (на следующую тренировку или в реальном времени, тут уже зависит от оборудования). Иными словами – понятие нормы крайне индивидуально.«Серые зоны». В любой статистике, будь то анализ крови или игры команды есть зоны, не вписывающиеся ни в понятие нормы, ни в понятие «патологии». Как быть с этим? Всё снова упирается в контекст и анализ остальных показателей. Допустим, АД 130/85 для сорокалетнего и двадцатилетнего – это два разных значения в отношении к «норме». 40% - явно ниже среднего, но для одной команды – катастрофа и провальный матч, для другой – весьма неплохой уровень и, возможно, один из сильнейших матчей в сезоне. И вот эти зоны, уже не нормальные, но ещё не "патологические" - огромная головная боль, ведь именно в таких случаях всё максимально зависит от контекста.
Погрешность исследования. Несмотря на навороченную технику всегда будет присутствовать фактор ошибки. Если вы возьмёте данные Opta, Instat, Understat и прочих источников, вы можете заметить, что чем сложнее показатель (обводки, единоборства, пасы в финальную треть и пр.) тем сильнее будут разниться данные. Ведь всё зависит от того, как их собирать. Например, у вас есть лаборатория прямо в доме. Вам нужно сдать пролактин. Но вы знаете, что во время сна и первый час после он повышен? Конечно нет. Вы сдаёте его только встав, ещё не проснувшись толком и, о чудо, он повышен, хотя на самом деле вы здоровы. Поэтому в медицине существует огромное количество дополнительных исследований, повторных замеров, нагрузочных проб и т.п. То же самое и в спорте: кто-то считает успешным отбор, если команда завладела мячом, кто-то, если соперник потерял мяч, независимо от того, кто им завладел и т.п.
К чему вся эта сложная подводка? К тому, что любая статистика – современный и полезный инструмент, как МРТ, КТ и сложные БХ анализы крови. Она жизненно необходима для более глубокого понимания проблем, будь то человек или целая команда.
Может ли тренер быть одновременно аналитиком – однозначно нет. Такие объёмы данных ему попросту не нужны, его задача готовить команду к матчу, анализировать соперника и свою команду, но более глобально, чем количество передач под удар четвёртого запасного за последние 3 года. Аналитики порой засиживаются до глубокой ночи в попытках грамотной интерпретации тех гигабайтов статистики на каждого соперника, да и свою команду. Обязан ли тренер что-то понимать в этих данных? Конечно. Но он должен получать уже готовый, обработанный продукт. В контексте данной ситуации. Он, как и врач, должен выбрать те данные, которые нужны ему и уметь их для себя интерпретировать, более того, статистика должна подтверждать или опровергать гипотезы, нельзя «лечить цифры» или основываясь только на них исключать какие-либо аномалии. Статистика – это инструмент, а не аргумент.
Взять, к примеру «Динамо». Команда откровенно слабо выступила в прошлом году, но они говорят журналистам и болельщикам – смотрите на xG, на ожидаемые очки, мы должны быть по ним вообще в еврокубках, но, как говорил великий: «Ваши ожидания – ваши проблемы». Задача тренера – превращать ожидаемые очки в реальные, чтобы игроки превращали ожидаемые голы в реальные. Я уверен, что есть куча иных показателей, по которым «Динамо» проседает. Всё это похоже на курицу с отрубленной головой: видите? Бегает! Значит живая. Или другой пример. Приходит пациент с огромным уровнем сахара, вот-вот свалится в кому, а врач ему: «ну давление-то у тебя нормальное! Чего ты мне голову морочишь!».
Именно по этой же причине в медштабах и вообще простой жизни мы не можем на место врача посадить компьютер или лаборанта, чтоб тот по чисто механическим показателям ставил диагноз. Всё нужно уметь правильно интерпретировать и выбирать нужные показатели. В этом плане на текст меня вдохновила ещё и статья от 2017 года, которая называется «На всякий случай». Если коротко, то в ней говорится о том, какое огромное число бессмысленных анализов проводится сейчас.
«Убедись, что здоров». Это так не работает. Диспансеризации двадцатилетних студентов, которых даже для этого снимают с занятий, вот скажите мне, у кого-то что-то находили на ней? Не считая того, на что были жалобы или уже имелось? Диспансеризация молодых нужна была в раннем СССР, когда народ был развален двумя подряд крупнейшими в своей истории войнами. (А затем влез и в третью). Но не об этом. В текущих реалиях диспансеризацию должны проходить люди группы риска: лица старше 40-45+, ежегодно, на предмет рака прямой кишки, простаты, патологии репродуктивной системы у женщин и т.п. Что вы можете найти у двадцатилетнего студента? Повышенные ферменты печени? Вероятность того, что это не гепатит, а позавчерашняя попойка близится к 100% зачем копить тонны и гигабайты бессмысленной информации? Всё равно, когда она действительно понадобится, эти исследования уже потеряют актуальность и провести их придётся снова. Анализы нельзя взять впрок, «на всякий случай». Но я отвлёкся.
То же самое и со статистикой. Можно выгрузить абсолютно всё. На каждого. Это будут терабайты данных на каждую команду, которые будут обновляться каждую тренировку. Никто же так не делает. Берётся ряд показателей, наиболее информативных в данной ситуации и отслеживается. Всё остальное делается «по требованию». Это касается не только статистических, но и медицинских данных. Вам же не проводят каждый месяц МРТ вообще всего. Даже если у вас на это есть деньги.
Возьмём пример с Дзюбой. Он не забивает полгода, но, когда его нет на поле, команда забивает в разы меньше, да и вообще в атаке выглядит беспомощно. Где здесь связь? Давайте выгрузим все данные по передачам, ударам, пасам в финальную треть всей команды с Дзюбой на поле и без него, статистику команд, игравших против нас с Дзюбой и без него. Но зачем, если это можно обратить внимание всего на два показателя – ключевые пасы и голевые передачи.
То же самое и с медициной. Не нужно делать КТ всего организма, УЗИ щитовидной железы, сдавать все фракции её гормонов, чтобы обнаружить дефицит йода и витамина D у жителя крайнего Севера. Мы и так знаем, что это область с йододефицитом и где по полгода нет солнца. Не нужно изобретать велосипед, и сохранять принцип «от простого к сложному». А для этого нужны профильные знания. Простые решения сложных задач – это то, к чему стремятся специалисты любой области, но как это не было парадоксально – путь к простым решениям всегда тяжёл.
Источники: Фадеев В.В. На всякий случай… // Клиническая и экспериментальная тиреоидология. – 2017. – Т. 13. –
№2. – С. 13–30. doi: 10.14341/ket2017213-30
«Почти вся статистика сегодня – это гомеопатия, в xG никто ничего не доказал». Интервью самого дерзкого аналитика России – СБГ-блог
Фото: ФК «Зенит»; «Оренбург»
Свежие комментарии