|
25.03.2004 Олимпиады
|
Как оценить хоккеиста полностьюСтатистика хоккея содержит не так уж мало информации, особенно нхловская. Но вот работают с ней отвратительно плохо. А ведь статистические данные это только факты и еще надо как-то их проанализировать. Для этого нужна модель хоккеиста. Традиционно в лучшем случае пытаются как-то просуммировать показатели или разделить один на другой. Так поступают все спортивные статистики и на основании этих простых арифметических действий ранжируют игроков. А ведь от этого зависит их не только спортивная карьера. Итак мы имеем следующие данные. GP - игры, G - шайбы, A - передачи, PIM - штрафные минут - это стандартная хоккейная статистика, которая велась в НХЛ с 1917 года. Правда насчет результативных передач в начале хоккейной истории у меня сомнения... Ну что имеем, то и имеем. Задача - как определить лучшего игрока? Не лучшего нападающего, не лучшего защитника, а игрока. Вообще вся статистика традиционно уделяет внимание нападающим. И это естественно, шайбы и результативные передачи считать легко. А что делал на площадке защитник? Бог его знает. Путался в ногах у нападающих и мешал играть. С вратарями немного полегче, у них с некоторых пор броски по воротам считаются, ну и конечно пропущенные шайбы - компромат на вратаря. А если вратарь играл в слабой команде? И колотили в него шайбами кому не лень? Сотворить чисто статистическую, модель не так уж и сложно. но замучаешься потом искать здравый смысл. Поэтому стачала сообразим насчет некоторой модели, так сказать "физической" :))' Будем считать, что каждый игрок от вратаря до нападающего все время на площадке занят полезным делом. И вообще полагаем что все они обладают ОДИНАКОВОЙ (МАКСИМАЛЬНОЙ) способностью забивать шайбы, делать результативные передачи, и зарабатывать штрафы. На все это тратится время. Все время игрока - это сыгранный матчи - GP. На забивание голов он тратит время, которое равно числу заброшенных им шайб деленному на максимальнцю результативность - Goals per Games (GPGmax). В НХЛ это 1.93 шайбы за игру у лучшего нападающего в среднем за всю карьеру. Но мы строим модель, поэтому будем считать, что это порядка 2-х шайб или чуть больше. Итак каждый игрок тратит на забивание шайб G/GPGmax. Точно также определяем время затраченное игроком на результативные пасы - A/APGmax. В НХЛ APGmax (Assists per Game) порядка 5 пасов за игру в среднем за карьеру. Аналогично и с штрафными минутами, время за их "зарабатывание" равно PIM/PIMPGmax. В НХЛ PIMPGmax (Penalties in Minutes per Games) около 6 в среднем за карmеру. Итак мы считаем что каждый игрок забивает как лучший бомбардир, пасует как лучший пасующий и штрафуется как самый "хулиганистый" хоккеист в НХЛ. Отдельно о "хулиганах". На самом деле, действия штрафников направлены на пресечение атак соперников. Если бы это было просто хулиганство, то вряд ли тренер держал бы такого игрока долго на поле. Поэтому мы будем считать, что штраф - это прерванная атака, не забитый гол в свои ворота, а значит штрафные могут быть рассмотрены наравне с пассами и голами. Вычтя из всех игр время, затраченное на шайбы, пасы и штрафы мы получим еще некоторое "!свободное" время, которое хоккеист тоже использовал с пользой :)) для команды. Итак FT (Free Time) определяется формулой: FT = GP - G/GPGmax - A/APGmax - PIM/PIMPGmax А все полезные действия (RESULT) определим естественно как сумму голов, пасов, и свободного времени. Ну точно так же как в системе ГОЛ + ПАС. Только мы же понимаем, что вес (значимость) этих событий не одинакова. Поэтому суммировать будем с коэффициентами. RESULT = A1 * G + А2 * A + A3 * PIM + A4 * FT Здесь A1, A2, A3, A4 - просто коэффициенты, которые мы попытаемся определить позже. Взяв заброшенные шайбы за единицу измерения результата мы принимаем A1 = 1. В моем понимании УСПЕХ это некоторая величина, которая характеризует достижения. А впрочим с таким же успехом :) можно было ввести величину "достижение" и назвать ее мерой успеха. Одним словом вы все поняли... Если есть РЕЗУЛЬТАТ, и
есть РЕСУРС, а это сыгранные ИГРЫ, Произведя необходимые подстановки и преобразования мы просто получим: SUCCESS = RESULT * RESULT / RESOURCE. Я долго пытался найти этой формуле УСПЕХА нормальное статистическое объяснение. И нашел, кажется :)) Если взять биномиальное распределение и определить достоверность отличия РЕЗУЛЬТАТИВНОСТИ от НУЛЯ, то эта величина (кажется :)) пропорциональна УСПЕХУ. Иными словами мы задаем вопрос а какова достоверность что такое число мячей забитое за такое число игр НЕ СЛУЧАЙНО. Таким образом на вопрос, А не чайник ли Wain Gretzki? Мы отвечаем, что НЕ ЗНАЕМ, но достоверность того что он не случайно забил свои 1016 шайб, за 1695 игр у него выше, чем, например у Gordie Howe, который старался как мог и за 1934 игры забил 869. Когда нет информации о пасах, штрафах понятие FREE TIME - единственное, что позволяет оценить защитников. Как например в русском хоккее |
|
|