Datové zrcadlo extraligy: Pokročilé statistiky. Jak se zpracovávají v Česku a jak v NHL?
Hokej je adrenalinový sport, ve kterém se každou chvíli něco děje. Po 60 minut hráči (nebo hráčky) bruslí, bojují o puk, přetlačují se, srážejí se, přihrávají, střílí… Základní statistiky však většinu situací ignorují. Probudí se jen několikrát za zápas, když padne branka. V té chvíli se zapisovatelé podívají, kdo byl na ledě a započtou jim body podle posledních několika dotyků puku nezávisle na tom, jak signifikantní byly.
Což by nebyl takový problém, kdyby jakákoliv diskuse o hokejistovi nezačínala (a pohříchu i nekončila) na serveru eliteprospects.com, kde má každý pět základních statistik – zápasy, góly, asistence, +/- body a trestné minuty. Průměrný hráč přitom potřebuje sedm zápasů ke vstřelení branky. Když se přičtou všechny asistence, dočká se bodu v průměru za dvě a půl utkání. Nejčastějším zápisem v duelu tak zůstává 0+0 a -1/0/+1. Což je dost málo na vyjádření aktivity rozprostřené do 60 minut.
Proto vznikly pokročilejší statistiky. Sledují mnohem víc herních situací, často nezávisle na tom, jestli z nich padne branka, nebo ne. Od záznamu událostí, které si dovedete představit jako počty střel (na branku/vedle/zblokovaných), zaznamenání místa, odkud šly, přihrávky, držení puku, přes složitější parametry, jež mapují, co se děje, když je hráč na ledě (kde se hraje, kolik střel/šancí má jeho tým a kolik soupeř).
Vrcholem jsou pak složité matematické modely, které na základě informací z předchozích sezon kalkulují celkový přínos daného hokejisty, modelují kariérní očekávání nebo jiné pravděpodobnosti. "Když střílíš z tohoto místa po tomhle typu nahrávky z rychlého protiútoku, padne z toho gól ve 20 % případů." Jak to víme? Protože jsou k dispozici tisíce střel z předchozích sezon a tak to zrovna v té konkrétní lize chodí.
Zlí jazykové si představují práci analytiků jako snahu o vytvoření ultimátní excel tabulky, která převede veškerou radost a chaotickou kreativitu sportu do úhledných rovnic a sloupců čísel. Tak to ale není. Data jsou pomocným nástrojem podobně jako video. A správnou prací s nimi mohou fanoušci hokej mnohem lépe pochopit.
Například si hru rozdělit do jasně definovaných kategorií a vnímat je zvlášť. Naprostým základem je členění na přesilovky a běžnou hru pět proti pěti. Když si koupíte 30bodového hráče a nemáte pro něj "jeho" přesilovkový spot, odkud získal dvě třetiny své produktivity, čeká vás asi nemilé překvapení.
Čipy, tabulky a kamery
Dobrá data otvírají možnost jít mnohem hlouběji. Dají se objevit hráči, kteří jsou super zajímaví v brejkových situacích, ovšem těžko hledají roli v situacích, kdy se hra zpomalí. Nebo naopak. Najdete hokejisty, kteří mají 100 střel a jediný gól a trápí se, jak svou smůlu prorazit. Data mohou spolu s videem najít řešení. Či alespoň zjistit, kde je problém.
Když přijde po zápase videokouč s rozborem zápasu, pitvají se vybrané situace do hloubky. Data dodávají diskusím druhý rozměr – šířku. OK, tady to hráč pokazil, ale jaké jsou jeho dlouhodobé tendence? Jakou roli na ledě má? Jaké úspěšnosti dosahuje ve vybraných situacích?
Vedle toho vnášejí data do sportovních debat společný jazyk. Když mluvíte o dobrém střelci, znamená to, že jde o hráče, jenž pálí pořád a ze všeho a má solidní úspěšnost (tzv. volume shooter), nebo se spíš díváte na jeho vysokou střeleckou úspěšnost (jíž však mají spíš ti, kteří s pokusy šetří a střílejí, jen když jim kyne prázdná branka)? Anebo odkazujete na sílu střely? Zápěstím nebo nápřahem? Kolik různých variant vlastně schovává ve svém repertoáru? Umí střílet dobře z jízdy, má dobrý příklep? A kde jsou jeho oblíbená místa?
Místo generické diskuse o tom, jestli to daný hráč v sobě má, se při využití správných čísel lze bavit mnohem víc konkrétně. A třeba aspoň zajistit, aby daný hokejista na tréninku nestřílel jako 90 % jeho kolegů většinově z míst a situací, do kterých se v zápase vůbec nedostává…
Kde se vlastně statistiky berou? V Česku se třeba hromada dat sbírá přímo živě na stadionu, aby byly k dispozici rychle pro TV přenosy a trenéry na střídačkách. Data pak ještě procházejí kontrolou přes videozáznamy a přidávají se k nim další, podrobnější informace. Většina zasvěcených se s nimi setkává prostřednictvím systému HockeyLogic, který nabízí stovky různých parametrů (a vycházejí z něj i televizní komentátoři). Spoustu dat si navíc mohou kluby sledovat interně.
V NHL mají podobně sbíraná data mnohaletou tradici. Navíc v poslední době nastupují hráči do zápasů s čipy v dresech, které poskytují spoustu informací o hře s pukem i bez ní. Díky nim třeba můžete zjistit, přes kolik hráčů jste stříleli, jak daleko od vás byli obránci, jakým stylem hraje soupeř a spoustu dalšího.
Část informací zveřejnila NHL prostřednictvím svých edge stránek. Bohužel jde zatím jen o základní ochutnávku, co je možné. Užitečná čísla se v nich mísí s trochu nesmyslnými statistikami a kuriozitami.
O zpracování statistik a jejich přeložení do hokejové řeči se v NHL starají týmy statistiků, datových inženýrů a vědců. I v Evropě je však práce s daty čím dál běžnější, ať už přes edukované videkouče nebo díky specializovaným analytikům. Trend určuje Švédsko, nicméně i v Česku se s daty pracuje stále častěji a snad i pečlivěji. Spousta práce však v tomto oboru stále zůstává...
Autor je hlavním analytikem Bílých Tygrů Liberec a české reprezentace.