Yksinkertaisuudesta historiaa

LIIGA, NHL / Artikkeli
Millaisia ”piilotilastoja” jääkiekkoon on kehitelty? Innokkaiden harrastajien ja innovatiivisten ammattilaisten uurastus on tuottanut jo muutamia kaavoja, joiden käyttö suoritusten tarkastelussa on yleistymässä.

Tavanomaisesta poikkeaviin tilastoihin uppoutuminen voi sekoittaa pään. Jääkiekon tilastoanalyysi on lapsen kengissä, mutta olemassa on jo runsaasti pelin tutkimista edistäviä menetelmiä.

Yhdysvaltalainen Tom Awad suunnitteli kovan työn kautta järjestelmän, jolla yhden sarjan kaikki pelaajat voidaan laittaa samaan listaan ja arvioida heidän panostaan omalle joukkueelleen. Maalivahteja, puolustajia ja hyökkääjiä on käytännössä mahdotonta vertailla yli pelipaikkarajojen yhdenkään yleistilaston kautta, ja Awad kehitti mielenkiintoisen, joskin erittäin monimutkaisen menetelmän koko sarjan laajuisen pelaajavertailun mahdollistamiseksi.

Goals versus threshold (GVT) perustuu neljän osa-alueen omien arvojen laskemiseen ja lopuksi niiden yhdistämiseen. Mukaan lasketaan pelaajan panos joukkueen hyökkäyksessä, puolustuksessa, maalivahtipelissä ja voittomaalikilpailussa.

Järjestelmän nimi perustuu kuvitteelliseen kynnykseen, jonka loukkaantuva tai muusta syystä kokoonpanon ulkopuolelle joutuva pelaaja jättää korvaajalleen. Parempi pelaaja ylittää tämän kynnyksen, huonompi jää sen alle. Toisin sanottuna, miten vaikea pelaaja olisi korvata? Kynnys on desimaaliluku, ja jokaisella osa-alueella on omansa. Eri osa-alueille huomioitavia tilastoja ovat muun muassa pelaajan ja joukkueen tekemien maalien ja syöttöjen määrä sekä niiden arvo, eritelty peliaika hyökkäys- ja puolustusalueen pelaamisen suhteen, sekä maalivahdin kohtaamien laukausten perusteella sovellettu tehotilasto.

Kaikilla neljällä osa-alueella on omat käsiteltävät tilastokohtansa ja niiden avulla luodaan omat "kynnykset" hyökkäys-, puolustus-, maalivahtipelaamiselle sekä voittomaalikilpailuun. Kokonaiskynnys on näiden neljän desimaaliluvun summa. Mitä korkeampi kokonaislukema on, sitä paremmin pelaaja on auttanut joukkuettaan, tietenkin omaan rooliinsa ja joukkueensa tasoon suhteutettuna. Esimerkiksi kauden 2010–2011 Hart Trophyn voittaneen Corey Perryn viime kauden kokonais-GVT oli 23,30, runkosarjan pistepörssin voittaneen Daniel Sedinin 26,20 ja erinomaisen kauden Boston Bruinsin maalilla pelanneen Tim Thomasin peräti 40,0.


Tim Thomas oli NHL-kauden 2010-11 parhaita myös GVT-tilastolla mitattuna.
James Guillory

Tilasto perustuu maaleihin johtaviin tilanteisiin ja sen ongelma piilee lukuisissa olettamissa. Vastaavien tilastopohjien luominen vaatii kompromisseja ja GVT:n tapauksessa on jouduttu asettamaan muutamia NHL:n keskiarvoihin perustuvia vakioarvoja ja -kertoimia. GVT joutuu myös tasapäistämään. Se pitää monissa eri tilanteista syntyviä maaleja tasa-arvoisena, eikä tee erityishuomioita kiekonriistojen, maskipelaamisen tai hyökkäyksiinlähtöjen perusteella.

Monimutkaisia laskukaavoja vaativa järjestelmä on oikopoluista ja arvioista huolimatta kuvannut NHL:n tapahtumia hyvin. Esimerkiksi HockeyProspectus-lehti on ennustanut GVT-laskelmien ja kahden muun järjestelmän avulla Stanley Cup -finaalien voittajan ja vaadittavan ottelumäärän oikein jo kolmena vuonna peräkkäin.

Kotoiseen SM-liigaan GVT:n nykyistä kaavaa ei voida käyttää. Ainoa syy tähän löytyy SM-liigan tilastoista, jotka ovat etenkin NHL:ään verrattuna erittäin puutteelliset.

SM-liigan pelaajille ja joukkeille voidaan laskea vain hyökkäyspelaamisen GVT (OGVT). Tätä varten on laskettava joukkueen tekemien maalien yhteismäärä, joukkueen syöttöjen yhteismäärä, ja niiden avulla voidaan laskea yksittäisen maali- (GVt) ja syöttöpisteen (GVa) arvo.

Kun yksittäisen maalin ja syötön arvo on laskettu, voidaan laskea jonkun tietyn pelaajan panos joukkueensa hyökkäyspelaamiseen (hyökkääjillä TOCf ja puolustajilla TOCd, Threshold Offensive Contribution per minute). Kaavassa on yksittäisen maalin ja syötön laskemisessa käytetyjä komponentteja, ja uutena lisänä on huomioitava OTV (Offensive Threshold Value), jonka Awad arvioi olevan 0,75. Tämä tarkoittaa, että mahdollisen korvaavan pelaajan panos on 75% keskivertopelaajan hyökkäyspään panoksesta.

Kun minuuttikohtainen panos hyökkäyspelaamiseen on tiedossa, voidaan laskutoimituksissa käytetyt komponentit yhdistää ja saatava summa on pelaajan hyökkäyspelaamisen GVT.

Esimerkiksi voidaan ottaa HIFK:n Mikael Granlundin alkukauden tilastot. Ennen 27.10. pelattua kierrosta HIFK oli tehnyt yhteensä 52 maalia ja sen maaleilla oli ollut myös 80 syöttäjää.

Yksittäisen maalin arvo lasketaan kaavalla (tehdyt maalit x 1,5) / (syötöt + (tehdyt maalit x 1,5)). HIFK:n tapauksessa kaava on siis (52 x 1,5) / (80 + (52 x 1,5)), ja tulos on 0,49. Yksittäisen syöttöpisteen arvo lasketaan jakamalla yksittäisen maalin arvo 1,5:llä. HIFK:lla laskutoimitus on 0,49/1,5 ja tulos 0,33.

Granlundin TOC voidaan laske näiden arvojen, peliminuuttien ja OTV-kertoimen (0,75) avulla. On myös laskettava joukkueen maalin ja syötön arvojen tapaan samalla kaavalla hyökkääjien tekemien maalien ja syöttöjen arvo, HIFK:lla maaleissa 4,62 ja syötöissä 2,94. Lisäksi hyökkääjän tapauksessa mukaan otetaan yksittäisten hyökkääjien tekemien maalien ja syöttöjen määrä, HIFK:lla 6 ja 14. Varsinainen kaava on pitkä:

TOCf = (yksittäisten hyökkääjien maalit x yksittäisten hyökkääjien maalien arvo + yksittäisten hyökkääjien syötöt x yksittäisten hyökkääjien syöttöjen arvo) / hyökkääjien keskimääräisten peliminuuttien summa * OTV

Granlundin kohdalla laskutoimitus on seuraavanlainen:

TOC = (6 x 4,62 + 14 x 2,94) / 0,69 * 0,75

TOC = 74,869565

TOC = 74,87

Granlundin panos joukkueensa hyökkäyspeliin (OGVT) on siis 74,87, mikä on erittäin korkea verrattuna esimerkiksi NHL:n pistepörssin viime kaudella voittaneen Sedinin 26,20:een. Syynä tähän ovat tietenkin Granlundilta vielä puuttuvat puolustus- ja maalivahtipelin sekä voittomaalikilpailun arvot. Lukema paljastaa kuitenkin sen muutenkin selkeän faktan, että Granlund on ollut joukkueelleen hyökkäyspelissä erittäin arvokas, mikä heijastui aikanaan käytännössä pistepörssin kärkipaikaksi.

Laskutoimituksesta puuttuvia kolmea osa-aluetta ei voida SM-liigassa laskea. SM-liiga ei esimerkiksi erittele peliaikaa eri pelitilanteiden mukaan, tarjoa perustasoa tarkempia tilastoja voittomaalikilpailuista, tai tarjoa aloitustilastoja sekä -prosentteja. Vastaava järjestelmä olisi varmasti sovellettavissa, mutta vaatii huomattavan määrän työtä ja GVT-menetelmääkin enemmän kompromisseja.


SM-liigatilastot mahdollistavat vain ilmiselvyyden selvittämisen - Granlund on HIFK:n hyökkäyspelissä äärimmäisen tehokas.
Tomi Hänninen - http://www.chilipictures.fi

NHLE mittaa potentiaalia pistetehtailuun

Eräs Gabriel Desjardinsin kehittelemistä laskukaavoista mittaa pelaajien potentiaalia tehdä pisteitä NHL:ssä hyödyntämällä laajempaa tietopankkia sarjojen välisistä tasoeroista.

NHL Equivalence -tilaston perustana on pelaaja, joka pelaa yhden kauden esimerkiksi AHL:ssä ja seuraavan NHL:ssä. Näiden kahden kauden pistekeskiarvoja verrataan keskenään ja kun otantaan lisätään useampi ensimmäisenä vuonna AHL:ää ja seuraavana NHL:ää pelanneen pelaajan tilastot, saadaan satojen kiekkoilijoiden pistekeskiarvojen muutoksista kuva AHL:n ja NHL:n välisestä taso-erosta.

Koko prosessin tavoitteena on selvittää, millaisilla tehoilla vaikkapa SM-liigasta NHL:ään siirtyvä pelaaja kykenee kiekkoilemaan. Laskukaavalla saadan selville yhden SM-liigapisteen arvo NHL-pisteeseen verrattuna. Laskutoimituksen tulos on kerroin, jolla ratkaistaan erot eri sarjojen ottelumäärissä.

Esimerkiksi SM-liigan taso verrattuna NHL:ään lasketaan Desjardensin luomassa kaavassa jakamalla SM-liigasta NHL:ään siirtyneen pelaajan ensimmäisen NHL-kauden pistekeskiarvo siirtoa edeltäneen SM-liigakauden keskiarvolla. Tekemällä laskun usealle eri sarjalle, voidaan määritellä niiden laatujärjestys. Desjardsins laski Venäjän pääsarjan Euroopan kovatasoisimmaksi liigaksi. Yksi Venäjän pääsarjassa tehty tehopiste vastaa Desjardinsin mukaan 0,91:aa NHL-pistettä. Sen perässä tulevat Tšekin Extraliga (0,61), Elitserien (0,59) ja SM-liiga (0,54) ennen farmisarja AHL:ää (0,45).

GVT:n tapaan NHLE-tilaston esimerkkinä voidaan käyttää Mikael Granlundia. Granlundilla oli runkosarjan päättyessä koossa 20 maalia, 31 syöttöä, 51 tehopistettä. Näiden lukemien lisäksi tarvitaan SM-liigan kerrointa (0,54). Yksi Granlundin SM-liigassa tekemä pistemäärä kerrotaan siten 0,54:llä, jolloin selviää Granlundin potentiaalinen NHL-maalien ja -syöttöjen määrä.. Myös maalien ja syöttöjen määrä voidaan kertoa 0,54:llä ja selvittää tarkempi pistearvio:

NHLE G = 20 x 0,54 = 10,80

NHLE A = 31 x 0,54 = 16,74

NHLE P = 51 x 0,54 = 27,54

Tämän kauden tahdillaan Granlundilla olisi siis potentiaalia tehdä SM-liigasta NHL:ään siirtyessään tehot 11+17=28. Joidenkin pelaajien kohdalla arvio voi heittää, sillä he eivät pelaa NHL:ssä samoja minuuttimääriä ja esimerkiksi ylivoimaa kuin aiemmassa joukkueessaan.

NHLE:n pätevyydestä todisteita ovat esimerkiksi Steven Stamkosin, Patrick Kanen ja Drew Doughtyn tehot. Stamkos teki viimeisellä OHL-kaudellaan (2007–2008) tehot 58+47=105. Hänen NHLE-arvonsa ennusti Stamkosin ensimmäiselle NHL-kaudella tehoja 23+19=42 ja kanadalainen iskikin 46 (23+23) pistettä.

Kanen potentiaaliksi laskettiin NHLE:n avulla tehot 26+36=62 ja oikeasti Kane merkkautti kymmenen pistettä enemmän (21+51=72). Doughtylle ennustettiin 29:a (6+23) pistettä ja Doughty iski oikeasti tehot 6+21=27.


Drew Doughty on esimerkki NHLE:n tarkkuudesta.

Kiistelty Corsi

Jääkiekon nykyisen tilastoinnin merkittävänä ongelmakohtana pidetään tehotilastoa, johon merkitään miten monta maalia joukkue on tehnyt ja päästänyt viidellä viittä vastaan pelaajan ollessa jäällä. Kritiikki kohdistuu nimenomaan tilaston luonteeseen ja sen vääristyneisyyttä perustellaan liiallisella "yhteisöllisyydellä" ja yleistyksellä. Ykkösketjussa joukkueen kärkipelaajien kanssa pelaavan tehotilasto on useimmiten, ymmärrettävistä syistä, parempi kuin nelosketjun jyrän.

Tehotilastolle on esitelty lukuisia epävirallisia korvikkeita, joista yksi on noussut erityiselle jalustalle. Buffalo Sabresin maalivahtivalmentaja Jim Corsi alkoi laskea, miten monta kertaa oma ja vastajoukkue laukovat tietyn pelaajan tai ketjun ollessa jäällä. Corsin kehitti menetelmän mitatakseen maalivahtien työmäärää, jotta voisi soveltaa tuloksia maalivahtivalmennuksessa.

Corsi-menetelmä ei laske vain maalivahtien torjumia laukauksia, vaan kaikkia maalia kohti suunnattuja laukauksia, mukaan lukien maalin ohi menneet tai kenttäpelaajien torjumat vedot. Varsinainen Corsi-lukema on oman ja vastajoukkueen laukausten erotus. Jos joukkue A ampuu 50 kertaa ja joukkue B 40 kertaa, on joukkueen A lukema +10. Samaa menetelmää voidaan soveltaa koko joukkueen lisäksi yksittäisiin ketjuihin tai pelaajiin.

Corsin itsessään kerrotaan kuvaavan pelaajan, ketjun tai joukkueen kykyä perustuen kiekonhallintaan. Corsi-menetelmän perusolettama on, että jos joukkue laukoo enemmän kuin vastustajansa, se pitää silloin kiekkoa enemmän hallussaan ja peli painottuu hyökkäyspäätyyn. Myös Corsi-menetelmää on kritisoitu, sillä esimerkiksi erittäin puolustavassa roolissa pelaavan keskushyökkääjän lukema on todennäköisesti erilainen kuin ykkösketjun hyökkäävän pelaajan.

Tämän vuoksi tilastoa on viety vieläkin eteenpäin. Tuloksena on uusia mittareita: "suhteellinen Corsi-lukema" (Relative Corsi) ja siihen perustuva "kilpailun taso" (Quality of On-Ice Competition) on luotu kuvastamaan pelaajan kohtaamien vastapelaajien tasoa. Kilpailun laadun vastapainona huomioidaan myös omien joukkue- sekä ketjutovereiden taso (Quality of On-Ice Teammates. Niiden tarkoitus on antaa tasoitusta pelaajille, jotka tulevat useammin jäälle oman kenttäpäädyn aloituksissa ja kohtaavat vastapuolen kärkiketjuja. Tavoitteena on selventää, suorittaako pelaaja hyvin kovempaa kilpailua vastaan, kuin yleisesti koko vastajoukkuetta vastaan.

Myös koko Corsi-menetelmälle on olemassa vaihtoehto, Fenwick, joka jättää kenttäpelaajien torjumat laukaukset huomioimatta. Syynä tähän on laukausten torjumisen pitäminen taitona. Miksi pelaajan A pitäisi saada tilastoonsa positiivinen merkintä pelaajan B torjuttua laukauksen käyttämällä omaa yksilötaitoaan?

Kukla's Korner -kiekkoblogi vertaili menetelmiä NHL-kauden 2008–2009 tuloksiin ja totesi, että Corsi-lukeman suhde joukkueen keräämiin sarjapisteisiin oli 62,60 prosenttia, kun taas Fenwick-lukeman suhde sarjapisteiden määrään oli 60,20%.

Tutkimustuloksen mukaan Corsi-menetelmä olisi siis luotettavampi ja joukkueen Corsi-lukeman suuruus heijastuu kyseisen joukkueiden pistesaldoon yli 62:n prosentin tarkkuudella. Todellisuudessa molemmissa menetelmissä on puutteensa ja niiden luotettavuudesta kiisteleminen kuvastaa tilastoanalyysiä ja sen tilaa kokonaisuutena.

Lue myös: Moneypuck – tilastoanalyysi tulee

Lähteet: Puck Prospectus, Kukla's Korner, Behind the Net, Oilers Nation

» Lähetä palautetta toimitukselle