STATISTIKE I ANALIZE
Što su sportske statistike i analize? Statistike
(statistički podaci) nam govore o broju i učestalosti događaja, dok pod
analizama podrazumijevamo prikupljanje i obradu podataka koje prikazujemo u
statistikama.
Nakon
uvoda koji je više namijenjen osnovnoškolcima nego „ozbiljnim“ sljedbenicima
sportskih događaja, nemojmo steći krivi dojam; analize i statistike nisu tako
jednostavne kao što se čine na prvi pogled! Zašto? Da ne ulazimo u matematičke
rasprave, primijenjena statistika može nam dati SVE podatke vezane uz određeni
sportski događaj, momčad ili ligu, samo što je izuzetno mali broj ljudi upoznat
sa njihovim stvarnim mogućnostima. Dokaz? Pokušajte odgovoriti na slijedeća
pitanja: u kojim ligama se postiže najviše zgoditaka u prvih 10 minuta susreta?
U kojim ligama to najčešće čini domaćin, a u kojima favorit? Ili, koja je
momčad najpoznatija po postizanju više zgoditaka u prvom poluvremenu, ili
hendikepu +0,25? Ili u kojoj ligi (ili u susretima koje momčadi, svejedno) je
prisutan najveći broj zgoditaka u oba poluvremena? Nadalje, koja momčad je
najviše „podbacila“ ove sezone u postizanju više od 1 zgoditka u prvom
poluvremenu? Što su to „slične utakmice“ i koja je forma određene momčadi u
njima? Ili, koja momčad najčešće završava susret rezultatom 1:1, ili ,ili 1.
poluvrijeme 0:2,svejedno? Ako znate odgovore na ova pitanja, nema potrebe za
daljnjim čitanjem. U tom slučaju radi se o istinskom poznavatelju. No, pitanja
može biti na tisuće, a statistika na SVE njih može pružiti odgovor! Kako?
Krenimo
redom. Za kvalitetne statistike najbitniji su kvalitetni podaci. Prva pomisao
nam je: doba je Interneta, i podaci su svima dostupni. Ali… vjerovali ili ne,
na Internetu možete naći doslovno svašta! Uzmite, na primjer, podatke o nekoj
ligi iz tri različita izvora: službene podatke sa službenih stranica,
statističke podatke iz stranice namijenjene statistikama i najpristupačnije
statistike – statistike kladionica. Navedeni podaci su manje – više isti, ali
postoje sitne razlike (najčešće kao posljedice netočnog upisa) koje mogu
unijeti zbrku u programe za analizu i u konačnici rezultirati pogrešnim
podacima. Nadalje, postoji više tipova statistika, ovisno o zemlji iz koje liga
ili momčad potiče, a da o jezičnoj barijeri ne govorimo. U cijeloj toj zbrci do
najkvalitetnijih podataka morate doći sami, istovremeno prateći nekoliko
pouzdanih izvora; kvalitetne metode usporedbe registrirat će razlike i uputiti
vas u traženje točnog podatka kako bi u konačnici i statistike bile maksimalno
pouzdane.
Nadalje,
čemu služe statistike i analize? Samo ime im govori – to su statistički podaci
o zbivanjima u nekom sportu. Služe za analizu lige, momčadi ili susreta, a
pružaju i mogućnost predviđanja određenih događaja. Iako im je osnovna primjena
u zbivanjima vezanim uz klađenje, mogu poslužiti i sportskim analitičarima,
sportskim novinarima i sl.
Mnoštvo
ljudi svakodnevno se susreće sa sportskim statistikama, bilo u sportskim
vijestima, bilo u kladioničkim glasnicima i slično. No, da li su ljudi svjesni
mogućnosti koje im pružaju statistike? Odgovor je: nisu! U načelu statistike su
podcijenjene jer nisu dostupne u svom punom obimu, a i baratanje njima unatoč
jednostavnosti može biti i te kako zamršeno ili pogrešno. Po drugoj strani, kao
najčešći primjer pogrešne upotrebe statističkih podataka spomenimo nezaobilaznu
precijenjenost statistika: ako je neki događaj najčešći ne mora značiti da će
se i dogoditi u slijedećem kolu! Evo primjera vezanog uz što drugo nego uz
kladionice: Internet je prepun kojekakvih „sigurnih ponuda“ i „stručnih
analiza“, između ostalog i nagovještaja događaja uz navedeni postotak
vjerojatnosti; tako npr. uz neki događaj s koeficijentom 1,50 stoji navedena
vjerojatnost od 90%! Ljudi moji, kad bih znao za sigurne događaje sa spomenutim
koeficijentom i 90% prolaznosti, za godinu dana bio bih najbogatiji čovjek u
državi!
Unatoč
očiglednoj namjeni ovog teksta, ne želim ga povezivati sa klađenjem! Namjera mi
je upoznati vas sa analizama i statistikama, kao i sa čitavim spektrom njihovih
mogućnosti; primjenu statistika odaberite sami.
OSNOVE SPORTSKIH STATISTIKA
Krenimo
sa kratkim opisom namjenskih sportskih statistika. Statistike ugrubo možemo
podijeliti na statistike lige, statistike momčadi (timova, klubova) te na
statistike prošlih i budućih susreta (utakmica). Postoje i drugi tipovi
statistika kao što su statistike dnevnog rasporeda, statistike kladioničkih
ponuda itd.
Statistike lige ne treba puno opisivati; mogu biti prikazane ili u obliku tablica ili u obliku statističkih podataka i grafikona. Statistike momčadi (kao i pojedinih igrača) također mogu biti prikazane u obliku statističkih podataka, grafikona i tablica. No, statistike utakmica priča su za sebe. Zašto?
Svaku
utakmicu možemo analizirati na više načina: klasično kao susret domaćin – gost,
gdje je naglasak analize na domaćina, zatim favorit – slabija momčad gdje je
naglasak analize na favoriziranu („jaču“) momčad i na kraju kao analize momčadi
(timova), gdje se analize sagledavaju isključivo s gledišta odabrane momčadi. U
većini slučajeva susrećemo se ili sa analizama domaćin – gost, ili sa analizama
određene momčadi; analize lige i nama najzanimljivijih favorita gotovo da
nigdje nećete naći.
Što su
favoriti? Favoriti su momčadi koje u nekom susretu iz određenih razloga predstavljaju
jaču (kvalitetniju) momčad ili momčad s većim (statističkim) šansama za
pobjedu. Favoriti su u većini slučajeva zanimljiviji za praćenje nego „slabije“
momčadi. Međutim, da li ste ikada vidjeli statistike neke momčadi u kojima se
jasno razabire koliko su puta bile favorit u određenom vremenskom razdoblju, i
kakve su joj statistike u navedenim susretima?
Mala
doza početne zbunjenosti nameće nam pitanje: što se sve može analizirati, i
kako? I koja je praktična primjena?
Krenimo
od analiza: možemo vrlo precizno analizirati SVE događaje u sportu, počev od
ishoda susreta, poluvremena, točnih rezultata, broja zgoditaka, kombiniranih
događaja, forme momčadi ili igrača, ukratko sve što je u sportu na bilo koji
način vezano uz brojeve, pa čak i više od toga! Granice u statistikama i
analizama skoro da i nema! A sad se postavlja drugo pitanje: što su i kavi mogu
biti statistički podaci? I kako se s njima služiti?
Već smo spomenuli da statistički
podaci mogu biti prikazani u raznim oblicima: tablice, grafikoni, brojčani
podaci, opisne analize… Svaka od navedenih grupacija može pak imati neograničen
broj varijacija, namjena, oblika… Spomenimo tablice; svi znamo za tablice lige,
tablice forme (momčadi i igrača) itd.
Uobičajeno je da tablice prikazuju podatke u „silaznom“ obliku, prema
broju određenog događaja od najvećeg prema najmanjem. No, da li znate da se u
obliku tablica mogu prikazati statistički podaci SVIH događaja?
Nećete vjerovati, ali tablice nam
mogu prikazati neke podatke na jednostavan, uočljiv i razumljiv način, puno
shvatljiviji nego ostali „standardni“ oblici analiza. Razmotrite gornje prikaze tablica; već je
na prvi pogled uočljivo koja momčad 4. Škotske lige ostvaruje određeni događaj
u tekućoj sezoni. Naravno, tablice mogu prikazati i statistike više sezona,
događaja, kombiniranih događaja i slično. Kao takve, mogu nam poslužiti kao
odlične smjernice za naše namjere, ali i za stjecanje saznanja o pojedinim
događajima, razbijanje predrasuda itd.
Opisi su naredni tip statističkih podataka; ne smijemo ih miješati sa opisima i analizama npr. budućih susreta „pisanih rukom“! Tekstualni oblik opisne analize sastavlja isključivo program namijenjen za obradu statističkih podataka. Prednost ovog tipa analize su izrazita jasnoća i razumljivost (u slučaju, naravno, da je sastavljena razumljivim jezikom), dok je mana mali broj podataka koji se na ovaj način mogu obraditi. Nadalje, opisne analize su idealne za prikaz kombiniranih i nestandardnih događaja čije bi značenje teško shvatili iz tablica ili numeričkih podataka.
Grafikoni. Iako u suštini
predstavljaju jednostavan slikovni prikaz statističkih podataka, za njihovo
razumijevanje potrebno je određeno predznanje. Postoje mnogobrojni tipovi
grafikona, od jednostavnih stupčastih ili kružnih do vrlo kompliciranih
dinamičkih grafikona sa mnogobrojnim prikazima. Grafikoni su kao takvi idealni
za usporedbu određenih podataka.
Kombinirani izvještaji su prikazi prethodno navedenih statističkih podataka u zajedničkom – mješovitom obliku. Služe za istodobni prikaz statističkih podataka na više načina, radi lakšeg razumijevanja.
VRSTE I OBLICI STATISTIKA
Da bi lakše razumijevali
statistike i analize objasnimo na početku najčešću terminologiju vezanu uz to.
Susrete domaćin – gost smo spomenuli; domaćin je ekipa koja igra na domaćem
(svojem) terenu, a gost je ekipa koja dolazi u – goste. Analize ovog tipa
pružaju nam uvid u odnose snaga i događaje obično u svim susretima lige i služe
kao osnova za usporedbu sa drugim oblicima analiza i statistika.
Nadalje, ponovimo i nama zanimljiviju
podjelu: favorit – slabija momčad (radi lakšeg snalaženja ovakve analize
označavati ćemo riječima favorit – tim 2). Favorit predstavlja jaču
(kvalitetniju) momčad, dok je tim 2 slabija momčad. Utakmice favorit – tim 2
analiziraju se isključivo u tom obliku, bez obzira da li je favorit domaćin ili
gostujuća momčad! I ovaj tip analize daje nam uvid u stanje neke lige vezano uz
određene događaje (ishodi susreta, broj zgoditaka favorita…).
I kao treće spomenimo klasične
analize pojedinih momčadi; statistički podaci obuhvaćaju sve susrete određene
momčadi u određenom vremenskom razdoblju.
Ostali zanimljivi oblici analiza
su: favorit kod kuće – favorit u gostima (daje nam uvid u situaciju
favoriziranih momčadi neke lige), zatim odabrana momčad kod kuće – u gostima
(prikazuje razlike u susretima odabrane momčadi kad igra kod kuće u odnosu na
susrete u gostima), momčad kao favorit – momčad kao tim 2 itd.
Vremenske statistike su analize
pojedinih događaja ili momčadi u određenom vremenskom razdoblju. Tako npr.
možemo pratiti stanje neke momčadi u proteklih 5 sezona (više od toga je
nepotrebno), zatim u tekućoj sezoni (sezoni koja traje), u minuloj (prošloj)
sezoni… Nadalje, analize se mogu ograničiti i na broj susreta (zadnjih 5, 10,
20… susreta) iz čega iščitavamo razlike i formu momčadi. Vremenski određene
statistike mogu biti i specijalizirane: analize po mjesecima (služi za praćenje
forme), po kvartalima, po koracima od 3 ili 5 utakmica itd. Zanimljive su i
analize prema danima u tjednu; idealne su za razbijanje mnogih iluzija, ali i
za uočavanje pravilnosti koje na standardan način nikada ne bi uočili.
Slijedeća kategorija statistika
je jakost. Jakost je pojam vezan uz kvalitetu određene momčadi. Pri određivanju
jakosti uzimaju se u obzir kvaliteta i forma igrača, pozicija momčadi na
prvenstvenoj tablici, „ponašanje“ momčadi u sličnim susretima, mjestu i vremenu
odigravanja susreta itd. Prema jakosti momčadi određuje se i jakost susreta, pa
možemo govoriti o analizama „sigurnih“ utakmica u kojima je favorit znatno jači
od tima 2, zatim o „normalnim“ utakmicama u kojima je favorit jači od tima 2,
ali ta je prednost znatno manja nego u sigurnim utakmicama, i na kraju tu su
„jaki susreti“ u kojima favorit ima tek neznatnu prednost nad timom 2 ili favorita
susreta uopće nema.
Spomenuo sam „slične“ susrete –
za mnoge najvažniji oblik analiza i statistika! Slični susreti uspoređuju
predstojeću utakmicu neke momčadi sa proteklim susretima sa sličnim
karakteristikama (stupanj favoriziranja određene momčadi, mjesto odigravanja
susreta, forma momčadi, pozicija na tablici i razlika u bodovima naspram timu
2, gol razlici…). Slični susreti najteži su oblik analiza, ali statistike ovog
tipa utakmica daju nam najbolji i najprecizniji uvid u mogući ishod predstojećeg
susreta.
Statistički događaji. Pod
statističke događaje spadaju svi događaji koji se zbivaju na određenoj
utakmici: ishod susreta, točan rezultat, rezultat na poluvremenima, broj
zgoditaka, broj zgoditaka momčadi, korneri, slobodni udarci, minutaža zgoditaka,
gol razlike… doslovno sve što možete pretvoriti u brojke možete i analizirati i
pretvoriti u korisne statističke podatke! Teško je to dočarati ljudima koji
„prave“ statistike nikada vidjeli nisu…
Međutim, što nam statistike
pružaju? Koji su to „korisni“ i primjenljivi podaci?
Kao prvo, spomenimo formu. Forma
je najčešće prikaz određenog broja posljednjih događaja (pobjeda, neriješenih
susreta i poraza). Međutim, forma može pratiti SVE događaje u određenom
vremenskom razdoblju, a prikazana u obliku postotaka ili razlike postotaka daje
nam puno precizniji uvid u stanje neke momčadi vezano uz analizirani događaj.
Nizovi. Nizovi su interesantni
jer nam govore koliko se neki događaj učestalo (zaredom) ponavlja, odnosno
koliko susreta zaredom se nije dogodio. Tako imamo pozitivne nizove (broj
uzastopnih događaja) i negativne nizove (broj uzastopnih susreta bez događaja).
Uspoređujući trenutni niz sa maksimalnim nizom momčadi i cjelokupne lige možemo
izračunati vrlo pouzdanu vjerojatnost nekog događaja!
Razlike postotaka i postotne
razlike su omjeri između broja događaja u određenom vremenskom razdoblju
naspram ukupnog broja događaja (momčadi, sezone, lige…). Postotna razlika je
razlika između npr. postotka pobjeda neke momčadi u svim susretima kod kuće i
postotka pobjeda u posljednjih 5 susreta kod kuće; iz dobivenog postotka
iščitavamo formu (stanje) u određenoj momčadi u posljednje vrijeme, i na osnovu
toga možemo potvrditi naša iščekivanja ili ih staviti pod sumnju. Postotna
razlika je malo složeniji postupak izračuna postotka i služi za preciznije
određivanje gore navedenih elemenata.
Vjerojatnosti. Vjerojatnosti su
matematički izračuni vezani uz postotnu razliku, izračun forme, nizova i
ostalih kriterija. Postoje pozitivne i negativne vjerojatnosti (vjerojatnosti
iščekivanja); pozitivna vjerojatnost je vezana uz nastavak određenog slijeda
događaja, dok je negativna vezana uz očekivani prekid tog slijeda.
Izvještaji. Za prikaz izračunatih
statističkih podataka postoje različiti izvještaji koji mogu biti elementarni
(osnovni podaci o nekom susretu ili momčadi) do temeljitih i preciznih (od
nekoliko stranica vezanih samo uz analize pojedine momčadi ili pojedinog
budućeg susreta).
Postoji još mnogo pojmova vezanih
uz statistike i analize. Želio sam vam prikazati samo neke od njih, kako bi
stekli uvid u tematiku o kojoj većina ljudi zna vrlo malo ili gotovo ništa. I
za kraj, važna napomena: statistike su hladna matematika! One nam daju
matematička rješenja koja uz poboljšanje algoritama mogu biti vrlo precizna.
Ali, za korištenje statistika u praksi postoji mnoštvo pravila, ali o tome ćemo
jednom drugom prilikom!
IZVJEŠTAJI
Izvještaji
služe za prikaz analiza i statističkih podataka u jednostavnom i razumljivom
obliku. Služe za korištenje u računalu (PDF) ili za ispis. Izvještaji su
tablični, opisni i kombinirani. Količina podataka kreće se od pola stranice po
ligi, susretu ili momčadi (osnovni izvještaji) do desetak stranica analiza
vezanih uz samo jedan događaj!
Kakvi moraju
biti izvještaji? Pregledni, razumljivi, čitljivi i nadasve jednostavni za
rukovanje. Različiti tipovi izvještaja služe za različite potrebe i namjene,
kao i za različite profile korisnika. Naravno, profesionalni izvještaji sadrže
obilje podataka u kojima bi se laik teško ili nikako snalazio, stoga postoje i
jednostavniji ali iscrpni izvještaji namijenjeni i za najveće matematičke
neznalice! Kako izgledaju osnovni tipovi izvještaja, prosudite sami:
Opći opisni izvještaj budućih događaja.
Opći kombinirani izvještaj jedne momčadi ili lige.
Opisni izvještaj.
Kombinirani profesionalni izvještaj.
Potpuni profesionalni izvještaj (oblik za ispis).
Tablični izvještaj.