ŠTO SU STATISTIKE I ANALIZE?


STATISTIKE I ANALIZE


                Što su sportske statistike i analize? Statistike (statistički podaci) nam govore o broju i učestalosti događaja, dok pod analizama podrazumijevamo prikupljanje i obradu podataka koje prikazujemo u statistikama.
                Nakon uvoda koji je više namijenjen osnovnoškolcima nego „ozbiljnim“ sljedbenicima sportskih događaja, nemojmo steći krivi dojam; analize i statistike nisu tako jednostavne kao što se čine na prvi pogled! Zašto? Da ne ulazimo u matematičke rasprave, primijenjena statistika može nam dati SVE podatke vezane uz određeni sportski događaj, momčad ili ligu, samo što je izuzetno mali broj ljudi upoznat sa njihovim stvarnim mogućnostima. Dokaz? Pokušajte odgovoriti na slijedeća pitanja: u kojim ligama se postiže najviše zgoditaka u prvih 10 minuta susreta? U kojim ligama to najčešće čini domaćin, a u kojima favorit? Ili, koja je momčad najpoznatija po postizanju više zgoditaka u prvom poluvremenu, ili hendikepu +0,25? Ili u kojoj ligi (ili u susretima koje momčadi, svejedno) je prisutan najveći broj zgoditaka u oba poluvremena? Nadalje, koja momčad je najviše „podbacila“ ove sezone u postizanju više od 1 zgoditka u prvom poluvremenu? Što su to „slične utakmice“ i koja je forma određene momčadi u njima? Ili, koja momčad najčešće završava susret rezultatom 1:1, ili ,ili 1. poluvrijeme 0:2,svejedno? Ako znate odgovore na ova pitanja, nema potrebe za daljnjim čitanjem. U tom slučaju radi se o istinskom poznavatelju. No, pitanja može biti na tisuće, a statistika na SVE njih može pružiti odgovor! Kako?
                Krenimo redom. Za kvalitetne statistike najbitniji su kvalitetni podaci. Prva pomisao nam je: doba je Interneta, i podaci su svima dostupni. Ali… vjerovali ili ne, na Internetu možete naći doslovno svašta! Uzmite, na primjer, podatke o nekoj ligi iz tri različita izvora: službene podatke sa službenih stranica, statističke podatke iz stranice namijenjene statistikama i najpristupačnije statistike – statistike kladionica. Navedeni podaci su manje – više isti, ali postoje sitne razlike (najčešće kao posljedice netočnog upisa) koje mogu unijeti zbrku u programe za analizu i u konačnici rezultirati pogrešnim podacima. Nadalje, postoji više tipova statistika, ovisno o zemlji iz koje liga ili momčad potiče, a da o jezičnoj barijeri ne govorimo. U cijeloj toj zbrci do najkvalitetnijih podataka morate doći sami, istovremeno prateći nekoliko pouzdanih izvora; kvalitetne metode usporedbe registrirat će razlike i uputiti vas u traženje točnog podatka kako bi u konačnici i statistike bile maksimalno pouzdane.
                Nadalje, čemu služe statistike i analize? Samo ime im govori – to su statistički podaci o zbivanjima u nekom sportu. Služe za analizu lige, momčadi ili susreta, a pružaju i mogućnost predviđanja određenih događaja. Iako im je osnovna primjena u zbivanjima vezanim uz klađenje, mogu poslužiti i sportskim analitičarima, sportskim novinarima i sl.
                Mnoštvo ljudi svakodnevno se susreće sa sportskim statistikama, bilo u sportskim vijestima, bilo u kladioničkim glasnicima i slično. No, da li su ljudi svjesni mogućnosti koje im pružaju statistike? Odgovor je: nisu! U načelu statistike su podcijenjene jer nisu dostupne u svom punom obimu, a i baratanje njima unatoč jednostavnosti može biti i te kako zamršeno ili pogrešno. Po drugoj strani, kao najčešći primjer pogrešne upotrebe statističkih podataka spomenimo nezaobilaznu precijenjenost statistika: ako je neki događaj najčešći ne mora značiti da će se i dogoditi u slijedećem kolu! Evo primjera vezanog uz što drugo nego uz kladionice: Internet je prepun kojekakvih „sigurnih ponuda“ i „stručnih analiza“, između ostalog i nagovještaja događaja uz navedeni postotak vjerojatnosti; tako npr. uz neki događaj s koeficijentom 1,50 stoji navedena vjerojatnost od 90%! Ljudi moji, kad bih znao za sigurne događaje sa spomenutim koeficijentom i 90% prolaznosti, za godinu dana bio bih najbogatiji čovjek u državi!
                Unatoč očiglednoj namjeni ovog teksta, ne želim ga povezivati sa klađenjem! Namjera mi je upoznati vas sa analizama i statistikama, kao i sa čitavim spektrom njihovih mogućnosti; primjenu statistika odaberite sami.

OSNOVE SPORTSKIH STATISTIKA


                Krenimo sa kratkim opisom namjenskih sportskih statistika. Statistike ugrubo možemo podijeliti na statistike lige, statistike momčadi (timova, klubova) te na statistike prošlih i budućih susreta (utakmica). Postoje i drugi tipovi statistika kao što su statistike dnevnog rasporeda, statistike kladioničkih ponuda itd.


                Statistike lige ne treba puno opisivati; mogu biti prikazane ili u obliku tablica ili u obliku statističkih podataka i grafikona.  Statistike momčadi (kao i pojedinih igrača) također mogu biti prikazane u obliku statističkih podataka, grafikona i tablica. No, statistike utakmica priča su za sebe. Zašto?
                Svaku utakmicu možemo analizirati na više načina: klasično kao susret domaćin – gost, gdje je naglasak analize na domaćina, zatim favorit – slabija momčad gdje je naglasak analize na favoriziranu („jaču“) momčad i na kraju kao analize momčadi (timova), gdje se analize sagledavaju isključivo s gledišta odabrane momčadi. U većini slučajeva susrećemo se ili sa analizama domaćin – gost, ili sa analizama određene momčadi; analize lige i nama najzanimljivijih favorita gotovo da nigdje nećete naći.
                Što su favoriti? Favoriti su momčadi koje u nekom susretu iz određenih razloga predstavljaju jaču (kvalitetniju) momčad ili momčad s većim (statističkim) šansama za pobjedu. Favoriti su u većini slučajeva zanimljiviji za praćenje nego „slabije“ momčadi. Međutim, da li ste ikada vidjeli statistike neke momčadi u kojima se jasno razabire koliko su puta bile favorit u određenom vremenskom razdoblju, i kakve su joj statistike u navedenim susretima?
                Mala doza početne zbunjenosti nameće nam pitanje: što se sve može analizirati, i kako? I koja je praktična primjena?
                Krenimo od analiza: možemo vrlo precizno analizirati SVE događaje u sportu, počev od ishoda susreta, poluvremena, točnih rezultata, broja zgoditaka, kombiniranih događaja, forme momčadi ili igrača, ukratko sve što je u sportu na bilo koji način vezano uz brojeve, pa čak i više od toga! Granice u statistikama i analizama skoro da i nema! A sad se postavlja drugo pitanje: što su i kavi mogu biti statistički podaci? I kako se s njima služiti?
Već smo spomenuli da statistički podaci mogu biti prikazani u raznim oblicima: tablice, grafikoni, brojčani podaci, opisne analize… Svaka od navedenih grupacija može pak imati neograničen broj varijacija, namjena, oblika… Spomenimo tablice; svi znamo za tablice lige, tablice forme (momčadi i igrača) itd.  Uobičajeno je da tablice prikazuju podatke u „silaznom“ obliku, prema broju određenog događaja od najvećeg prema najmanjem. No, da li znate da se u obliku tablica mogu prikazati statistički podaci SVIH događaja? 
Nećete vjerovati, ali tablice nam mogu prikazati neke podatke na jednostavan, uočljiv i razumljiv način, puno shvatljiviji nego ostali „standardni“ oblici analiza. Razmotrite gornje prikaze tablica; već je na prvi pogled uočljivo koja momčad 4. Škotske lige ostvaruje određeni događaj u tekućoj sezoni. Naravno, tablice mogu prikazati i statistike više sezona, događaja, kombiniranih događaja i slično. Kao takve, mogu nam poslužiti kao odlične smjernice za naše namjere, ali i za stjecanje saznanja o pojedinim događajima, razbijanje predrasuda itd.
Nadalje, statistike mogu biti prikazane numerički, u obliku brojčanih vrijednosti (broja događaja, postotaka…) određenih događaja. Kao takve mogu nam pružiti brojne specifične podatke o pojedinim događajima, momčadima i sl. Naravno, ovaj tip statističkih podataka daleko je precizniji od tablica, ali je nauštrb tome i zahtjevniji; za pravilno korištenje potrebno je određeno predznanje ili edukacija. K tomu valja pridodati da pogrešno tumačenje ove vrste podataka najčešće dovodi do zabluda i krivih (štetnih) zaključaka.

Opisi su naredni tip statističkih podataka; ne smijemo ih miješati sa opisima i analizama npr. budućih susreta „pisanih rukom“! Tekstualni oblik opisne analize sastavlja isključivo program namijenjen za obradu statističkih podataka. Prednost ovog tipa analize su izrazita jasnoća i razumljivost (u slučaju, naravno, da je sastavljena razumljivim jezikom), dok je mana mali broj podataka koji se na ovaj način mogu obraditi. Nadalje, opisne analize su idealne za prikaz kombiniranih i nestandardnih događaja čije bi značenje teško shvatili iz tablica ili numeričkih podataka.
Grafikoni. Iako u suštini predstavljaju jednostavan slikovni prikaz statističkih podataka, za njihovo razumijevanje potrebno je određeno predznanje. Postoje mnogobrojni tipovi grafikona, od jednostavnih stupčastih ili kružnih do vrlo kompliciranih dinamičkih grafikona sa mnogobrojnim prikazima. Grafikoni su kao takvi idealni za usporedbu određenih podataka.


Kombinirani izvještaji su prikazi prethodno navedenih statističkih podataka u zajedničkom – mješovitom obliku. Služe za istodobni prikaz statističkih podataka na više načina, radi lakšeg razumijevanja.





VRSTE I OBLICI STATISTIKA


Da bi lakše razumijevali statistike i analize objasnimo na početku najčešću terminologiju vezanu uz to. Susrete domaćin – gost smo spomenuli; domaćin je ekipa koja igra na domaćem (svojem) terenu, a gost je ekipa koja dolazi u – goste. Analize ovog tipa pružaju nam uvid u odnose snaga i događaje obično u svim susretima lige i služe kao osnova za usporedbu sa drugim oblicima analiza i statistika.
Nadalje, ponovimo i nama zanimljiviju podjelu: favorit – slabija momčad (radi lakšeg snalaženja ovakve analize označavati ćemo riječima favorit – tim 2). Favorit predstavlja jaču (kvalitetniju) momčad, dok je tim 2 slabija momčad. Utakmice favorit – tim 2 analiziraju se isključivo u tom obliku, bez obzira da li je favorit domaćin ili gostujuća momčad! I ovaj tip analize daje nam uvid u stanje neke lige vezano uz određene događaje (ishodi susreta, broj zgoditaka favorita…).
I kao treće spomenimo klasične analize pojedinih momčadi; statistički podaci obuhvaćaju sve susrete određene momčadi u određenom vremenskom razdoblju.
Ostali zanimljivi oblici analiza su: favorit kod kuće – favorit u gostima (daje nam uvid u situaciju favoriziranih momčadi neke lige), zatim odabrana momčad kod kuće – u gostima (prikazuje razlike u susretima odabrane momčadi kad igra kod kuće u odnosu na susrete u gostima), momčad kao favorit – momčad kao tim 2 itd.
Vremenske statistike su analize pojedinih događaja ili momčadi u određenom vremenskom razdoblju. Tako npr. možemo pratiti stanje neke momčadi u proteklih 5 sezona (više od toga je nepotrebno), zatim u tekućoj sezoni (sezoni koja traje), u minuloj (prošloj) sezoni… Nadalje, analize se mogu ograničiti i na broj susreta (zadnjih 5, 10, 20… susreta) iz čega iščitavamo razlike i formu momčadi. Vremenski određene statistike mogu biti i specijalizirane: analize po mjesecima (služi za praćenje forme), po kvartalima, po koracima od 3 ili 5 utakmica itd. Zanimljive su i analize prema danima u tjednu; idealne su za razbijanje mnogih iluzija, ali i za uočavanje pravilnosti koje na standardan način nikada ne bi uočili.
Slijedeća kategorija statistika je jakost. Jakost je pojam vezan uz kvalitetu određene momčadi. Pri određivanju jakosti uzimaju se u obzir kvaliteta i forma igrača, pozicija momčadi na prvenstvenoj tablici, „ponašanje“ momčadi u sličnim susretima, mjestu i vremenu odigravanja susreta itd. Prema jakosti momčadi određuje se i jakost susreta, pa možemo govoriti o analizama „sigurnih“ utakmica u kojima je favorit znatno jači od tima 2, zatim o „normalnim“ utakmicama u kojima je favorit jači od tima 2, ali ta je prednost znatno manja nego u sigurnim utakmicama, i na kraju tu su „jaki susreti“ u kojima favorit ima tek neznatnu prednost nad timom 2 ili favorita susreta uopće nema.
Spomenuo sam „slične“ susrete – za mnoge najvažniji oblik analiza i statistika! Slični susreti uspoređuju predstojeću utakmicu neke momčadi sa proteklim susretima sa sličnim karakteristikama (stupanj favoriziranja određene momčadi, mjesto odigravanja susreta, forma momčadi, pozicija na tablici i razlika u bodovima naspram timu 2, gol razlici…). Slični susreti najteži su oblik analiza, ali statistike ovog tipa utakmica daju nam najbolji i najprecizniji uvid u mogući ishod predstojećeg susreta.
Statistički događaji. Pod statističke događaje spadaju svi događaji koji se zbivaju na određenoj utakmici: ishod susreta, točan rezultat, rezultat na poluvremenima, broj zgoditaka, broj zgoditaka momčadi, korneri, slobodni udarci, minutaža zgoditaka, gol razlike… doslovno sve što možete pretvoriti u brojke možete i analizirati i pretvoriti u korisne statističke podatke! Teško je to dočarati ljudima koji „prave“ statistike nikada vidjeli nisu…
Međutim, što nam statistike pružaju? Koji su to „korisni“ i primjenljivi podaci?
Kao prvo, spomenimo formu. Forma je najčešće prikaz određenog broja posljednjih događaja (pobjeda, neriješenih susreta i poraza). Međutim, forma može pratiti SVE događaje u određenom vremenskom razdoblju, a prikazana u obliku postotaka ili razlike postotaka daje nam puno precizniji uvid u stanje neke momčadi vezano uz analizirani događaj.
Nizovi. Nizovi su interesantni jer nam govore koliko se neki događaj učestalo (zaredom) ponavlja, odnosno koliko susreta zaredom se nije dogodio. Tako imamo pozitivne nizove (broj uzastopnih događaja) i negativne nizove (broj uzastopnih susreta bez događaja). Uspoređujući trenutni niz sa maksimalnim nizom momčadi i cjelokupne lige možemo izračunati vrlo pouzdanu vjerojatnost nekog događaja!
Razlike postotaka i postotne razlike su omjeri između broja događaja u određenom vremenskom razdoblju naspram ukupnog broja događaja (momčadi, sezone, lige…). Postotna razlika je razlika između npr. postotka pobjeda neke momčadi u svim susretima kod kuće i postotka pobjeda u posljednjih 5 susreta kod kuće; iz dobivenog postotka iščitavamo formu (stanje) u određenoj momčadi u posljednje vrijeme, i na osnovu toga možemo potvrditi naša iščekivanja ili ih staviti pod sumnju. Postotna razlika je malo složeniji postupak izračuna postotka i služi za preciznije određivanje gore navedenih elemenata.
Vjerojatnosti. Vjerojatnosti su matematički izračuni vezani uz postotnu razliku, izračun forme, nizova i ostalih kriterija. Postoje pozitivne i negativne vjerojatnosti (vjerojatnosti iščekivanja); pozitivna vjerojatnost je vezana uz nastavak određenog slijeda događaja, dok je negativna vezana uz očekivani prekid tog slijeda.
Izvještaji. Za prikaz izračunatih statističkih podataka postoje različiti izvještaji koji mogu biti elementarni (osnovni podaci o nekom susretu ili momčadi) do temeljitih i preciznih (od nekoliko stranica vezanih samo uz analize pojedine momčadi ili pojedinog budućeg susreta).
Postoji još mnogo pojmova vezanih uz statistike i analize. Želio sam vam prikazati samo neke od njih, kako bi stekli uvid u tematiku o kojoj većina ljudi zna vrlo malo ili gotovo ništa. I za kraj, važna napomena: statistike su hladna matematika! One nam daju matematička rješenja koja uz poboljšanje algoritama mogu biti vrlo precizna. Ali, za korištenje statistika u praksi postoji mnoštvo pravila, ali o tome ćemo jednom drugom prilikom!




IZVJEŠTAJI


                Izvještaji služe za prikaz analiza i statističkih podataka u jednostavnom i razumljivom obliku. Služe za korištenje u računalu (PDF) ili za ispis. Izvještaji su tablični, opisni i kombinirani. Količina podataka kreće se od pola stranice po ligi, susretu ili momčadi (osnovni izvještaji) do desetak stranica analiza vezanih uz samo jedan događaj!
                Kakvi moraju biti izvještaji? Pregledni, razumljivi, čitljivi i nadasve jednostavni za rukovanje. Različiti tipovi izvještaja služe za različite potrebe i namjene, kao i za različite profile korisnika. Naravno, profesionalni izvještaji sadrže obilje podataka u kojima bi se laik teško ili nikako snalazio, stoga postoje i jednostavniji ali iscrpni izvještaji namijenjeni i za najveće matematičke neznalice! Kako izgledaju osnovni tipovi izvještaja, prosudite sami: 


Opći opisni izvještaj budućih događaja.

Opći kombinirani izvještaj jedne momčadi ili lige.
Opisni izvještaj.


Kombinirani profesionalni izvještaj.

Potpuni profesionalni izvještaj (oblik za ispis).


Tablični izvještaj.