sobota, 28 sierpnia 2010

Ech te statystyki, czyli dlaczego dalej nie możemy zamknąć poprzedniego sezonu

Wiele spraw na głowie sprawiło, że brakowało mi czasu, by trochę poblogować. Jednak nie znaczyło to, że zapomniałem o hokeju. Wręcz przeciwnie. Od prawie miesiąca hokej.net dysponuje praktycznie PEŁNĄ bazą statystyk z minionego sezonu. Dlaczego więc nie pochwaliłem się tym wcześniej?

Bo sprawa jest dużo bardziej skomplikowana, niż się wydaje, a nawet niż mi się wydawało, kiedy pisałem o uzupełnionych statystykach play-off 9-16. Co innego bowiem mieć wprowadzone prawie wszystkie dane (nie ma tylko +/- dla 1. ligi z Etapu I i Grupy C z Etapu II oraz Mistrzostw Świata), a co innego prawidłowo je zinterpretować czy podliczyć.

Z interpretacją walczę od dawna, ale nie zawsze spotykam się ze zrozumieniem twórców systemu i dlatego ciągle jeszcze są z tym problemy. Dodatkowo przy 1. lidze pojawiały się nowe błędy, których ze względu na sposób wprowadzania danych (cały protokół, a nie uzupełnianie relacji live) i ze względu na inne czynniki o których zupełnie nie mam pojęcia, bo nie znam kodu źródłowego systemu nie pojawiały się wcześniej.

Podliczanie przez błędną interpretacje danych, również nie jest pozbawione błędów. Pisząc w czerwcu o postępach radziłem używać statystyk ligowych. Teraz nie poradzę nic, bo sprawa jest dużo bardziej skomplikowana. Okazuje się, że nawet statystyki ligowe nie dla wszystkich są dobrze dodawane.
W efekcie w zależności od tego, gdzie wyświetlacie statystyki (zawodnik, klub, liga) oraz czy używacie filtrów dla danych etapów, otrzymujecie różne osiągnięcia tych samych zawodników.

I tak to niestety wygląda - nowe dane = nowe kłopoty. A są jeszcze stare kłopoty. Pracy jest więc dużo i nie wiadomo kiedy wszystko zadziała jak należy, dlatego nic nie będę obiecywał. Ale zadziałać system kiedyś chyba musi, bo jaki sens ma prowadzenie statystyk i dbanie o ich zgodność z rzeczywistością, jeśli to nie przynosi efektu?

Na szczęście jest jeszcze coś pozytywnego na sam koniec - sprawdzając działanie systemu natknąłem się na kilka błędów w statystykach, które umieściłem na blogu. I tak:
- Mejka dostaje +1 do klasyfikacji +/-,
- Bagiński zagrał mecz więcej, a Parzyszek mecz mniej,
- Galant z Witeckim dostają asystę więcej,
- Parzyszek zdobył jedną bramkę więcej w osłabieniu, a Kotlorz ma więcej o jedną asystę (całkowita suma bramek/asyst zostaje taka sama - zmienia się tylko "kwalifikacja czynu").

Błędów nie było aż tak wiele jak na cały sezon, ale szkoda jednak, że nie udało się ich uniknąć. Teraz już wszystko powinno być dobrze. Mam taką nadzieję :)

5 razy skomentowano :

Anonimowy pisze...

współczesny syzyf

Anonimowy pisze...

W sprawie statystyk to zapraszam do odwiedzenia hockey.pl:-)

HSK pisze...

współczesny syzyf" bez przesady ;p może nasze dzieci dożyją czasów kiedy wszyscy statystycy będą zadowoleni :)

Hockey.pl ma własny sposób interpretowania danych z protokołów - jeszcze niedawno przepisywany był cały protokół, teraz widziałem, że niektóre błędy starają się korygować. Statystyki hokej.net są dobre (bo sam je dodawałem i weryfikowałem ;p), ale niestety nie są liczone jak trzeba.
Jest jeszcze pointstreak, ale ze względu na pośpiech z jakim go wprowadzają, chyba nie wyeliminuje podstawowych błędów, a może ich tylko namnożyć. Ale to temat na inny post :)

Anonimowy pisze...

Jako jeden z klepiących protokoły na hockey.pl też staram się korygować błędy i weryfikować z relacjami tekstowymi i video oraz własnymi zapiskami:-) Jednak wszystkich błędów nie da się wyeliminować:-(

HSK pisze...

Wszystkich nie, ale dzięki temu, że coraz więcej meczy ma skróty na youtubie, przynajmniej część z nich zostaje tylko w PZHL-u ;p

Prześlij komentarz

Spodobało Ci się, masz uwagi, a może zauważyłeś jakiś błąd?
Proszę, zostaw komentarz :)