Dziś przedstawię Wam historię o dociekliwości jednego z czytelników NFL Blog. Dzięki swojemu śledztwu wykrył, że w oficjalnych statystykach na stronie NFL.com są błędy, które mają zostać poprawione po jego zgłoszeniu. I tak polski fan futbolu ma wpływ na to, co dzieje się w najlepszej lidze świata.
Marek Gołębiewski pochodzi z Łodzi, ale obecnie mieszka i pracuje w Edynburgu. Futbolem amerykańskim interesuje się od kilku miesięcy. Kilka dni temu napisał do mnie z pytaniem odnośnie wyliczania Net Punting Average. Wskaźnik ten to jeden z najpopularniejszych parametrów pozwalający określać jak gra cała ekipa od puntów, zarówno punter jak i zawodnicy broniący akcje powrotne. W pewnym uproszczeniu jest to wyliczane ze wzoru:
[długość puntów] – [długość akcji powrotnych] / [liczba puntów w meczu]
To było oczywiste tak dla mnie, jak dla Marka. Pojawiła się jednak wątpliwość: co się dzieje, kiedy punt jest zablokowany?
Nie jest to zbyt częste wydarzenie. W tym roku w NFL zablokowano tylko 21 puntów. Jak jednak wtedy liczyć Net Punting Average? Szczerze mówiąc nie miałem pojęcia, ale Marek postanowił dokopać się prawdy. Założył, że jeśli punt jest zablokowany i drużyna blokująca wykona z nim akcję powrotną, to do wyliczenia wskaźnika będzie się on liczył jako ujemna wartość o odpowiedniej ilości jardów. Przeanalizował cztery tegoroczne sytuacje, a jego wyliczenia możecie zobaczyć poniżej zaznaczone na niebiesko. Kolorem czerwonym zaznaczone są oficjalne statystyki meczowe z NFL.com.
Jak widzicie, wartości te dość znacznie odbiegały od oficjalnych, choć już wskaźnik „Punts Average” pokazujący średnią długość puntu bez akcji powrotnej zgadzał się z oficjalnym. Marek postanowił zwrócić się po pomoc do specjalisty. Wkrótce napisał do mnie z rozwiązaniem tego problemu:
„Po kilkudniowej korespondencji mailowej z Chrisem Hoeltgem (główny programista i zarządca bazy danych statystyk dla NFL), który jest odpowiedzialny za statystyki na stronie oficjalnej NFL.com okazało się, iż na stronie są błędy w tych statystykach. Podane na stronie wartości „Net Punting Average” są błędne. Przesłał mi Gamebooki meczów (oficjalne raporty poszczególnych meczów) które policzyłem wcześniej i okazało się że we wszystkich Gamebookach wartości „Net Punting Average” są inne niż te widoczne na stronie NFL.com. Natomiast jak liczyć „Net Punting Average”? Bardzo prosto. Wystarczy za każdy punt który był zablokowany podstawić do równania „0”, a nie minusową wartość jardów (tak jak to wcześniej robiliśmy). Dokładnie tak samo jak to się robi przy wyliczaniu statystyki „Punt Average Yards”.”
Jednocześnie Hoeltg zapewnił, że wartości na stronie NFL.com zostaną poprawione na właściwe. Tak więc dochodzimy do happy endu w iście amerykańskim stylu: zwykły kibic z drugiego końca świata znalazł i poprawił błąd, którego nie znalazły sztaby specjalistów zatrudniane przez megakorporację wartą miliardy dolarów. Jaki z tego morał? Znów oddam głos Markowi:
„Nigdy nie można ślepo ufać co jest gdzieś napisane. Zawsze warto samemu jeszcze policzyć a przede wszystkim chyba warto rozumieć skąd dane statystyki się biorą i jak je można samemu policzyć. Ja w ten sposób staram się sprawdzić i zrozumieć każdą statystykę z meczu NFL”
Cóż mogę powiedzieć? Bardzo słuszne podejście, a jeśli chcecie od czegoś zacząć, to polecam mój przewodnik po statystykach dla początkujących.
P.S. Wielkie dzięki dla Marka, który zgodził się na opisanie tej historii na blogu 🙂