Wyobraź sobie, że twoja drużyna zdobywa w akcji 8 jardów. Czy to dobry wynik? Futbol to idealna gra do modelowania matematycznego. Wyraźnie wydzielone odcinki gry (próby), których efekt można łatwo przedstawić liczbowo (zdobyte jardy). A jednak każdy kibic futbolu wie, że jard jardowi nierówny. I tu z pomocą przychodzi koncept oczekiwanych punktów – fundament nowoczesnej analityki futbolowej.
Ten tekst jest częścią serii o analityce futbolowej. Część pierwsza: Futbol amerykański i problem małej próby. Jeśli nie chcesz przegapić kolejnych tekstów, możesz zapisać się na powiadomienia, klikając czerwoną ikonę dzwonka w prawym dolnym rogu ekranu lub na newsletter:
8 jardów. Wynik bardzo dobry w sytuacji 1&10. Wręcz idealny, gdy do pola punktowego pozostało 8 jardów. Ale fatalny w sytuacji 3&10. Już początkujący kibic szybko orientuje się, że same zdobywane jardy nie mówią wiele o tym, czy akcja była „dobra”. Trzeba również uwzględnić kontekst.
Zacznijmy od numeru próby. W pierwszej próbie zdobycie pięciu jardów to niezły efekt. W trzeciej wszystko poza nową pierwszą próbą jest porażką.
Dystans do przejścia. Dwa jardy w sytuacji 2&1 to dobra akcja. W sytuacji 2&10… niekoniecznie.
I wreszcie odległość od pola punktowego. Jednego i drugiego. Kiedy ofensywa zbliża się do pola punktowego rywala, o nowe jardy coraz trudniej i mają coraz większą wartość. Z kolei utrata jardów w okolicy linii środkowej nie jest tak niebezpieczna, jak cofanie się pod własnym endzone.
Ale jak zamknąć to wszystko w jednym wskaźniku? Z pomocą przychodzą oczekiwane punkty.
Zaczęło się od Virgila Greena. Quarterbackiem był marnym. W ciągu siedmiu sezonów zaliczył 30 startów dla trzech różnych drużyn. Ale jako absolwent BYU jako pierwszy policzył punktową wartość każdego miejsca na boisku na podstawie wszystkich akcji z sezonu 1969. Futbol oczywiście od tego czasu nieco się zmienił. Fundamenty pod nowoczesną analitykę położyli Bob Carroll, Pete Palmer i John Thorn, którzy w książce „Hidden Game of Football” wydanej w 1988 r. zaktualizowali i usprawnili model Greena.
W XXI wieku model zaktualizował Brian Burke, który od 2015 r. pracuje dla ESPN, a jego model oczekiwanych punktów posłużył przy opracowaniu wskaźnika Total QBR. Własne modele mają również Pro Football Reference i Football Outsiders. Te modele będą się między sobą nieznacznie różniły, przede wszystkim ze względu na użyty zakres danych, ale o tym za chwilę.
Czym są oczekiwane punkty (EP)?
Każdej sytuacji na boisku możemy przypisać określoną wartość oczekiwanych punktów. Jest ona po prostu średnią z kolejnych punktów zdobytych przez dowolną drużynę, przy czym plus oznacza ofensywę, minus defensywę.
Załóżmy że napotkaliśmy daną sytuację (próba, dystans do przejścia i miejsce na boisku) pięć razy.1 Trzy razy kolejne punkty zdobywała drużyna A – ofensywa (TD, FG, TD – plus 17 pkt.), dwa razy drużyna B – defensywa (FG, TD – minus 10 pkt.). Uwaga „defensywa” w tym wypadku nie oznacza dosłownie punktów obrony, np. po INT return. To mogą być punkty wynikające z puntu drużyny A, po którym drużna B zdobyła punkty w ataku. Czy nawet jeszcze później, po dwóch kolejnych puntach z obu stron. W każdym razie bilans tej sytuacji to plus 7 pkt. Dzieląc przez naszą próbę badawczą (5) otrzymujemy wskaźnik EP dla tej sytuacji na +1,4 pkt.
Dlaczego bierzemy „następne punkty”, a nie po prostu tylko punkty ofensywy? Chodzi o to, by mieć pełny obraz sytuacji. EP pod własnym polem punktowym są negatywne (w zależności od modelu atak wychodzi „na zero” przy 1&10 między własnym 10. a 15. jardem), bo często to przeciwnik po 3&out dostanie świetną pozycję startową i zapunktuje.
Oczekiwane punkty dodane (EPA)
Uzyskanie EP to dopiero wstęp. Mając EP dla każdej pozycji na boisku, możemy obliczyć oczekiwane punkty dodane (EPA) w każdej akcji. EPA to nic innego jak różnica między EP po akcji (lub liczbą zdobytych punktów, jeśli w akcji padły punkty), a EP przed akcją. Wynik dodatni oznacza, że ofensywa poprawiła swoją sytuację, a akcja przyniosła dla niej pozytywny efekt. Wynik ujemny to sukces obrony.
Weźmy może kilka przykładów z ostatniego Super Bowl. Dane pochodzą z serwisu Pro Football Reference.
Najcenniejszą akcję meczu wykonał Patrick Mahomes. Było to pamiętne 44-jadowe podanie do Tyreeka Hilla na 7:13 przed końcem meczu. Chiefs byli w sytuacji 3&15 na własnym 35. jardzie, a ich EP było ujemne (-0,3), czyli to Niners mieli więcej szans na zdobycie kolejnych punktów. Jednak podanie zmieniło ich EP na 4,17 (1&10 na 21. jardzie przeciwnika), co przekłada się na +4,47 EPA (4,17 – (-0,3)).
Za najgorszą akcję meczu również odpowiada Mahomes. Był to przechwyt posłany w ręce Tavariusa Moore’a na 12:05 przed końcem meczu. Z sytuacji 3&6 na 23. jardzie SF (+3,07 EP) zrobiła się piłka dla Niners na ich 20. jardzie (-0,28 EP, wciąż rozpatrujemy akcję z perspektywy KC, z perspektywy SF EP przed akcją będzie +0,28). Daje nam to EPA -3,35 (-0,28 – 3,07).
To jednak nic w porównaniu największym zwrotem akcji w historii Super Bowl i jednym z największych w historii NFL. W Super Bowl XLIII Arizona Cardinals mieli pierwszą próbę na jeden jard od pola punktowego Steelers (EP +6,97). Jednak James Harrison przechwycił podanie Kurta Warnera i wykonał 100-jadowy powrót na TD (EP -7). To oznacza, że przechwyt Harrisona był wart prawie 14 punktów – zamiast niemal pewnego TD dla Cadinals było TD dla Steelers.
EP i EPA pozwalają na wiele ciekawych konkluzji. Na tym wskaźniku opierają się wszystkie kalkulatory czwartych prób, które podpowiadają czy należy kopać na bramkę, puntować czy próbować zdobyć nową pierwszą próbę. 27 z 32 drużyn NFL miało w 2019 r. dodatnie EPA w akcjach podaniowych, ale tylko 10 z 32 w akcjach biegowych (model PFR), a przeciętna akcja biegowa w NFL ma ujemną wartość EPA.
Jednak EP i EPA to nie jest „jeden wskaźnik by wszystkimi rządzić”. Mają swoje wady, o których warto pamiętać.
Po pierwsze EPA mierzy wartość każdej akcji. Tylko tyle i aż tyle. To znaczy m.in. że nie sposób na tej podstawie ocenić pojedynczych zawodników. Ile wkładu w sukces akcji podaniowej miał rozgrywający, ile receiver, a ile blokująca linia? Czy to schemat ofensywny stworzył proste podanie do wolnego zawodnika, czy może QB zmieścił perfekcyjną piłkę w ciasne okno? Tego EPA nam nie powiedzą.
Po drugie pojawia się problem zakresu danych w modelu. Jeśli weźmiemy za mały zakres (np. tylko jeden sezon), możemy się nadziać na nieścisłości wynikające z małej próby, zwłaszcza przy rzadziej występujących sytuacjach. Z drugiej strony ofensywy z roku na rok się poprawiają i EP rośnie (atak ma coraz większe szanse na punkty). Więc jeśli weźmiemy zbyt dużą próbę, to część danych, tych najstarszych, nie przystaje do współczesności.
Po trzecie EPA nie biorą poprawki na wynik i czas pozostały na zegarze. Jeśli mamy 2 sekundy do końca przy dwóch punktach straty i pierwszą próbę na 1 jard od pola punktowego to trzeba kopać, choć EPA byłoby wyższe przy rozegraniu tej akcji normalnie. Także w końcówkach meczów i przy dużej różnicy punktowej między drużynami taktyka zmienia się i wypacza model. Brian Burke z ESPN w swoim modelu odrzuca drugą i czwartą kwartę oraz wszystkie sytuacje, w których jedna drużyna prowadzi wyżej niż 10 punktami. Z kolei w „Hidden Game od Football” znajdziemy wskaźnik WPA (Win Probability Added, dodane prawdopodobieństwo wygranej), który modyfikuje EPA o wynik i czas pozostały do końca meczu.
Jak przy każdym wskaźniku statystycznym, EPA może sprowadzić na manowce, jeśli nie wie się jak jest skonstruowany i co pokazuje. Jednak prawidłowo stosowany należy do absolutnie rewolucyjnych wynalazków w dziedzinie futbolowej analityki.
Zostań mecenasem bloga: