Going Deep: The Relationship Between Whiffs and Ks
W maju ubiegłego roku, Dave Cherman z Pitcher List napisał artykuł, który służy jako lektura obowiązkowa dla każdego, kto chce zrozumieć podstawy metryk dyscypliny płytowej hittera. Wśród wielu interesujących ciekawostek i wniosków, które Dave odkrył, najbardziej istotnym było to, że wskaźnik kontaktu trafiającego jest najlepszym statystycznym predyktorem jego strikeout rate.
Zmiany w wskaźniku kontaktu i jego odwrotności (whiffs / swings) wyjaśniają około 83% odchyleń w strikeout rate dla trafiających. W rezultacie, analitycy skupiają się na krótkoterminowych zmianach wskaźnika whiff rate jako wskaźnika obecnych lub przyszłych zmian w strikeout rate. Co więcej, skupiają się na ogólnym poziomie współczynnika strikeout gracza w stosunku do jego współczynnika whiff, prognozując regresję do tego ostatniego, jeśli współczynnik strikeout jest zbyt wysoki lub zbyt niski.
Ten typ analizy działa przez większość czasu. Jednakże, jak zauważył Dave, związek pomiędzy kontaktem a strikeoutami nie jest idealny. Duża część zawodników odbiega od normy, przekraczając lub zaniżając przewidywany przez Whiff współczynnik strikeoutów. W tym artykule zajmiemy się tymi zawodnikami i tym, co napędza te odchylenia.
Tło
Powtarzając ustalenia Dave’a: Contact rate, lub jego odwrotność whiff rate, jest top dog jeśli chodzi o przewidywanie strikeout rate. W próbce 204 graczy, którzy przekroczyli 1000 występów na boisku i 2000 wymachów w latach 2016-2018, współczynnik R2 pomiędzy whiff rate a strikeout rate wyniósł solidne 0,83 (wartości bliższe 1,00 wskazują na silny związek). Ta linia najlepszego dopasowania ma nachylenie około 0,87, co oznacza, że dla 1,00% wzrostu wskaźnika whiff, strikeout rate ma wzrosnąć o około 0,87%.
Przypisanie tego do pamięci jest ważne. Często analitycy odnoszą się do ruchów w swinging strike rate lub outside swing rate jako wskazówek, że zmieniła się podstawowa dyscyplina uderzenia w płytę. Podczas gdy te metryki mają wartość i być może są lepsze w wyjaśnianiu statystyk takich jak współczynnik spacerów, są one gorsze, jeśli chodzi o przewidywanie współczynnika strikeout. Na przykład, R2 dla wskaźnika uderzeń swingujących i wskaźnika strikeout wynosi 0.62, co wskazuje na korelację znacznie niższą niż w przypadku wskaźnika whiff, podczas gdy nie ma wyraźnego związku między wskaźnikiem swingów zewnętrznych a wskaźnikiem strikeout.
Ale podczas gdy wskaźnik whiff jest silnym prekursorem wskaźnika strikeout, jego moc predykcyjna nie dotyczy wszystkich graczy. Zwróć uwagę na kropki znajdujące się znacznie powyżej lub poniżej linii trendu na wykresie. Te powyżej, wyróżnione przez Wila Myersa, Trevora Story’ego i Chrisa Davisa, to zawodnicy, którzy wybijają więcej niż wskazywałby na to ich współczynnik zbiórek. Ci poniżej, wyróżnieni przez Maikela Franco, Adama Jonesa i Avisaila Garcię, wybijają mniej niż się spodziewano (Zauważ, że przewidywany współczynnik wybić został określony przez wstawienie współczynnika whiffów gracza jako zmiennej x we wzorze y = 0.8662x – 0.0014 znajdującym się na powyższym wykresie).
Zarówno Story jak i Myers są interesującymi przypadkami, ponieważ ich rzeczywiste współczynniki wybić są o ponad 5.0% wyższe niż ich przewidywane poziomy. Inne nazwiska w zakresie podwyższonego współczynnika strikeout to Brett Gardner, Miguel Sano, Logan Forsythe, i Tommy Pham.
Franco, Jones, i Garcia dołączają do Carlosa Gonzaleza, Brandona Phillipsa, Huntera Pence’a, Didi Gregoriusa, i Nelsona Cruza jako gracze zdolni do przekroczenia swoich tendencji do odrzutów, często o 4.0% do 5.0%. Dla perspektywy, obniżenie strikeout rate o 4.5% dodaje dodatkowe 30 piłek w grze lub szans na spacer dla gracza w sezonie.
Swing Away, Avisail
Pierwszym krokiem w ocenie, dlaczego te różnice istnieją, jest zacząć prosto: Zbadaj swing rate gracza, który jest obliczany jako swingi podzielone przez całkowitą liczbę uderzeń.
Dave pokazał w swoim artykule, że swing rate nie wykazuje związku z liczbą strikeoutów. Ale ma znaczący wpływ na to, dlaczego niektórzy gracze przekraczają lub zaniżają swój oczekiwany współczynnik zbiórek. Poniższy wykres porównuje związek pomiędzy swing rate i K Delta, która jest różnicą pomiędzy przewidywanym przez whiff gracza współczynnikiem strikeout a ich rzeczywistym współczynnikiem strikeout.
R2 równe 0.23 pokazuje, że swing rate wyjaśnia znaczną część wariancji w K Delta, a wpływ ten jest niezwykle istotny w skrajnych przypadkach przedstawionych powyżej.
Z 10 graczy z najwyższą K Delta, czterech miało swing rate w piątym percentylu lub niżej, podczas gdy dziewięciu było w 39 percentylu lub niżej. Trevor Story jest jedynym graczem, który wystawił wskaźnik swing powyżej tego poziomu, przychodząc w 62. percentylu. Średni wskaźnik swingu dla tej grupy wyniósł 41,8% – znacznie poniżej średniej MLB wynoszącej 47,0%.
Podobna zależność występuje wśród najniższych graczy K Delta. Czterech z nich znajduje się w 96. percentylu lub wyżej w swing rate. Osiem zaćmiewa 76 percentyl. Jedynymi dwoma graczami, którzy mają przeciętny swing rate, są Pence i Cruz. Średnia stopa huśtawka dla grupy był 52.4%.
Players, które huśtawka więcej posiadają dwie wyraźne zalety w unikaniu strikeouts. Po pierwsze, umieszczają więcej piłek w grze wcześniej w liczbach, co pozwala uniknąć perspektywy dwóch strajków, a następnie strikeoutów. Po drugie, są mniej skłonni do podjęcia wezwania trzeciego strajku.
To niekoniecznie oznacza, że huśtawka więcej jest lepiej. Oznacza to po prostu, że dla danego wskaźnika whiff, wyższy wskaźnik swing powoduje mniej strikeoutów. Podczas gdy jest to dobry wynik, może on być przeciwdziałany przez wiele czynników, włączając w to niższą jakość uderzonej piłki. Zostanie to zbadane w przyszłym poście.
Whiff Diff
Swing rate jest ważny. Ale jest jeszcze jedna podstawowa zmienna, która określa współczynnik strikeout: „whiff diff.”
Whiff diff jest moniką, którą ukułem dla różnicy w whiff rate gracza w różnych stanach liczenia, szczególnie pomiędzy liczeniem 0-0 a liczeniem dwóch uderzeń. Podstawową teorią jest to, że niektórzy gracze mogą stosować bardziej agresywne podejście do swingu we wcześniejszych liczbach, co prowadzi do podwyższonego ogólnego wskaźnika whiffów, ale poprawiają swoje umiejętności kontaktu przy dwóch strike’ach, co jest niezbędnym stanem do zarabiania lub unikania strikeoutów.
Wystarczająco jasne, wydaje się, że tak właśnie jest, z whiff diff pomiędzy 0-0 i dwoma strike’ami wyjaśnia 20% zmienności w K Delta.
Story’ego wskaźnik whiff diff wynoszący 5.8% jest jednym z najwyższych w baseballu, plasując się w niskim czwartym percentylu. Oznacza to, że zdolność Story’ego do nawiązywania kontaktu znacznie się pogarsza przy dwóch strike’ach: cecha, która prawdopodobnie napędza jego wiodącą w lidze K Delta.
Czterech z 10 najlepszych w K Delta plasuje się w ósmym percentylu lub niżej w whiff diff, a ośmiu z 10 plasuje się w 20 lub niżej.
Teraz zaczynamy malować prawdziwy obraz tego, dlaczego większość z tych graczy przekracza swój współczynnik strikeoutów. Jeśli huśtawka mniej, a tym samym umieścić mniej piłki w grze wcześniej w liczbach i wziąć więcej nazwanych trzecich uderzeń, podczas gdy również whiffing więcej z dwóch uderzeń, a następnie ich stawki strikeout będzie wyższa niż oczekiwano.
Myers i szczególnie Napoli są wyjątkami w whiff diff, jednak zauważ, że obaj ci gracze posiadali współczynnik swingu w 24 percentylu lub niższy.
Sześć z najwyższych graczy z deltą K uzyskało wynik w 85 percentylu w whiff diff, podczas gdy tylko jeden gracz uplasował się poniżej 63 percentyla. Oznacza to, że ci gracze znacząco poprawili swój wskaźnik whiffów, gdy licznik osiągnął dwa strike’i.
Szczególnie interesujący jest przypadek Brandona Phillipsa, którego wskaźnik whiffów spadł z 24.8% przy liczniku 0-0 do 15.6% przy dwóch strike’ach, co stanowi ogromny spadek o 9.2%. Pence wykazuje podobny spadek, przechodząc z 33.4% do 25.0%.
Dokładne mechanizmy stojące za tym zjawiskiem są niejasne. Czy ci zawodnicy faktycznie lepiej radzą sobie z dwoma strike’ami niż inni gracze, czy też ich podejście do wczesnego liczenia jest po prostu jawnie agresywne, a ich podejście do dwóch strike’ów bardziej odzwierciedla ich bazowe umiejętności? Są to pytania, które zostaną zbadane w kolejnym artykule.
Recentent Applications
Powyższa analiza wykorzystała dane z lat 2016-18 z minimalnym progiem 1,000 plate appearances i 2,000 swingów. Podczas gdy tego typu solidny zestaw danych jest niezbędny do stworzenia silnych podstaw teoretycznych, wykluczył on również wielu graczy, którzy stali się istotnymi aktywami fantasy w ciągu ostatniego roku. W rezultacie zbadajmy kilka interesujących nazwisk na podstawie ich wyników od początku 2018 roku.
Yoan Moncada, który był nieobecny w zestawie danych z lat 2016-18, ponieważ nie trafił w próg plate appearance, jest blisko czołówki ligi w K Delta od początku 2018 roku. 14. percentyl swing rate Moncady wraz z 26. percentylem whiff diff to idealny eliksir na więcej strikeoutów niż przewidywano.
Phillies slugger Rhys Hoskins, wraz z Dodgers first baseman Max Muncy, są w podobnej łodzi, z mikroskopijnymi wskaźnikami huśtawki, które zmniejszają ich wczesne liczenie piłek w grze i napędzają liczenie do dwóch uderzeń, co skutkuje zwiększoną liczbą strikeoutów w stosunku do whiffów.
Jake Bauers, pomimo ospałego początku swojej kariery MLB, jest ulubieńcem wielu w społeczności analityków. Jego obniżony wskaźnik whiffów może być interpretowany jako oznaka wzrostu na talerzu, ale być może oczekiwania powinny być umiarkowane, biorąc pod uwagę jego niski swing rate i podwyższony whiff diff.
Mets shortstop Amed Rosario posiada jeden z najwyższych sumowanych percentyli swing rate i whiff diff w baseballu na poziomie 178, wskazując, że ma podejście do płyty, aby konsekwentnie przewyższać swój wskaźnik whiff.
Adalberto Mondesi jest ciekawym przypadkiem, łącząc niebotycznie wysoki swing rate z jednym z najwyższych wskaźników whiff diff. Do tej pory udawało mu się utrzymać się na powierzchni z 27% strikeout rate, ale nie zdziwiłbym się, gdyby ten wskaźnik wzrósł, gdyby nie udało mu się poprawić swojego podejścia do rzutów za dwa uderzenia. Javier Baez jest wycięty z tej samej tkaniny, swinguje prawie wszystko i dąży do twardego kontaktu na początku liczenia.
Bryce Harper, jak zauważyłem w moim artykule na temat związku między whiffami i beczkami, handluje swing-and-miss na rzecz twardego kontaktu w ciągu ostatnich kilku sezonów. Na szczęście podejmuje to agresywne podejście wcześniej w countach, z -8,7% whiff diff, który osiada w 93. percentylu.
Przełamanie kontaktu, którego doświadczył Corey Dickerson w 2018 roku, jest dodatkowo wspierane przez jego 100. percentyl swing rate i 94. percentyl whiff diff.
Wnioski
Whiff rate jest głównym motorem napędowym za strikeout rate. Jednakże, whiff rate powinien być postrzegany w połączeniu z wskaźnikiem swingu gracza i metryką whiff diff, aby uzyskać bardziej dokładny obraz ich bazowego wskaźnika strikeout. Zrozumienie tych statystyk jest szczególnie ważne dla młodszych graczy, których współczynnik zbiórek w lidze nie jest jeszcze ustalony. Co więcej, są one przydatne w zrozumieniu, czy krótkoterminowa zmienność w whiff rate lub strikeout rate jest związana z rzeczywistą zmianą podejścia.
Featured Image by Justin Paradis (@FreshMeatComm on Twitter)