Going Deep: A Whiffs és Ks közötti kapcsolat
Múlt májusban Dave Cherman, a Pitcher List munkatársa írt egy cikket, amely kötelező olvasmány mindazok számára, akik meg akarják érteni az ütőfegyelmi mérőszámok alapjait. A Dave által feltárt számos érdekes ínyencség és következtetés közül a leglényegesebb az volt, hogy egy ütő kontaktaránya a legjobb statisztikai előrejelzője a strikeout-arányának.
A kontaktarány és annak reciprok whiff-aránya (whiffs / swings) változása nagyjából 83%-ban magyarázza az ütők strikeout-arányának eltéréseit. Ennek eredményeként az elemzők a whiff-ráta rövid távú mozgására összpontosítanak, mint a strikeout-ráta jelenlegi vagy jövőbeli változásainak jelzésére. Ezenkívül egy játékos strikeout-arányának általános szintjére összpontosítanak a whiff-arányához viszonyítva, és az utóbbira való regressziót a prognosztizálják, ha a strikeout-arány túl magas vagy túl alacsony.
Ez a fajta elemzés a legtöbbször működik. Azonban, ahogy Dave okosan rámutatott, a kontakt és a strikeoutok közötti kapcsolat nem tökéletes. A játékosok nagy része eltér a normától, és vagy túl- vagy alulteljesítik a whiff által megjósolt strikeout arányt. Ez a cikk ezeket a játékosokat és az eltérések okait vizsgálja.
Háttér
Megismétlem Dave megállapításait: A kontaktarány, vagy annak reciproka, a whiff-arány, az első számú kutya, amikor a strikeout-arány előrejelzéséről van szó. Egy 204 ütőből álló mintában, amely 2016 és 2018 között meghaladta az 1000 ütésszámot és 2000 leütést, a whiff-ráta és a strikeout-ráta közötti R2 együttható robusztus 0,83 volt (az 1,00-hoz közelebbi értékek erős kapcsolatot jeleznek). Ennek a legjobb illeszkedési egyenesnek a meredeksége körülbelül 0,87, ami azt jelenti, hogy a whiff-ráta 1,00%-os növekedése esetén a strikeout-ráta várhatóan körülbelül 0,87%-kal növekszik.
Az emlékezetben való rögzítés fontos. Az elemzők gyakran hivatkoznak a swinging strike rate vagy a külső swing rate mozgására, mint arra utaló jelekre, hogy az ütő alapvető lemezfegyelme megváltozott. Míg ezeknek a mérőszámoknak van értékük, és talán jobban magyaráznak egy olyan statisztikát, mint a sétaráta, a strikeout-ráta előrejelzésében alulmaradnak. Például a swinging strike rate és a strikeout rate R2 értéke 0,62, ami lényegesen alacsonyabb korrelációt jelez, mint a whiff rate, míg a külső swing rate és a strikeout rate között nincs érzékelhető kapcsolat.
De míg a whiff rate erős előjele a strikeout rate-nek, az előrejelző ereje nem minden játékosra érvényes. Figyeld meg a grafikonon a trendvonal felett vagy alatt jelentősen elhelyezkedő pontokat. A fentiek közül kiemelve Wil Myers, Trevor Story és Chris Davis olyan játékosok, akik többet ütnek ki, mint amennyit a whiff-arányuk sugallna. Az alatta lévők, akiket Maikel Franco, Adam Jones és Avisail Garcia jelöl, a vártnál kevesebbet strikeoutolnak (Megjegyzendő, hogy a megjósolt strikeout-ráta úgy lett meghatározva, hogy a fenti grafikonon található y = 0,8662x – 0,0014 képletben a játékos whiff-arányát x-változóként beillesztették az y = 0,8662x – 0,0014 képletbe).
A Story és Myers is érdekes eset, mivel a tényleges strikeout-ráta több mint 5,0%-kal magasabb, mint az előrejelzett szintjük. További nevek a megemelt strikeout outlier tartományban Brett Gardner, Miguel Sano, Logan Forsythe és Tommy Pham.
Franco, Jones és Garcia mellett Carlos Gonzalez, Brandon Phillips, Hunter Pence, Didi Gregorius és Nelson Cruz is olyan játékosok, akik képesek túlszárnyalni a whiff tendenciájukat, gyakran 4,0-5,0%-kal. Összehasonlításképpen, a strikeout-arány 4,5%-os csökkentése további 30 labdát ad egy ütőnek szezononként.
Swing Away, Avisail
Az első lépés annak értékeléséhez, hogy miért vannak ezek a különbségek, egyszerűnek kell lennie: Vizsgáljuk meg egy játékos lendítési arányát, amelyet úgy számolunk ki, hogy a lendítéseket elosztjuk az összes dobással.
Dave a cikkében kimutatta, hogy a lendítési arány összességében nem mutat összefüggést a strikeout-aránnyal. De jelentős hatással van arra, hogy egyes játékosok miért teljesítik túl vagy alul a várható strikeout rátájukat. Az alábbi grafikon a swing rate és a K Delta közötti kapcsolatot hasonlítja össze, ami a játékos whiff-előrejelzett strikeout rátája és a tényleges strikeout rátája közötti különbség.
Az R2 0.23 azt mutatja, hogy a swing rate a K Delta varianciájának jelentős részét magyarázza, és ez a hatás rendkívül jelentős a fent bemutatott kiugró esetekben.
A 10 legmagasabb K Delta értékű játékos közül négynek a swing rate-je az ötödik percentilisben vagy az alatt volt, míg kilencnek a 39. percentilisben vagy az alatt. Trevor Story az egyetlen játékos, aki ennél magasabb swing rate-t mutatott ki, a 62. percentilisbe került. A csoport átlagos swing rate-je 41,8% volt – jóval az MLB 47,0%-os átlaga alatt.
A legalacsonyabb K delta értékű játékosok között is hasonló összefüggés figyelhető meg. Négyen a 96. percentilisben vagy annál magasabb swing rate-ben helyezkednek el. Nyolcan a 76. percentilt árnyékolják be. Az egyetlen két kimaradó, akik mindketten nagyjából átlagos swing rate-szinttel rendelkeznek, Pence és Cruz. A csoport átlagos swingrátája 52,4% volt.
A többet swingelő játékosok két egyértelmű előnnyel rendelkeznek a strikeoutok elkerülésében. Először is, több labdát tesznek játékba korábban a számolás során, amivel elkerülhető a két strike, majd a strikeoutok kilátásba helyezése. Másodszor, kevésbé hajlamosak elfogadni a megítélt harmadik strike-ot.
Ez nem feltétlenül jelenti azt, hogy jobb, ha többet lendítünk. Egyszerűen azt jelenti, hogy egy adott whiff-arány mellett a magasabb swing-arány kevesebb strikeoutot eredményez. Bár ez egy jó eredmény, ezt számos tényező ellensúlyozhatja, többek között az ütött labda alacsonyabb minősége. Ezt egy későbbi bejegyzésben fogjuk megvizsgálni.
Whiff Diff
A swing rate fontos. De van még egy másik elsődleges változó, amely meghatározza a strikeout arányt:
A “whiff diff.”
A “whiff diff” egy általam kitalált elnevezés a játékos whiff-arányának különbségére a különböző számlálási állapotokban, különösen a 0-0 és a kétütéses számlálások között. A mögöttes elmélet az, hogy bizonyos játékosok agresszívabb swing megközelítést alkalmazhatnak a számlálások korábbi szakaszában, ami megemelkedett általános whiff-arányt eredményez, de javítják a kontaktképességüket két ütésnél, ami a strikeoutok megszerzésének vagy elkerülésének elengedhetetlen állapota.
Hát persze, úgy tűnik, ez a helyzet, a whiff diff a 0-0 és a kétütéses számlálások között a K Delta eltérésének 20%-át magyarázza.
Story 5,8%-os whiff diff aránya az egyik legmagasabb a baseballban, az alacsony negyedik percentilisben helyezkedik el. Ez azt jelenti, hogy Story kontaktképessége jelentősen romlik két ütésnél: ez a tulajdonsága valószínűleg a ligaelső K Delta értékének hátterében áll.
A K Delta mutatóban a top 10-ből négyen a nyolcadik vagy annál alacsonyabb percentilisben vannak a whiff diff-ben, a 10-ből nyolcan pedig a 20. vagy annál alacsonyabb percentilisben.
Most már kezd összeállni a valós kép arról, hogy miért haladja meg a legtöbb játékos a strikeout arányát. Ha kevesebbet lendítenek, és így kevesebb labdát tesznek játékba korábban a számolásban, és több hívott harmadik ütést fogadnak el, miközben többet dobnak két ütésnél, akkor a strikeout-arányuk magasabb lesz a vártnál.
Myers és különösen Napoli a whiff diff kiugró értékei; azonban meg kell jegyezni, hogy mindkét játékos a 24. percentilisben vagy az alatt rendelkezett swingrátával.
A legmagasabb K delta értékkel rendelkező játékosok közül hatan a 85. percentilisbe kerültek whiff diff-ben, míg csak egy játékos került a 63. percentilis alá. Ez azt jelenti, hogy ezeknek a játékosoknak jelentősen javult a whiff-arányuk, amikor a számolás elérte a két strike-ot.
A Brandon Phillips esete különösen érdekes, akinek a whiff-aránya 0-0-s számolásnál 24,8%-ról 15,6%-ra csökkent két strike-nál, ami hatalmas, 9,2%-os csökkenés. Pence hasonló csökkenést mutat, 33,4%-ról 25,0%-ra változott.
A jelenség mögött álló pontos mechanizmusok nem világosak. Ezek a játékosok valóban jobbak két strike-kal, mint a többi játékos, vagy a korai számoláshoz való hozzáállásuk csak nyíltan agresszív, és a két strike-os megközelítésük inkább az alapképességüket tükrözi? Ezeket a kérdéseket egy következő cikkben fogjuk megvizsgálni.
Újabb alkalmazások
A fenti elemzés 2016-18-as adatokat használt fel, 1000 ütés és 2000 leütés minimális küszöbértékkel. Míg ez a fajta robusztus adathalmaz szükséges egy erős elméleti alap megteremtéséhez, számos olyan játékost is kizárt, akik az elmúlt évben váltak releváns fantáziaértékké. Ennek eredményeként tekintsünk át néhány érdekes nevet a 2018 eleje óta mutatott teljesítményük alapján.
Yoan Moncada, aki azért hiányzott a 2016-18-as adathalmazból, mert nem érte el a plate appearance küszöböt, 2018 eleje óta a liga élmezőnyéhez közel áll a K delta tekintetében. Moncada 14. százalékos swing rate-je a 26. százalékos whiff diff mellett tökéletes elixír a vártnál több strikeouthoz.
A Phillies slugger Rhys Hoskins, valamint a Dodgers első baseman Max Muncy hasonló helyzetben vannak, mikroszkopikus swing rate-ekkel, amelyek csökkentik a korai számolású labdáikat a játékban, és két strike-ra vezetik a számolást, ami a whiffekhez képest több strikeoutot eredményez.
Jake Bauers, annak ellenére, hogy az MLB karrierje lassan indult, sokak kedvence az elemzői közösségben. Míg a csökkentett whiff-aránya a fejlődés jeleként értelmezhető a lemezen, de talán a várakozásokat mérsékelni kell az alacsony swing-aránya és a megemelkedett whiff-diff miatt.
A Mets shortstop Amed Rosario rendelkezik az egyik legmagasabb összegzett percentilis swing rate és whiff diff értékkel a baseballban 178-mal, ami azt jelzi, hogy megvan benne a lemez megközelítés, hogy következetesen felülmúlja a whiff rate értékét.
Adalberto Mondesi egy érdekes eset, aki kombinálja az égig érő swing rate-et az egyik legmagasabb whiff diff értékkel. Eddig 27%-os strikeout rátával sikerült talpon maradnia, de nem lennék meglepve, ha ez a mutató felfelé ketyegne, ha nem tud javítani a kétütéses megközelítésén. Javier Baez ugyanebből a ruhából van kivágva, szinte mindenre lendít, és a kemény kontaktra törekszik a számolás elején.
Bryce Harper, ahogy azt a whiffek és a barrels közötti kapcsolatról szóló cikkemben megjegyeztem, az elmúlt néhány szezonban a swing-and-miss-t kemény kontaktra cseréli. Szerencsére ezt az agresszív megközelítést a számlálások korábbi szakaszában alkalmazza, -8,7%-os whiff diff-je a 93. percentilisben helyezkedik el.
A Corey Dickerson által 2018-ban tapasztalt kontakt kitörést tovább erősíti a 100. percentilis swing rate és a 94. percentilis whiff diff-je.
Következtetések
A whiff rate az elsődleges hajtóerő a strikeout rate mögött. A whiffrátát azonban a játékos swingrátájával és whiff diff mérőszámaival együtt kell vizsgálni, hogy pontosabb képet kapjunk az alap strikeout-arányáról. Ezeknek a statisztikáknak a megértése különösen fontos a fiatalabb játékosok számára, akiknek a major league strikeout-aránya még nincs kőbe vésve. Továbbá hasznosak annak megértésében, hogy a whiff- vagy strikeout-arány rövid távú ingadozása összefügg-e a megközelítés valódi, alapvető változásával.
Featured Image by Justin Paradis (@FreshMeatComm on Twitter)