Articles

Going Deep: The Relationship Between Whiffs and Ks

Vorig mei schreef Dave Cherman van Pitcher List een artikel dat dient als een must-read voor iedereen die de grondbeginselen van de metriek van de plaatdiscipline van slagmensen wil begrijpen. Onder de vele interessante weetjes en conclusies die Dave aan het licht bracht, was de meest relevante dat de contact rate van een slagman de beste statistische voorspeller is van zijn strikeout rate.

Verschuivingen in contact rate en zijn wederkerige whiff rate (whiffs / swings) verklaren ruwweg 83% van de afwijkingen in de strikeout rate voor slagmensen. Als gevolg daarvan richten analisten zich op korte-termijn bewegingen in whiff rate als indicatie voor huidige of toekomstige veranderingen in de strikeout rate. Bovendien richten ze zich op het algemene niveau van de strikeout rate van een speler in relatie tot zijn whiff rate, en voorspellen een regressie a naar de laatste als de strikeout rate te hoog of te laag is.

Dit type analyse werkt meestal. Echter, zoals Dave scherpzinnig opmerkte, is de relatie tussen contact en uit- slag niet perfect. Een groot aantal spelers wijkt af van de norm en presteert meer of minder dan het door whiff voorspelde aantal strike-outs. Dit artikel gaat in op deze spelers en wat deze afwijkingen veroorzaakt.

Achtergrond

Om Dave’s bevindingen nog eens te herhalen: Contact rate, of zijn wederkerige whiff rate, is de top dog als het gaat om het voorspellen van strikeout rate. In een steekproef van 204 slagmensen die 1.000 plaatverschijningen en 2.000 swings overschreden van 2016 tot 2018, was de R2-coëfficiënt tussen whiff rate en strikeout rate een robuuste 0,83 (waarden dichter bij 1,00 duiden op een sterke relatie). Die lijn van beste fit heeft een helling van ongeveer 0,87, wat betekent dat voor een toename van 1,00% in whiff rate, de strikeout rate naar verwachting met ongeveer 0,87% zal toenemen.

Dit in het geheugen vastleggen is belangrijk. Vaak verwijzen analisten naar bewegingen in het aantal slagbewegingen of het aantal buitenwaartse zwaaien als aanwijzingen dat de onderliggende plaatdiscipline van een slagman is veranderd. Hoewel deze metrieken waarde hebben, en misschien beter zijn in het verklaren van een statistiek als het aantal vrije lopen, zijn ze inferieur als het gaat om het voorspellen van het aantal strikeouts. Bijvoorbeeld, de R2 voor swinging strike rate en strikeout rate is 0,62, wat duidt op een correlatie die aanzienlijk lager is dan die van whiff rate, terwijl er geen waarneembaar verband is tussen outside swing rate en strikeout rate.

Maar terwijl whiff rate een sterke voorloper is van strikeout rate, geldt zijn voorspellende kracht niet voor alle spelers. Let op de punten die significant boven of onder de trendlijn in de grafiek liggen. Die daarboven, gemarkeerd door Wil Myers, Trevor Story, en Chris Davis, zijn spelers die meer uitslaan dan hun whiff rate zou suggereren. Degenen hieronder, gemarkeerd door Maikel Franco, Adam Jones, en Avisail Garcia, hebben minder strike-out dan verwacht (merk op dat de voorspelde strike-out rate werd bepaald door het inpluggen van de whiff rate van de speler als de x-variabele in de y = 0,8662x – 0,0014 formule gevonden in de bovenstaande grafiek).

Zowel Story als Myers zijn interessante gevallen, omdat hun werkelijke strike-out rates meer dan 5,0% hoger zijn dan hun voorspelde niveaus. Andere namen in de verhoogde strikeout outlier range zijn Brett Gardner, Miguel Sano, Logan Forsythe, en Tommy Pham.

Franco, Jones, en Garcia worden vergezeld door Carlos Gonzalez, Brandon Phillips, Hunter Pence, Didi Gregorius, en Nelson Cruz als spelers die in staat zijn om hun whiff-tendensen te overtreffen, vaak met 4,0% tot 5,0%. Ter vergelijking, het verlagen van de strikeout rate met 4,5% voegt een extra 30 ballen in het spel of walk kansen toe voor een slagman per seizoen.

Swing Away, Avisail

De eerste stap in het evalueren van waarom deze verschillen bestaan is om eenvoudig te beginnen: Onderzoek de swing rate van een speler, die wordt berekend als swings gedeeld door het totaal aantal worpen.

Dave toonde in zijn artikel aan dat swing rate over het geheel genomen geen relatie vertoont met het aantal strikeouts. Maar het heeft wel een significant effect op waarom bepaalde spelers boven of onder hun verwachte strikeout rate uitkomen. De onderstaande grafiek vergelijkt de relatie tussen swingsnelheid en K Delta, het verschil tussen de door whiffs voorspelde strikeout rate van een speler en zijn werkelijke strikeout rate.

De R2 van 0.23 toont aan dat de swingsnelheid een aanzienlijk deel van de variantie in K Delta verklaart, waarbij de impact uiterst relevant is in de hierboven gepresenteerde uitschieters.

Van de 10 spelers met de hoogste K Delta hadden er vier een swingsnelheid in het vijfde percentiel of lager, terwijl negen in het 39e percentiel of lager zaten. Trevor Story is de enige speler met een swing rate boven dat niveau, hij komt uit in het 62e percentiel. De gemiddelde swingsrate voor de groep was 41,8% – ruim onder het MLB-gemiddelde van 47,0%.

Een soortgelijke relatie is aanwezig bij de spelers met de laagste K Delta. Vier staan in het 96e percentiel of hoger in zwaaipercentage. Acht komen boven het 76e percentiel. De enige twee afvallers, die beiden een ongeveer gemiddelde swingsnelheid hebben, zijn Pence en Cruz. De gemiddelde swing rate voor de groep was 52.4%.

Spelers die meer swingen hebben twee duidelijke voordelen bij het vermijden van strikeouts. Ten eerste, ze zetten meer ballen in het spel eerder in de telling, die het vooruitzicht van twee strikes en vervolgens strikeouts vermijdt. Ten tweede, ze zijn minder geneigd om een derde slag te nemen.

Dit betekent niet noodzakelijk dat meer swingen beter is. Het betekent gewoon dat, voor een gegeven whiff rate, een hogere swing rate resulteert in minder strikeouts. Hoewel dat een goed resultaat is, kan het door een aantal factoren worden tegengewerkt, waaronder een lagere kwaliteit van de geslagen bal. Dit zal worden onderzocht in een toekomstige post.

Whiff Diff

Swing rate is belangrijk. Maar er is nog een andere primaire variabele die het aantal strikeouts bepaalt: “whiff diff.”

Whiff diff is een naam die ik bedacht heb voor het verschil in whiff rate van een speler in verschillende count states, in het bijzonder tussen 0-0 en two-strike counts. De onderliggende theorie is dat bepaalde spelers eerder in de telling een agressievere swingaanpak toepassen, wat leidt tot hogere whiffpercentages, maar hun contactvaardigheden verbeteren bij twee slag, wat de dwingende staat is om strikeouts te verdienen of te vermijden.

Zeker, dit lijkt het geval te zijn, met whiff diff tussen 0-0 en two-strike counts dat 20% van de variatie in K Delta verklaart.

Story’s whiff diff rate van 5,8% is een van de hoogste in het honkbal, gerangschikt in het lage vierde percentiel. Dit betekent dat Story’s vermogen om contact te maken met twee slag aanzienlijk verslechtert: een eigenschap die waarschijnlijk de drijvende kracht is achter zijn toonaangevende K Delta.

Vier van de top 10 in K Delta staan in het achtste percentiel of lager in whiff diff, en acht van de 10 staan in het 20e percentiel of lager.

Nu beginnen we een echt beeld te schetsen van waarom de meeste van deze spelers hun strikeout rate overtreffen. Als ze minder zwaaien, en dus minder ballen eerder in het spel brengen en meer derde slagen nemen, terwijl ze ook meer slaan met twee wijd, dan zal hun strikeout rate hoger zijn dan verwacht.

Myers en vooral Napoli zijn de whiff diff uitschieters; merk echter op dat beide spelers swing rates hadden in het 24e percentiel of lager.

Zes van de hoogste K Delta spelers scoorden in het 85e percentiel in whiff diff, terwijl slechts één speler onder het 63e percentiel zat. Dit betekent dat deze spelers hun slagpercentage aanzienlijk verbeterden toen de telling twee slag bereikte.

Het geval van Brandon Phillips is bijzonder interessant, wiens slagpercentage daalde van 24,8% bij 0-0 tellen tot 15,6% met twee slag, een enorme daling van 9,2%. Pence vertoont een vergelijkbare daling, van 33,4% naar 25,0%.

De precieze mechanismen achter dit fenomeen zijn onduidelijk. Zijn deze spelers daadwerkelijk beter met twee slag dan andere spelers, of is hun vroege count aanpak gewoon openlijk agressief en hun twee-slag aanpak meer een afspiegeling van hun basisvaardigheid? Dit zijn vragen die in een volgend artikel zullen worden onderzocht.

Recent Applications

De bovenstaande analyse maakte gebruik van gegevens uit 2016-18 met een minimumdrempel van 1.000 plaatverschijningen en 2.000 swings. Hoewel dat type robuuste dataset noodzakelijk is voor het vaststellen van een sterke theoretische basis, sloot het ook veel spelers uit die het afgelopen jaar relevante fantasie-activa zijn geworden. Laten we daarom een aantal interessante namen onderzoeken op basis van hun prestaties vanaf het begin van 2018.

Yoan Moncada, die ontbrak in de 2016-18-dataset omdat hij de drempel voor plaatverschijningen niet bereikte, staat dicht bij de top van de competitie in K Delta sinds het begin van 2018. Moncada’s 14e percentiel swing rate samen met 26e percentiel whiff diff is het perfecte elixer voor meer strikeouts dan verwacht.

Phillies slugger Rhys Hoskins, samen met Dodgers eerste honkman Max Muncy, zitten in een soortgelijk schuitje, met microscopische swing rates die hun early-count ballen in het spel verminderen en de telling naar twee strikes drijven, wat resulteert in verhoogde strikeouts ten opzichte van whiffs.

Jake Bauers, ondanks een trage start van zijn MLB-carrière, is een favoriet van velen in de analytics-gemeenschap. Hoewel zijn verminderde whiff rate zou kunnen worden geïnterpreteerd als een teken van groei aan de plaat, maar misschien verwachtingen moeten worden getemperd gezien zijn lage swing rate en verhoogde whiff diff.

Mets korte stop Amed Rosario heeft een van de hoogste gesommeerde percentielen van swingsnelheid en whiff diff in honkbal op 178, wat aangeeft dat hij de plaatbenadering heeft om consequent zijn whiff rate te overtreffen.

Adalberto Mondesi is een interessant geval, een combinatie van een torenhoge swingsnelheid met een van de hoogste whiff diff cijfers. Tot nu toe heeft hij zich staande weten te houden met een strikeout rate van rond de 27%, maar het zou me niet verbazen als die omhoog schiet als hij zijn two-strike approach niet kan verbeteren. Javier Baez is uit hetzelfde hout gesneden, swingend naar bijna alles en mikkend op hard contact vroeg in de telling.

Bryce Harper, zoals ik opmerkte in mijn artikel over de relatie tussen whiffs en barrels, ruilt swing-and-miss in voor hard contact over de laatste paar seizoenen. Gelukkig neemt hij die agressieve aanpak eerder in tellingen, met een -8,7% whiff diff dat zich vestigt in het 93e percentiel.

De contactbreakout die Corey Dickerson in 2018 doormaakte, wordt verder ondersteund door zijn 100e percentiel swing rate en 94e percentiel whiff diff.

Conclusies

Whiff rate is de primaire driver achter strikeout rate. Echter, whiff rate moet worden bekeken in combinatie met de swing rate van een speler en whiff diff metrieken om een nauwkeuriger beeld te krijgen van hun baseline strikeout rate. Inzicht in deze statistieken is vooral belangrijk voor jongere spelers, bij wie het slagpercentage in de Major League nog niet vaststaat. Bovendien zijn ze nuttig om te begrijpen of de volatiliteit op korte termijn in whiff rate of strikeout rate gerelateerd is aan een echte onderliggende verandering in aanpak.

Featured Image by Justin Paradis (@FreshMeatComm op Twitter)