Going Deep: Förhållandet mellan Whiffs och Ks
I maj förra året skrev Dave Cherman från Pitcher List en artikel som är ett måste för alla som vill förstå grunderna i mätningar av hitterplattans disciplin. Bland de många intressanta godbitar och slutsatser som Dave avslöjade var den mest relevanta att en slagmans kontaktfrekvens är den bästa statistiska förutsägelsen för hans strikeoutfrekvens.
Förändringar i kontaktfrekvensen och dess reciproka whifffrekvens (whiffs/swings) förklarar ungefär 83 % av avvikelserna i strikeoutfrekvensen för slagmän. Som ett resultat av detta fokuserar analytiker på kortsiktiga rörelser i whiff-frekvensen som en indikation på aktuella eller framtida förändringar i strikeoutfrekvensen. Dessutom fokuserar de på den övergripande nivån på en spelares strikeoutfrekvens i förhållande till hans whifffrekvens och förutspår en regression a till den senare om strikeoutfrekvensen är för hög eller för låg.
Denna typ av analys fungerar för det mesta. Men som Dave skarpsinnigt påpekade är förhållandet mellan kontakt och strikeouts inte perfekt. En stor del av spelarna avviker från normen och presterar antingen över eller under den whiff-beräknade strikeoutfrekvensen. Den här artikeln kommer att undersöka dessa spelare och vad som driver dessa avvikelser.
Bakgrund
För att upprepa Daves resultat: Kontaktfrekvens, eller dess ömsesidiga whifffrekvens, är den bästa hunden när det gäller att förutsäga strikeoutfrekvens. I ett urval av 204 slagskyttar som överskred 1 000 platta framträdanden och 2 000 swings från 2016 till 2018 var R2-koefficienten mellan whiff rate och strikeout rate en robust 0,83 (värden närmare 1,00 indikerar ett starkt samband). Den linjen för bästa anpassning har en lutning på cirka 0,87, vilket innebär att för en ökning av whiff-frekvensen med 1,00 % förväntas strikeoutfrekvensen öka med cirka 0,87 %.
Det är viktigt att lägga detta på minnet. Ofta hänvisar analytiker till rörelser i swinging strike rate eller outside swing rate som indikationer på att en slagmans underliggande plattdisciplin har förändrats. Även om dessa mått har ett värde, och kanske är bättre på att förklara en statistik som walk rate, är de sämre när det gäller att förutsäga strikeout rate. Till exempel är R2 för swinging strike rate och strikeout rate 0,62, vilket indikerar en korrelation som är betydligt lägre än för whiff rate, medan det inte finns något urskiljbart samband mellan outside swing rate och strikeout rate.
Men även om whiff rate är en stark föregångare till strikeout rate, så gäller dess prediktiva kraft inte för alla spelare. Lägg märke till prickarna som ligger antingen betydligt över eller under trendlinjen i grafen. De som finns ovan, med Wil Myers, Trevor Story och Chris Davis i spetsen, är spelare som slår ut mer än vad deras whiff-frekvens skulle antyda. De nedanför, öronmärkta av Maikel Franco, Adam Jones och Avisail Garcia, slår ut mindre än förväntat (Observera att den förutspådda strikeoutfrekvensen bestämdes genom att man satte in spelarens whifffrekvens som x-variabel i formeln y = 0,8662x – 0,0014 som återfinns i grafen ovan).
Både Story och Myers är intressanta fall, eftersom deras faktiska strikeoutfrekvens är mer än 5,0 % högre än deras förutspådda nivåer. Andra namn i det förhöjda utfallsutfallet är Brett Gardner, Miguel Sano, Logan Forsythe och Tommy Pham.
Franco, Jones och Garcia får sällskap av Carlos Gonzalez, Brandon Phillips, Hunter Pence, Didi Gregorius och Nelson Cruz som spelare med förmågan att överträffa sina whiff-tendenser, ofta med 4,0 % till 5,0 %. För att ge ett perspektiv, att sänka strikeoutfrekvensen med 4,5 % ger ytterligare 30 bollar i spel eller promenadmöjligheter för en spelare per säsong.
Swing Away, Avisail
Det första steget för att utvärdera varför dessa skillnader existerar är att börja enkelt: Undersök en spelares swing rate, som beräknas som swings dividerat med totala antalet kast.
Dave visade i sin artikel att swing rate inte uppvisar ett samband med strikeout rate på det hela taget. Men den har en betydande effekt på varför vissa spelare över eller underpresterar sin förväntade strikeout rate. Grafen nedan jämför sambandet mellan swing rate och K Delta, vilket är skillnaden mellan en spelares whiff-beräknade strikeout rate och deras faktiska strikeout rate.
Den R2 på 0.23 visar att swing rate förklarar en märkbar del av variansen i K Delta, där effekten är extremt relevant i de outlier-fall som presenteras ovan.
Av de tio spelarna med högst K Delta uppvisade fyra en swing rate i den femte percentilen eller lägre, medan nio var i den 39:e percentilen eller lägre. Trevor Story är den enda spelaren som uppvisade en svängningsfrekvens över den nivån och kom i den 62:a percentilen. Den genomsnittliga svängningsfrekvensen för gruppen var 41,8 % – långt under MLB-genomsnittet på 47,0 %.
Ett liknande förhållande finns bland de spelare med lägst K-delta. Fyra av dem rankas i den 96:e percentilen eller högre när det gäller swing rate. Åtta överskuggar den 76:e percentilen. De enda två utestående, som båda besitter ungefär genomsnittliga svängningsfrekvensnivåer, är Pence och Cruz. Den genomsnittliga svängningsfrekvensen för gruppen var 52,4 %.
Spelare som svänger mer har två tydliga fördelar när det gäller att undvika strikeouts. För det första sätter de fler bollar i spel tidigare i counts, vilket undviker utsikten till två strikes och därefter strikeouts. För det andra är de mindre benägna att ta en så kallad tredje strike.
Detta betyder inte nödvändigtvis att det är bättre att svinga mer. Det betyder helt enkelt att för en given whiff rate resulterar en högre swing rate i färre strikeouts. Även om det är ett bra resultat kan det motverkas av en rad olika faktorer, bland annat lägre kvalitet på slagna bollar. Detta kommer att undersökas i ett framtida inlägg.
Whiff Diff
Swing rate är viktigt. Men det finns fortfarande en annan primär variabel som bestämmer strikeout rate: ”Whiff diff.”
Whiff diff är en benämning som jag myntade för skillnaden i en spelares whiff rate i olika räknetillstånd, särskilt mellan 0-0 och två-strike counts. Den underliggande teorin är att vissa spelare kanske tillämpar en mer aggressiv svingstrategi tidigare i räkningen, vilket leder till en förhöjd total whiff-frekvens, men förbättrar sin kontaktförmåga med två strikes, vilket är det absolut nödvändiga tillståndet för att vinna eller undvika strikeouts.
Säkerligen verkar detta vara fallet, med whiff diff mellan 0-0 och two-strike counts som förklarar 20 % av variationen i K Delta.
Storys whiff diff-frekvens på 5,8 % är en av de högsta i baseboll, med en placering i den låga fjärde percentilen. Detta innebär att Storys förmåga att ta kontakt försämras avsevärt med två strikes: ett drag som sannolikt driver hans ligaledande K Delta.
Fyra av de tio bästa i K Delta rankas i den åttonde percentilen eller lägre i whiff diff, och åtta av de tio rankas i den 20:e eller lägre.
Nu börjar vi måla upp en riktig bild av varför de flesta av dessa spelare överträffar sin strikeout rate. Om de svingar mindre, och därmed sätter färre bollar i spel tidigare i counts och tar fler kallade third strikes, samtidigt som de också whiffar mer med två strikes, kommer deras strikeout rate att vara högre än förväntat.
Myers och särskilt Napoli är whiff diff outliers; notera dock att båda dessa spelare hade svingfrekvenser i 24:e percentilen eller lägre.
Sex av de spelare med högst K Delta noterades i 85:e percentilen i whiff diff, medan endast en spelare rankades under 63:e percentilen. Detta innebär att dessa spelare avsevärt förbättrade sin whiff-frekvens när räkningen nådde två strikes.
Fallet Brandon Phillips är särskilt intressant, vars whiff-frekvens sjönk från 24,8 % i 0-0 räkningar till 15,6 % med två strikes, en massiv minskning med 9,2 %. Pence uppvisar en liknande minskning och går från 33,4 % till 25,0 %.
De exakta mekanismerna bakom detta fenomen är oklara. Är dessa spelare faktiskt bättre med två strikes än andra spelare, eller är deras tillvägagångssätt vid tidig räkning bara öppet aggressivt och deras tillvägagångssätt med två strikes återspeglar mer deras grundläggande skicklighet? Detta är frågor som kommer att undersökas i en senare artikel.
Renoverade tillämpningar
Ovanstående analys använde sig av data från 2016-18 med en lägsta tröskel på 1 000 plate appearances och 2 000 swings. Även om den typen av robust datamängd är nödvändig för att etablera en stark teoretisk grund, uteslöt den också många spelare som har blivit relevanta fantasytillgångar under det senaste året. Som ett resultat av detta ska vi undersöka några intressanta namn baserat på deras prestationer från början av 2018.
Yoan Moncada, som saknades i datasetet för 2016-18 eftersom han inte nådde tröskelvärdet för platta framträdanden, ligger nära toppen av ligan i K Delta sedan början av 2018. Moncadas 14:e percentil swing rate tillsammans med 26:e percentil whiff diff är det perfekta elixiret för fler strikeouts än väntat.
Phillies slugger Rhys Hoskins, tillsammans med Dodgers first baseman Max Muncy, är i en liknande båt, med mikroskopiska svängningsfrekvenser som minskar deras bollar i spel i början av räkningen och driver räkningen till två strikes, vilket resulterar i ökade strikeouts i förhållande till whiffs.
Jake Bauers är trots en trög start på sin MLB-karriär en favorit för många i analytikerkretsen. Medan hans minskade whiff-frekvens skulle kunna tolkas som ett tecken på tillväxt vid plattan, men kanske bör förväntningarna dämpas med tanke på hans låga svingfrekvens och förhöjda whiff diff.
Mets shortstop Amed Rosario äger en av de högsta summerade percentilerna av swing rate och whiff diff i baseball med 178, vilket tyder på att han har plattans inställning för att konsekvent överträffa sin whiff rate.
Adalberto Mondesi är ett intressant fall, där han kombinerar en skyhög swing rate med en av de högsta whiff diff-markeringarna. Hittills har han lyckats hålla sig flytande med en strikeout rate i 27%-området, men jag skulle inte bli förvånad över att se den ticka uppåt om han inte kan förbättra sin two-strike approach. Javier Baez är klippt av samma tyg, han svänger på nästan allt och siktar på hård kontakt tidigt i räkningen.
Bryce Harper, som jag noterade i min artikel om förhållandet mellan whiffs och barrels, byter ut svängningar mot hård kontakt under de senaste säsongerna. Lyckligtvis tar han detta aggressiva tillvägagångssätt tidigare i räkningarna, med en -8,7 % whiff diff som lägger sig i 93:e percentilen.
Det kontaktgenombrott som Corey Dickerson upplevde 2018 stöds ytterligare av hans 100:e percentil svingfrekvens och 94:e percentil whiff diff.
Slutsatser
Whifffrekvensen är den primära drivkraften bakom strikeoutfrekvensen. Whiff rate bör dock ses tillsammans med en spelares swing rate och whiff diff-metriker för att få en mer korrekt bild av deras grundläggande strikeout rate. Att förstå denna statistik är särskilt viktigt för yngre spelare vars strikeoutfrekvens i major league inte är fast i sten. Dessutom är de användbara för att förstå om kortsiktig volatilitet i whiff rate eller strikeout rate är relaterad till en verklig underliggande förändring i tillvägagångssättet.
Featured Image by Justin Paradis (@FreshMeatComm on Twitter)