Going Deep : The Relationship Between Whiffs and Ks
En mai dernier, Dave Cherman de Pitcher List a écrit un article qui sert d’incontournable pour quiconque souhaite comprendre les bases des métriques de discipline de plaque des frappeurs. Parmi les nombreuses informations et conclusions intéressantes que Dave a découvertes, la plus pertinente est que le taux de contact d’un frappeur est le meilleur prédicteur statistique de son taux de strikeout.
Les changements dans le taux de contact et son taux de whiff réciproque (whiffs / swings) expliquent environ 83% des déviations du taux de strikeout des frappeurs. Par conséquent, les analystes se concentrent sur les mouvements à court terme du taux de reniflage comme indicateur des changements actuels ou futurs du taux de retrait. De plus, ils se concentrent sur le niveau global du taux de strikeout d’un joueur par rapport à son taux de whiff, prévoyant une régression a vers ce dernier si le taux de strikeout est trop élevé ou trop bas.
Ce type d’analyse fonctionne la plupart du temps. Cependant, comme Dave l’a astucieusement souligné, la relation entre le contact et les strikeouts n’est pas parfaite. Un grand nombre de joueurs s’écartent de la norme, dépassant ou sous-performant le taux de strikeouts prédit par les whiffs. Cet article va explorer ces joueurs et ce qui motive ces écarts.
Contexte
Pour réitérer les conclusions de Dave : Le taux de contact, ou son réciproque le taux de whiff, est le meilleur chien quand il s’agit de prédire le taux de strikeout. Dans un échantillon de 204 frappeurs qui ont éclipsé 1 000 apparitions au marbre et 2 000 swings de 2016 à 2018, le coefficient R2 entre le taux de whiff et le taux de strikeout était un robuste 0,83 (les valeurs plus proches de 1,00 indiquent une relation forte). Cette ligne de meilleur ajustement a une pente d’environ 0,87, ce qui signifie que pour une augmentation de 1,00% du taux de whiff, le taux de strikeout devrait augmenter d’environ 0,87%.
Commettre cela en mémoire est important. Souvent, les analystes font référence aux mouvements du taux de frappe de swing ou du taux de swing extérieur comme des indications que la discipline de plaque sous-jacente d’un frappeur a changé. Bien que ces mesures aient de la valeur et qu’elles expliquent peut-être mieux une statistique comme le taux de marche, elles sont inférieures lorsqu’il s’agit de prédire le taux de strikeout. Par exemple, le R2 pour le taux de swinging strike et le taux de strikeout est de 0,62, ce qui indique une corrélation significativement inférieure à celle du whiff rate, tandis qu’il n’y a pas de relation discernable entre le outside swing rate et le strikeout rate.
Mais si le whiff rate est un fort précurseur du strikeout rate, son pouvoir prédictif ne tient pas pour tous les joueurs. Remarquez les points situés soit significativement au-dessus ou au-dessous de la ligne de tendance dans le graphique. Ceux du dessus, mis en évidence par Wil Myers, Trevor Story et Chris Davis, sont des joueurs qui réalisent plus de strikeouts que leur taux de whiff ne le suggère. Ceux en dessous, mis en évidence par Maikel Franco, Adam Jones et Avisail Garcia, font moins de strike out que prévu (Notez que le taux de strike out prédit a été déterminé en branchant le taux de whiff du joueur comme variable x dans la formule y = 0,8662x – 0,0014 trouvée dans le graphique ci-dessus).
Les deux Story et Myers sont des cas intéressants, car leurs taux de strike out réels sont plus de 5,0% supérieurs à leurs niveaux prédits. D’autres noms dans la gamme des valeurs aberrantes élevées de strikeout incluent Brett Gardner, Miguel Sano, Logan Forsythe et Tommy Pham.
Franco, Jones et Garcia sont rejoints par Carlos Gonzalez, Brandon Phillips, Hunter Pence, Didi Gregorius et Nelson Cruz comme des joueurs capables de surpasser leurs tendances de whiff, souvent de 4,0% à 5,0%. Pour perspective, réduire le taux de strikeout de 4,5% ajoute 30 balles en jeu ou opportunités de walk pour un frappeur par saison.
Swing Away, Avisail
La première étape pour évaluer pourquoi ces différences existent est de commencer simplement : Examiner le taux d’élan d’un joueur, qui est calculé comme les élans divisés par le total des lancers.
Dave a montré dans son article que le taux d’élan ne présente pas de relation avec le taux de strikeout dans l’ensemble. Mais il a un effet significatif sur la raison pour laquelle certains joueurs dépassent ou sous-performent leur taux de strikeout attendu. Le graphique ci-dessous compare la relation entre le swing rate et le K Delta, qui est la différence entre le taux de strikeout prédit par les whiffs d’un joueur et son taux de strikeout réel.
Le R2 de 0.23 montre que le taux de swing explique une partie appréciable de la variance du K Delta, l’impact étant extrêmement pertinent dans les cas aberrants présentés ci-dessus.
Parmi les 10 joueurs au K Delta le plus élevé, quatre présentaient un taux de swing dans le cinquième percentile ou moins, tandis que neuf étaient dans le 39e percentile ou moins. Trevor Story est le seul joueur à présenter un taux de swing supérieur à ce niveau, se situant dans le 62e percentile. Le taux de swing moyen du groupe était de 41,8 % – bien en dessous de la moyenne MLB de 47,0 %.
Une relation similaire est présente parmi les joueurs au delta K le plus bas. Quatre se classent dans le 96e percentile ou plus pour le taux de swing. Huit éclipsent le 76e percentile. Les deux seuls outsiders, qui possèdent tous deux des niveaux de swing rate à peu près moyens, sont Pence et Cruz. Le taux de swing moyen du groupe était de 52,4%.
Les joueurs qui swinguent plus possèdent deux avantages distincts pour éviter les strikeouts. Premièrement, ils mettent plus de balles en jeu plus tôt dans les comptes, ce qui évite la perspective de deux prises et, par la suite, de strikeouts. Deuxièmement, ils sont moins susceptibles d’accepter une troisième prise appelée.
Cela ne signifie pas nécessairement que balancer plus est meilleur. Cela signifie simplement que, pour un taux de whiff donné, un taux de swing plus élevé entraîne moins de strikeouts. Bien qu’il s’agisse d’un bon résultat, il pourrait être contrecarré par une variété de facteurs, y compris une qualité inférieure des balles frappées. Ce point sera exploré dans un prochain post.
Whiff Diff
Le taux de swing est important. Mais il y a encore une autre variable primaire qui détermine le taux de strikeout : « whiff diff. »
Whiff diff est un surnom que j’ai inventé pour la différence du taux de whiff d’un joueur dans différents états de compte, en particulier entre les comptes 0-0 et les comptes à deux coups. La théorie sous-jacente est que certains joueurs pourraient appliquer une approche de swing plus agressive plus tôt dans les comptes, conduisant à des taux de whiff globaux élevés, mais améliorer leurs capacités de contact avec deux strikes, qui est l’état impératif pour gagner ou éviter les strikeouts.
Sure enough, this seems to be the case, with whiff diff between 0-0 and two-strike counts explaining 20% of the variation in K Delta.
Le taux de whiff diff de 5,8% de Story est l’un des plus élevés du baseball, se classant dans le faible quatrième percentile. Cela signifie que la capacité de Story à faire des contacts se détériore de manière significative avec deux strikes : un trait qui est probablement à l’origine de son K Delta, le meilleur de la ligue.
Quatre des 10 meilleurs K Delta se classent dans le huitième percentile ou moins en whiff diff, et huit des 10 se classent dans le 20e ou moins.
Maintenant, nous commençons à peindre une véritable image de la raison pour laquelle la plupart de ces joueurs dépassent leur taux de strikeout. S’ils balancent moins, et donc mettent moins de balles en jeu plus tôt dans les comptes et prennent plus de troisièmes frappes appelées, tout en reniflant plus avec deux frappes, alors leurs taux de strikeout seront plus élevés que prévu.
Myers et particulièrement Napoli sont les valeurs aberrantes du whiff diff ; cependant, notez que ces deux joueurs possédaient des taux de swing dans le 24e percentile ou moins.
Six des joueurs au delta K le plus élevé ont obtenu un score dans le 85e percentile du whiff diff, tandis qu’un seul joueur s’est classé en dessous du 63e percentile. Cela signifie que ces joueurs ont significativement amélioré leur taux de whiff lorsque le compte atteint deux strikes.
Le cas de Brandon Phillips est particulièrement intéressant, dont le taux de whiff est passé de 24,8% en compte 0-0 à 15,6% avec deux strikes, soit une baisse massive de 9,2%. Pence présente une baisse similaire, passant de 33,4% à 25,0%.
Les mécanismes exacts derrière ce phénomène ne sont pas clairs. Ces joueurs sont-ils réellement meilleurs avec deux frappes que les autres joueurs, ou leur approche du début du compte est-elle simplement ouvertement agressive et leur approche de deux frappes reflète-t-elle davantage leur compétence de base ? Ce sont des questions qui seront explorées dans un article ultérieur.
Applications récentes
L’analyse ci-dessus a utilisé des données de 2016-18 avec un seuil minimum de 1 000 apparitions au plateau et 2 000 swings. Bien que ce type d’ensemble de données robuste soit nécessaire pour établir une base théorique solide, il a également exclu de nombreux joueurs qui sont devenus des actifs fantaisistes pertinents au cours de la dernière année. Par conséquent, passons en revue quelques noms intéressants en fonction de leur performance depuis le début de 2018.
Yoan Moncada, qui était absent de l’ensemble de données 2016-18 parce qu’il n’a pas atteint le seuil d’apparition au marbre, est proche du sommet de la ligue en K Delta depuis le début de 2018. Le taux de swing du 14e percentile de Moncada accompagné du 26e percentile de diff de whiff est l’élixir parfait pour plus de strikeouts que prévu.
Le slugger Rhys Hoskins des Philadelphie, ainsi que le joueur de première base Max Muncy des Dodgers, sont dans un bateau similaire, avec des taux de swing microscopiques qui réduisent leurs balles en jeu en début de compte et conduisent le compte à deux prises, ce qui entraîne une augmentation des strikeouts par rapport aux whiffs.
Jake Bauers, malgré un début de carrière MLB poussif, est un favori de beaucoup dans la communauté analytique. Alors que son taux de whiffs réduit pourrait être interprété comme un signe de croissance à la plaque, mais peut-être que les attentes devraient être tempérées compte tenu de son faible taux de swing et de sa diff whiff élevée.
Le shortstop Amed Rosario des Mets possède l’un des percentiles additionnés les plus élevés de swing rate et de whiff diff au baseball, à 178, ce qui indique qu’il a l’approche du marbre pour constamment dépasser son taux de whiff.
Adalberto Mondesi est un cas intéressant, combinant un swing rate très élevé avec l’une des marques de whiff diff les plus élevées. Jusqu’à présent, il a réussi à rester à flot avec un taux de strikeout de l’ordre de 27%, mais je ne serais pas surpris de le voir augmenter s’il ne peut pas améliorer son approche à deux coups. Javier Baez est taillé dans la même étoffe, balançant à presque tout et visant un contact dur tôt dans le compte.
Bryce Harper, comme je l’ai noté dans mon article sur la relation entre les whiffs et les barils, échange le swing-and-miss pour un contact dur au cours des dernières saisons. Heureusement, il adopte cette approche agressive plus tôt dans les comptes, avec un différentiel de whiffs de -8,7 % qui s’installe dans le 93e percentile.
Le breakout de contact que Corey Dickerson a connu en 2018 est également soutenu par son taux de swing du 100e percentile et son différentiel de whiffs du 94e percentile.
Conclusions
Le taux de whiffs est le principal moteur derrière le taux de strikeouts. Cependant, le taux de whiff doit être considéré en conjonction avec le swing rate et les métriques de whiff diff d’un joueur pour obtenir une image plus précise de son taux de strikeout de base. La compréhension de ces statistiques est particulièrement importante pour les jeunes joueurs dont le taux de strikeout en ligue majeure n’est pas fermement établi. De plus, elles sont utiles pour comprendre si la volatilité à court terme du taux de whiff ou du taux de strikeout est liée à un véritable changement sous-jacent de l’approche.
Image vedette de Justin Paradis (@FreshMeatComm sur Twitter)