Going Deep: The Relationship Between Whiffs and Ks
Last May, Dave Cherman da Pitcher List escreveu um artigo que serve como uma leitura obrigatória para qualquer um que deseje entender o básico da métrica de disciplina da placa do batedor. Entre as muitas novidades e conclusões interessantes que Dave descobriu, a mais pertinente foi que a taxa de contato de um rebatedor é a melhor previsão estatística de sua taxa de strikeout.
Alterações na taxa de contato e sua taxa de whiff recíproca (whiffs / swings) explicam aproximadamente 83% dos desvios na taxa de strikeout para rebatedores. Como resultado, os analistas concentram-se em movimentos de curto prazo na taxa de whiff como indicativo das mudanças atuais ou futuras na taxa de strikeout. Além disso, eles se concentram no nível geral da taxa de strikeout de um jogador em relação à sua taxa de whiff, prevendo uma regressão a para este último se a taxa de strikeout for muito alta ou muito baixa.
Este tipo de análise funciona na maior parte do tempo. No entanto, como Dave assinalou astuciosamente, a relação entre contato e strikeouts não é perfeita. Uma grande faixa de jogadores se afasta da norma, seja por excesso ou por falta de desempenho da taxa de strikeout de whiff-predicted. Este artigo irá explorar esses jogadores e o que impulsiona esses desvios.
Cenário
Para reiterar as descobertas de Dave: A taxa de contacto, ou a sua taxa de whiff recíproca, é o melhor cão quando se trata de prever a taxa de strikeout. Em uma amostra de 204 batedores que eclipsaram 1.000 aparições de placas e 2.000 oscilações de 2016 a 2018, o coeficiente R2 entre a taxa de whiff e a taxa de strikeout foi um robusto 0,83 (valores mais próximos de 1,00 indicam uma forte relação). Essa linha de melhor ajuste tem uma inclinação de cerca de 0,87, o que significa que para um aumento de 1,00% na taxa de whiff, espera-se que a taxa de strikeout aumente em cerca de 0,87%.
Comprometer isto à memória é importante. Muitas vezes os analistas referenciarão os movimentos na taxa de swinging strike rate ou na taxa de swing out como indicações de que a disciplina subjacente da placa de um batedor mudou. Embora essas métricas tenham valor, e talvez sejam melhores para explicar uma taxa de batida como a taxa de caminhada, elas são inferiores quando se trata de prever a taxa de strikeout. Por exemplo, o R2 para taxa de swinging e taxa de strikeout é 0,62, indicando uma correlação significativamente mais baixa do que a taxa de whiff, enquanto não há relação discernível entre taxa de swing externo e taxa de strikeout.
Mas enquanto a taxa de whiff é um forte precursor da taxa de strikeout, seu poder preditivo não se mantém para todos os jogadores. Observe os pontos localizados significativamente acima ou abaixo da linha de tendência no gráfico. Os que aparecem acima, destacados por Wil Myers, Trevor Story e Chris Davis, são jogadores que atingem mais do que a sua taxa de whiff sugere. Os que estão abaixo, marcados por Maikel Franco, Adam Jones e Avisail Garcia, eliminam menos do que o esperado (Note-se que a taxa de strikeout prevista foi determinada por plugging a taxa de whiff do jogador como a variável x na fórmula y = 0,8662x – 0,0014 encontrada no gráfico acima).
Both Story e Myers são casos interessantes, já que suas taxas de strikeout reais são mais de 5,0% maiores do que seus níveis previstos. Outros nomes na faixa de strikeout outlier elevada incluem Brett Gardner, Miguel Sano, Logan Forsythe, e Tommy Pham.
Franco, Jones, e Garcia são unidos por Carlos Gonzalez, Brandon Phillips, Hunter Pence, Didi Gregorius, e Nelson Cruz como jogadores capazes de superar suas tendências de cheiro, muitas vezes de 4,0% a 5,0%. Por perspectiva, cortar a taxa de strikeout em 4,5% adiciona mais 30 bolas em jogo ou oportunidades de caminhada para um rebatedor por temporada.
Swing Away, Avisail
O primeiro passo para avaliar por que estas diferenças existem é começar simples: Examine a taxa de swing de um jogador, que é calculada como oscilações divididas pelo total de lançamentos.
Dave mostrou em seu artigo que a taxa de swing não exibe uma relação com a taxa de strikeout no total. Mas tem um efeito significativo no porquê de certos jogadores terem um desempenho superior ou inferior à sua taxa de strikeout esperada. O gráfico abaixo compara a relação entre a taxa de swing e o K Delta, que é a diferença entre a taxa de strikeout prevista por um jogador e sua taxa de strikeout real.
O R2 de 0.23 mostra que a taxa de swing explica uma parte apreciável da variância em K Delta, sendo o impacto extremamente relevante nos casos anteriores apresentados acima.
Dos 10 jogadores de K Delta mais altos, quatro exibiram uma taxa de swing no quinto percentil ou menor, enquanto nove estavam no 39º percentil ou menor. Trevor Story é o único jogador que exibiu uma taxa de oscilação acima desse nível, vindo no percentil 62. A taxa média de swing para o grupo foi de 41,8% – bem abaixo da média MLB de 47,0%.
Uma relação semelhante está presente entre os jogadores do Delta K mais baixo. Quatro posições no percentil 96 ou superior na taxa de swing. Oito eclipsam o percentil 76. Os únicos dois hold outs, que possuem ambos níveis de swing mais ou menos médios, são Pence e Cruz. A taxa média de swing para o grupo foi de 52,4%.
Aplicadores que swing mais possuem duas vantagens distintas em evitar strikeouts. Primeiro, eles colocam mais bolas em jogo mais cedo nas contagens, o que evita a perspectiva de dois strikes e, posteriormente, strikeouts. Segundo, eles são menos aptos a fazer um chamado terceiro strike.
Isso não significa necessariamente que swing mais é melhor. Significa simplesmente que, para uma dada taxa de “swing”, uma taxa mais alta resulta em menos “strikeouts”. Embora esse seja um bom resultado, ele pode ser contrabalançado por uma variedade de fatores, incluindo a qualidade inferior da bola tacada. Isto será explorado num futuro post.
Whiff Diff
A taxa de swing é importante. Mas ainda há outra variável primária que determina a taxa de strikeout: “whiff diff.”
Whiff diff é um moniker que cunhei para a diferença na taxa de whiff de um jogador em diferentes estados de contagem, particularmente entre 0-0 e dois strikes. A teoria subjacente é que certos jogadores podem aplicar uma abordagem mais agressiva de swing mais cedo nas contagens, levando a taxas de whiff mais elevadas, mas melhorar suas habilidades de contato com dois strikes, que é o estado imperativo para ganhar ou evitar strikeouts.
Suramente, este parece ser o caso, com dif difrença de whiff entre 0-0 e dois strikes explicando 20% da variação no K Delta.
A taxa de diframe de whiff de 5,8% é uma das mais altas no beisebol, classificando-se no quarto percentil mais baixo. Isto significa que a capacidade de Story de fazer contato se deteriora significativamente com dois strikes: um traço que provavelmente está dirigindo sua liga líder K Delta.
Quatro dos 10 primeiros no ranking K Delta no oitavo percentil ou menor no diff de whiff, com oito dos 10 no 20º percentil ou menor.
Agora estamos começando a pintar um quadro real do porquê da maioria destes jogadores excederem sua taxa de strikeout. Se eles balançarem menos, e assim colocarem menos bolas em jogo mais cedo nas contagens e fizerem mais chamadas de terceiro strike, enquanto também balançam mais com dois strikes, então suas taxas de strikeout serão mais altas do que o esperado.
Myers e particularmente Napoli são os outliers de whiff diff; no entanto, note que ambos os jogadores possuem taxas de swing no percentil 24 ou inferior.
Seis dos jogadores de K Delta mais altos pontuaram no percentil 85 em whiff diff, enquanto apenas um jogador se classificou abaixo do percentil 63. Isto significa que estes jogadores melhoraram significativamente a sua taxa de whiff quando a contagem atingiu dois strikes.
O caso do Brandon Phillips é particularmente interessante, cuja taxa de whiff caiu de 24,8% em contagens de 0-0 para 15,6% com dois strikes, uma queda maciça de 9,2%. Pence apresenta uma queda semelhante, passando de 33,4% para 25,0%.
Os mecanismos exactos por detrás deste fenómeno não são claros. Estes jogadores são realmente melhores com dois strikes do que outros jogadores, ou a sua abordagem de contagem inicial é apenas abertamente agressiva e a sua abordagem de dois strikes reflecte mais a sua habilidade de base? Estas são questões que serão exploradas num artigo subsequente.
Aplicações recentes
A análise acima utilizou dados de 2016-18 com um limiar mínimo de 1.000 aparências de placas e 2.000 oscilações. Embora esse tipo de conjunto de dados robusto seja necessário para estabelecer uma forte base teórica, também excluiu muitos jogadores que se tornaram ativos de fantasia relevantes ao longo do último ano. Como resultado, vamos pesquisar alguns nomes interessantes baseados no seu desempenho desde o início de 2018.
Yoan Moncada, que estava ausente do conjunto de dados de 2016-18 porque não atingiu o limiar de aparência da placa, está perto do topo da liga em K Delta desde o início de 2018. A taxa de oscilação do 14º percentil de Moncada juntamente com o 26º percentil de diferença é o elixir perfeito para mais strikeouts do que o previsto.
Phillies slugger Rhys Hoskins, juntamente com Dodgers primeiro base Max Muncy, estão em um barco similar, com taxas de swing microscópicas que reduzem suas bolas de contagem inicial em jogo e conduzem a contagem para dois strikes, resultando assim em strikeouts maiores em relação aos whiffs.
Jake Bauers, apesar do início lento de sua carreira na MLB, é um dos favoritos de muitos na comunidade de análise. Embora sua reduzida taxa de whiff possa ser interpretada como um sinal de crescimento no prato, mas talvez as expectativas devam ser amenizadas, dada a sua baixa taxa de oscilação e alta dif. de whiff.
Mets shortstop Amed Rosario possui um dos mais altos percentis de taxa de oscilação e diferença de cheiro no beisebol em 178, indicando que ele tem a abordagem da placa para consistentemente superar sua taxa de cheiro.
Adalberto Mondesi é um caso interessante, combinando uma taxa de oscilação altíssima com uma das mais altas marcas de diferença de cheiro. Até agora ele conseguiu manter-se à tona com uma taxa de strikeout no intervalo de 27%, mas não me surpreenderia se ele não conseguisse melhorar a sua abordagem de dois golpes. Javier Baez é cortado do mesmo pano, balançando em quase tudo e visando o contato duro no início da contagem.
Bryce Harper, como notei no meu artigo sobre a relação entre penhascos e barris, está trocando swing-and-miss por contato duro nas últimas várias temporadas. Felizmente, ele está tomando essa abordagem agressiva mais cedo nas contagens, com um diferencial de whiff de -8,7% que se estabelece no percentil 93.
A quebra de contato que Corey Dickerson experimentou em 2018 é ainda mais suportada pela sua taxa de swing do percentil 100 e pelo diferencial de whiff do percentil 94.
Conclusões
A taxa de whiff é o principal driver por trás da taxa de strikeout. No entanto, a taxa de whiff deve ser vista em conjunto com a taxa de swing do jogador e as métricas dos diff diffs de whiff para obter uma imagem mais precisa da sua taxa de strikeout de base. Compreender estas estatísticas é particularmente importante para jogadores mais jovens cuja taxa de strikeout da liga principal não está firmemente definida em pedra. Além disso, elas são úteis para entender se a volatilidade de curto prazo na taxa de whiff ou taxa de strikeout está relacionada a uma mudança real na abordagem.
Featured Image by Justin Paradis (@FreshMeatComm no Twitter)