Continuamos con nuestra introducción a las estadísticas avanzadas en el béisbol. Como en la última serie de artículos, en estas entregas nuestro objetivo es intentar acercar el mundo de la estadística a cualquier aficionado que se sienta abrumado navegando por webs como Baseball-Reference o Fangraphs, y que pueda además realizar sus propios análisis y sacar sus propias conclusiones sobre el rendimiento de un jugador o equipo en concreto. Como dijimos la última vez, cualquier persona puede disfrutar de un partido de béisbol sin haber leído o comprendido una estadística en su vida, pero para el que quiere algo más, las sabermetrics proporcionan un punto de vista complementario y una serie de información que nunca sobra.
En esta ocasión nos vamos a centrar en el lado defensivo del béisbol, concretamente en el “pitcheo”, para así intentar entender qué es lo que hace bueno a un lanzador desde el punto de vista estadístico, y en qué fijarnos a la hora de comparar y juzgar actuaciones en el montículo, más allá de lo que a simple vista podemos apreciar cuando un pitcher hace un lanzamiento o completa un sólido outing de siete entradas y diez Strikeouts. En la primera parte asentamos las bases, o el punto de partida sobre el que empezar el siguiente análisis más avanzado.
¿Qué es lo que da valor a un lanzador?
Cualquier persona que haya sido aficionada al béisbol por el más mínimo tiempo estará ya familiarizada con los conceptos de Victorias y Derrotas (Wins/ Losses), Earned Run Average (ERA) y Saves, las tres estadísticas defensivas por excelencia. Al igual que pasaba con la famosa Slash Line en ataque, estas tres estadísticas fueron pensadas en su día porque eran una manera rápida y sencilla de comparar pitchers, ya fueran starters o relievers. El problema es que, a día de hoy, se siguen utilizando en muchos casos de manera exclusiva en cualquier tipo de argumento o discusión sobre tal o cual pitcher. De hecho, el premio al Cy Young sigue tomando una combinación entre victorias y ERA como la medida infalible para determinar quién es el mejor lanzador de la liga, obviando muchas veces que dichas estadísticas son circunstanciales, y en muchos casos el propio pitcher tiene poco control sobre ellas. Porque en el caso de las victorias, éstas le dan el mismo valor a una actuación de 1 carrera concedida frente a otra actuación en la que el pitcher concede 8 carreras, siempre y cuando el ataque consiga una carrera más que sus rivales. Siempre que el ataque consiga más carreras.
O sea, ¿medimos la calidad defensiva de un jugador condicionada a lo que haga el ataque en un partido en concreto? Algo no cuadra demasiado. Y sino que se lo digan a Nolan Ryan, quien en 1987 lideró la liga en Strikeouts y en ERA, pero acabó con un récord de 8-16 porque su equipo se olvidaba de cómo jugar en los días en que él lanzaba. Algún entendido de la época se atrevió a decir que ese récord era un claro símbolo de declive por parte del pitcher Hall of Famer. Del mismo modo, ERA es una estadística circunstancial en tanto a que, como veíamos en su día con los RBI, depende en gran medida de factores como la calidad de la defensa que juega detrás del pitcher, el campo en el que se juegue, o el orden de consecución de los eventos ocurridos. Por ejemplo, supongamos que un pitcher, en un inning cualquiera, concede un Hit, un Walk, un Home Run y logra posteriormente tres Outs. Su ERA se pone por las nubes tras ver como 3 carreras suben al casillero rival. El mismo pitcher, en la siguiente entrada, vuelve a conceder lo mismo, pero en orden distinto: Home Run, Hit, Walk, y tres Outs. Tan solo 1 carrera sube al marcador esta vez. Pese a que su actuación en las dos entradas ha sido estadísticamente idéntica, el orden de dichos eventos ha condicionado enormemente su Earned Run Average; y eso sin tener en cuenta que, como comentábamos, la defensa y el campo han podido tener una gran importancia en ambos innings. Porque no es lo mismo jugar con Andrelton Simmons detrás que con Marcus Semien, y uno u otro pueden tener una contribución importantísima al ERA de cualquier pitcher.
Mención especial para los Saves, la estadística por excelencia para juzgar la calidad de los relievers, concretamente de los closers, la cual compara indistintamente un Save con las bases llenas y Miguel Cabrera en el plate, con otro en el que el closer entra al partido con las bases vacías y la parte baja de la alineación bateando. Se puede argumentar que los tres últimos Outs de un partido son los más complicados de conseguir, pero la realidad es que esta estadística, como las anteriores, no nos dice nada, porque sigue dependiendo de muchos factores externos.
¿Por dónde empezar?
Ahora que ya nos hemos quitado las estadísticas tradicionales del medio, queremos analizar a un pitcher e intentar predecir cómo van a ser sus actuaciones en el futuro. Lo más importante en este caso es conocer de qué tipo de pitcher estamos hablando, porque muchas de las siguientes estadísticas estarán influenciadas por ello. Así pues, utilizando una medida que ya vimos para bateadores, como es Ground Ball Percentage (GB%), veremos la tendencia de un pitcher a forzar que los bateadores pongan la pelota en juego hacia el suelo frente a que la bateen mayoritariamente al aire. Por poner dos ejemplos: en 2014, entre todos los pitchers que lanzaron al menos 50 innings, Zach Britton de los Orioles lideró las Majors con un GB% de 75, 3% (la media está alrededor del 45%), mientras que en el lado opuesto, Chris Young, de los Mariners, tuvo un 22,3% en la misma estadística. Volveremos a Britton y Young en un momento, pero la idea es quedarse con el hecho de que estamos ante los casos más extremos de un ground ball pitcher y un fly ball pitcher, respectivamente.
Una vez conocemos de qué tipo de pitcher estamos hablando, vendrá la parte esencial del análisis, que se trata de conocer sus estadísticas periféricas, o secundarias, pero aquellas que realmente nos ayudan a entender la calidad de un pitcher, eliminando todos los factores ajenos a él. Podríamos decir que K/9, BB/9, HR/9 y BABIP son como la prueba del algodón, y es que si utilizamos un tamaño muestral suficientemente elevado, éstas nunca engañan. K/9, BB/9 y HR/9 no tienen detrás ninguna matemática compleja, simplemente nos indican el número de Strikeouts, Walks y Home Runs que el pitcher consigue (o concede) en promedio, por cada nueve entradas lanzadas. Así, si tras completar un inning un pitcher logra 3 Strikeouts, pero concede 2 Walks y un Home Run, su K/9 será igual a 27, BB/9 = 18 y HR/9 = 9. Estas tres estadísticas, cuando se estabilizan, nos dan una imagen muy reveladora de la verdadera habilidad de un pitcher, además de que, por lo general, se mantienen muy consistentes en el tiempo.
BABIP = (H – HR)/(AB – K – HR + SF)
Si a estas le sumamos BABIP (Batting Average On Balls In Play, la misma estadística que utilizamos para los bateadores, pero desde el punto de vista del pitcher), podremos tener una idea de si el lanzador ha tenido suerte en las bolas puestas en juego. Así, un pitcher que mantiene en el tiempo un BABIP muy por encima de su media, podremos decir que está teniendo mala suerte ya que cuando los bateadores ponen la bola en juego, esta encuentra más “agujeros” entre la defensa de lo habitual, y viceversa. Aun así debemos considerar dos cosas muy importantes: la primera es que hay pitchers que, consistentemente, consiguen BABIP’s muy inferiores al promedio del resto de la liga. Si un pitcher (por ejemlo: Clayton Kershaw, BABIP de .272 en su carrera) puede lograr esto no debemos suponer que ha tenido mucha suerte en su carrera, sino que tiene una gran habilidad para provocar malos at-bats y, consecuentemente, mal contacto con la pelota, y de ahí que puedan mantener un BABIP bajo. La segunda es que, como veremos en el caso de Chris Young, los fly ball pitchers también tienen tendencia a mantener bajos BABIP’s, ya que las bolas que van al aire tienen menos probabilidades de convertirse en Hits. Por eso es importante que, al utilizar BABIP para referirse a la posible buena o mala suerte de un pitcher, sepamos de qué tipo de lanzador estemos hablando, y comparemos su BABIP con la media de su carrera hasta ese punto.
Defense Independent Pitching Statistics (DIPS)
A finales de los años 90, el analista de Baseball Prospectus Voros McCracken fue pionero en el descubrimiento de que, como hemos comentando más arriba, los pitchers tienen poco o ningún control sobre lo que sucede una vez el bateador pone la bola en juego, y por eso un lanzador nunca debería ser juzgado por el número de Hits que concede. Fue a partir de su teoría, a la que le llamó DIPS (Defense Independent Pitching Statistics), que una serie de estadísticas fueron inventadas con el objetivo de separar aquello que los lanzadores pueden controlar en el campo, de aquello que depende en mayor medida de lo que haga la defensa. La primera de estas estadísticas, y la más utilizada por su sencillez, es FIP (Fielding Independent Pitching), la cual utiliza los Strikeouts, Walks y Home Runs de un pitcher para calcular cual debería ser el ERA “real” del mismo.
FIP = ((13*HR)+ (3*(BB+HBP))-(2*K))/IP + constant
El uso de una constante en el cálculo es para que FIP esté a la misma escala que ERA, de manera que ambas estadísticas sean comparables. Así, un FIP de 3.50 es un número bastante sólido para cualquier pitcher, igual que lo es un ERA de 3.50. Además, FIP es una estadística que “prevé” el futuro con mejor eficacia que ERA, e hipotéticamente el ERA de un pitcher en el futuro debería siempre acercarse a su FIP. Aun así no deja de ser una hipótesis, y es que hay muchos pitchers (como Chris Young) que, en el tiempo, mantienen un ERA muy dispar a su FIP. De nuevo, un ejemplo de este caso suelen ser los fly ball pitchers quienes, al poner muchas bolas en el aire, suelen conceder más Home Runs que la mayoría, lo cual afecta de manera muy negativa a su FIP.
FIP no es una estadística perfecta, pero es mucho más fiable que ERA. Imagina que estás analizando una empresa: ERA es como el resultado después de impuestos, el cual puede haber sido alterado de mil maneras distintas a través de la contabilidad; FIP, por su parte, es como los Cash Flows de la misma empresa, los cuales sirven como un mejor indicador de la consistencia de la empresa para generar caja. Igual que el algodón, los Cash Flows no engañan.
La segunda parte de la “trifecta” se llama xFIP, y lleva lo comentado anteriormente a un nivel incluso superior.
xFIP = ((13*(Fly balls * lgHR/FB%))+(3*(BB+HBP))-(2*K))/IP + constant
xFIP es prácticamente idéntica a FIP, pero su diferencia reside en cómo se computa el impacto de los Home Runs permitidos. Según los estudios defensores de xFIP, los Home Runs permitidos son una estadística muy inestable que puede llegar a variar mucho de un año para otro, por lo que la mejor solución es utilizar una cantidad de referencia única para todos los pitchers, la cual será igual a la media de Home Runs de toda la liga por cada fly ball permitida (HR/FB%, alrededor del 10,6%). Pese a que la diferencia pueda ser inapreciable, el valor predictivo en xFIP es demostradamente superior a FIP; por lo tanto, en un pitcher con un FIP de 3.00 a lo largo de una temporada y un xFIP de 2.80, por poner un ejemplo, podríamos decir que su ratio de Home Runs ha sido algo elevado respecto a la media de la liga, y en un futuro deberíamos esperar una mejora en ese aspecto.
SIERA = 6.145 – 16.986*(K/PA) + 11.434*(BB/PA) – 1.858*((GB-FB-PU)/PA) + 7.653*((K/PA)^2) +/- 6.664*(((GB-FB-PU)/PA)^2) + 10.130*(K/PA)*((GB-FB-PU)/PA) – 5.195*(BB/PA)*((GB-FB-PU)/PA)
Completando el trío indispensable tenemos otra estadística que intenta separar el pitcheo de la defensa, pero sin ignorar completamente las bolas puestas en juego. Skill-Interactive ERA (SIERA) es una estadística bastante nueva, y quizás sea la mejor de todas. Su cálculo es tan complejo que parece haber sido ideado por el propio Einstein, pero la idea es fácil de entender. La mayor diferencia respecto a sus predecesores es que SIERA intenta explicar el porqué de los posibles eventos que suceden y que dependen del pitcher, intentando moldear la estadística a cada lanzador en concreto, poniendo especial énfasis en el tipo de pitcher de que se trata y en la complejidad que suponen las bolas puestas en juego. Podríamos decir que SIERA calcula el ERA de un pitcher adaptando su BABIP y HR/FB a su propio contexto, para que ninguna de las dos estadísticas sean fruto de la suerte o la aleatoriedad. Al igual que FIP y xFIP, SIERA se lee de la misma forma que ERA, de manera que un SIERA de 4.50 sería bastante malo, uno de 2.90 sería bastante bueno, etcétera.
En el caso de un pitcher con un GB% muy elevado, el número de Walks concedido no será algo tan negativo comparado con un pitcher con un GB% bajo, ya que el primero tendrá más probabilidades de eliminar al corredor con una Double Play. Eso es parte de lo que SIERA tiene en cuenta y que la diferencia de FIP o xFIP. Del mismo modo, mientras que FIP considera todos los Home Runs por iguales, es evidente que para un pitcher que coloca a muchos corredores en base, los Home Runs serán más perjudiciales que para otro que mantiene las bases vacías, y esa es otra de las cosas que SIERA tiene en cuenta. Un ejemplo claro es Curt Schilling, quien en 2001 lideró las Majors en Home Runs permitidos, pero debido a sus excepcionales ratios de Strikeouts y Walks, la gran mayoría de esos Home Runs permitían sólo una carrera, porque contra Schilling era muy complicado tener más de un corredor en las bases.
Y volviendo a Zach Britton y Chris Young, a los que habíamos dejado aparcados, habíamos dicho que se trataban de los dos casos más extremos de un ground ball pitcher y un fly ball pitcher, respectivamente. En 2014, Britton finalizó la temporada con un BABIP de .215, una marca excelente para un pitcher de su estilo, pero altamente insostenible. Su FIP de 3.13 respecto al ERA de 1.65 puede hacer suponer que Britton tuvo algo de suerte en 2014, y que en 2015 se vería afectado por algún tipo de regresión. Su BABIP en 2015 ha aumentado a un más razonable .308, pero aun así un incremento considerable de sus Strikeouts ha resultado en que el closer zurdo de los Orioles haya completado una temporada incluso mejor que la anterior, algo que se antojaba complicado. Una de las claves para Britton esta temporada ha sido su habilidad para inducir swings en bolas fuera de la Strikezone (de 29% a 39%), lo que puede explicar en gran medida ese aumento en el número de Strikeouts.
Chris Young, por su parte, ha seguido esta temporada en línea con su carrera en las Ligas Mayores: un BABIP bajísimo (.209) debido a su fascinante habilidad para provocar fly balls, un ERA muy inferior a su FIP (3.15 contra 4.64), debido a sus pocos Strikeouts y su ocasional tendencia a conceder Home Runs. Aun así, el mayor problema para Young es su inexistente habilidad para inducir ground balls y su elevado BB/9 de 3,14, que se ven reflejados en un mediocre SIERA de 5.15. Sus bajos ERA’s pueden ser producto de haber jugado en campos grandes como los de los Padres, Mets, Mariners o Royals, donde los fly ball pitchers suelen, por norma general, exceder sus expectativas.
Pitch Type y Pitch Value
Por último, vamos a finalizar con algo tan básico como los distintos tipos de lanzamiento que un pitcher tiene en su repertorio, y la calidad de los mismos. Pitch Value es una función que proporciona información muy útil sobre cualquier pitcher, y puede explicar muchas de las estadísticas anteriormente mencionadas. Pitch Value nos puede decir si, de un año para otro, un pitcher ha perdido la habilidad para lanzar eficientemente su Slider, lo que podría llevarle a un incremento en sus Walks o a una reducción en su número de Strikeouts. De igual manera, si otro pitcher consigue más ground balls en una temporada, gracias a Pitch Values podríamos ver que ello es debido a que en la presente temporada habría dejado de lanzar una 4-Seam Fastball en favor de una 2-Seam Fastball, que produce más ground balls tras el contacto. E infinidad más de posibilidades.
Te puede interesar: Los pitchers y sus lanzamientos
La manera de cómo funciona Pitch Values es sencilla: cada vez que un pitcher lanza un pitch, pueden suceder una multitud de eventos, como que tira una bola, un strike, el bateador golpea la bola, etc. Cada uno de estos eventos hacen variar positiva o negativamente las probabilidades de que el equipo en ataque logre una o más carreras en un inning concreto, y esa variación de la probabilidad es la que le da valor o se lo resta al pitch lanzado.
En las tablas de a continuación, volvemos a ver a Zach Britton, esta vez comparando los tipos de pitch, velocidad de sus pitches y sus Pitch Values a lo largo de su carrera en las Majors. Como se puede observar, su salto de calidad en 2014 coincide con un mayor uso de su 2-Seam Fastball y la casi eliminación de su Change-up. Además, su paso al bullpen desde la rotación le permitió no tener que reservar y lanzar a su máxima velocidad en cada lanzamiento, lo que se aprecia perfectamente en las millas por hora ganadas. El Pitch Value de su Fastball habla por sí solo, pasando de ser perjudicial para su equipo a prevenir 18,4 carreras por encima de la media.
Toda la información de este último apartado ha sido extraída del servicio PITCHf/x, el cual requeriría un artículo completo para comprender a la perfección. Lo que hemos visto hasta ahora es una mediana pero muy importante parte de las estadísticas de pitcheo en el béisbol, pero ni mucho menos podemos cubrir el 100% de la información disponible. Sin embargo, tras leer este serial el aficionado debería ser capaz de entender las estadísticas más importantes, hacer sus propios análisis y sacar sus propias conclusiones sobre cualquier pitcher de las Grandes Ligas, yendo más allá de lo que se puede apreciar que sucede en el pequeño montículo.