Bill James, el padre del sabermetrics, probablemente el personaje más importante en el mundo de las estadísticas beisbolísticas, creó lo que ahora se conoce como el Teorema de Pitágoras del béisbol. La pregunta que se formuló fue sencilla: ¿cuántas carreras debe conseguir un equipo para ganar los partidos? La respuesta no es compleja: más que el rival, pero esto ya nos introduce otra variable, las carreras que conseguirá el equipo contrario.
Partiendo de la base de la lógica más aplastante podemos decir que el equipo que consiga un número elevado de carreras durante el partido tiene más posibilidades de ganar, y el equipo que reciba pocas o ninguna carrera durante el partido conseguirá más victorias. Así que se arremangó y estudió años de partidos en la MLB basándose en el teorema de Pitágoras:
El cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos buscó fusionar la perfección matemática con la estadística del mundo del béisbol y encontró la fórmula que relacionó el número de carreras conseguidas y recibidas con las victorias conseguidas.
Esta fórmula siempre nos da un resultado entre 0 y 1 (mostrándonos las probabilidades que tiene ese equipo de ganar partidos), se multiplica por 162 y nos muestra el número de partidos que se ganarán aproximadamente durante esa temporada.
- Un aumento de carreras conseguidas nos aumentará el numerador, por tanto, el porcentaje de victorias.
- Un aumento de carreras recibidas nos aumentará el denominador, por tanto, disminuirá el porcentaje de victorias.
Se ha buscado cambiar la elevación al cuadrado por la elevación a otros números, 1,83, 1,92…, pero se ha visto que el cuadrado funciona igual de bien que las otras elevaciones, así que se ha mantenido el cuadrado. Incluso cambiando la elevación se ha utilizado la fórmula para otros deportes como el baloncesto o el fútbol americano.
Veamos como funcionó la fórmula durante la temporada pasada, 2015:
Equipo | RF | RA | W | L | % W | Pythagorean | Dif | G | Error |
---|---|---|---|---|---|---|---|---|---|
TOR | 891 | 670 | 93 | 69 | 0,574 | 0,638793963 | -0,064719889 | 103,48 | -10,48 |
OAK | 694 | 729 | 68 | 94 | 0,419 | 0,475418946 | -0,05566586 | 77,01 | -9,017 |
HOU | 729 | 618 | 86 | 76 | 0,53 | 0,581849534 | -0,050985337 | 94,25 | -8,25 |
WSN | 703 | 635 | 83 | 79 | 0,512 | 0,550691193 | -0,038345514 | 89,21 | -6,21 |
SFG | 696 | 627 | 84 | 78 | 0,518 | 0,552012717 | -0,033494199 | 89,42 | -5,42 |
CIN | 640 | 754 | 64 | 98 | 0,39 | 0,418764237 | -0,023702508 | 67,83 | -3,83 |
CLE | 669 | 640 | 81 | 80 | 0,5 | 0,522143448 | -0,022143448 | 84,58 | -3,58 |
MIL | 655 | 737 | 68 | 94 | 0,419 | 0,441295667 | -0,021542581 | 71,48 | -3,48 |
ARI | 720 | 713 | 79 | 83 | 0,487 | 0,50488474 | -0,017230419 | 81,79 | -2,79 |
BOS | 748 | 753 | 78 | 84 | 0,481 | 0,496668924 | -0,015187443 | 80,46 | -2,46 |
BAL | 713 | 693 | 81 | 81 | 0,5 | 0,514221873 | -0,014221873 | 83,30 | -2,30 |
COL | 737 | 844 | 68 | 94 | 0,419 | 0,432629898 | -0,012876812 | 70,08 | -2,08 |
MIA | 613 | 678 | 71 | 91 | 0,438 | 0,449778743 | -0,011507138 | 72,86 | -1,86 |
NYY | 764 | 698 | 87 | 75 | 0,537 | 0,545051826 | -0,008014789 | 88,29 | -1,29 |
TBR | 644 | 642 | 80 | 82 | 0,493 | 0,501555206 | -0,007728046 | 81,25 | -1,25 |
NYM | 683 | 613 | 90 | 72 | 0,555 | 0,553855232 | 0,001700324 | 89,72 | 0,27 |
LAD | 667 | 595 | 92 | 70 | 0,567 | 0,556867197 | 0,011034037 | 90,21 | 1,78 |
STL | 647 | 525 | 100 | 62 | 0,617 | 0,602979687 | 0,014304264 | 97,68 | 2,31 |
PHI | 626 | 809 | 63 | 99 | 0,388 | 0,374514626 | 0,014374263 | 60,67 | 2,32 |
MIN | 696 | 700 | 83 | 79 | 0,512 | 0,497134694 | 0,015210985 | 80,53 | 2,46 |
SDP | 650 | 731 | 74 | 88 | 0,456 | 0,441547936 | 0,015242187 | 71,53 | 2,46 |
SEA | 656 | 726 | 76 | 86 | 0,469 | 0,449478385 | 0,019657417 | 72,81 | 3,18 |
KCR | 724 | 641 | 95 | 67 | 0,586 | 0,560581868 | 0,025837885 | 90,81 | 4,18 |
PIT | 697 | 596 | 98 | 64 | 0,604 | 0,57763919 | 0,027299081 | 93,57 | 4,42 |
CHW | 622 | 701 | 76 | 86 | 0,469 | 0,440499382 | 0,02863642 | 71,36 | 4,63 |
TEX | 751 | 733 | 88 | 74 | 0,543 | 0,512127596 | 0,031082281 | 82,96 | 5,03 |
DET | 689 | 803 | 74 | 87 | 0,456 | 0,424035979 | 0,032754144 | 68,69 | 5,30 |
LAA | 661 | 675 | 85 | 77 | 0,524 | 0,489522109 | 0,035169249 | 79,30 | 5,69 |
CHC | 689 | 608 | 97 | 65 | 0,598 | 0,562209182 | 0,03655625 | 91,077 | 5,92 |
ATL | 573 | 760 | 67 | 95 | 0,413 | 0,362422441 | 0,051157805 | 58,71 | 8,28 |
En una temporada de 162 partidos, con un margen de error de 3 partidos, el teorema acertó en 15 equipos, la mitad de todos los participantes. En un error entre 4 y 6 partidos encontramos 11 equipos, y únicamente en 4 el margen de error fue de 7 o mayor. Si restamos el porcentaje de victorias conseguido por los equipos del porcentaje que nos daba teóricamente el Teorema (columna “Diferencia entre ambos”) y hacemos la media de todas las diferencias encontramos que ésta es de un increíble 0,12%.
En relación a esta precisión, en el libro Trading Bases de Joe Peta se nos habla del valor predictivo del teorema, introduce un concepto llamado “Cluster Luck” que nos dice que los equipos que han conseguido menos victorias que las que deberían haber logrado según la fórmula, el próximo año, si mantienen un equipo similar, conseguirán esas victorias extras. En este caso los de Toronto, Oakland y Houston lograrán más victorias por carrera que las conseguidas/recibidas el año pasado, mientras que Atlanta, los Chicago Cubs y Los Angeles Angels conseguirán menos victorias por cada carrera conseguida/recibida. El teorema tiende a diferencia cero entre victorias reales y teóricas con el paso de las temporadas.
Podemos deducir que la fórmula funciona, pero, ¿nos sirve durante la temporada?
Por si sola no es un valor predictivo. No podemos coger los treinta primeros partidos de un equipo, aplicar la fórmula y que nos de el número de victorias totales al final de la temporada, ya que si un equipo empieza bien nos saldrá un gran récord o si empieza mal será un equipo patético, y eso no acostumbra a ocurrir. Entonces, ¿cómo podemos utilizarla? Combinándola con las predicciones que realizamos al principio de la temporada. Por ejemplo, un equipo lleva 62 partidos y el teorema nos da un porcentaje de victorias de 0,6 (si siguen igual serían 97,2 victorias, 0,6*162) y las predicciones al inicio de la temporada nos da un índice de victorias del 0,48 (serían 77,76 victorias).
Victorias Finales = (62*0,6+100*0,48) = 85,2 Victorias
Pero, ¿podríamos utilizar el porcentaje real de victorias y combinarlo con el porcentaje de victorias que calculamos para el final de la temporada? No, porque las predicciones que se dan para el final de la temporada se basan en el Teorema de Bill James, se calcula las carreras que te darán tus bateadores y las carreras que cederán tus pitchers, por tanto, debemos trabajar con las mismas “unidades.” Baseball Prospectus nos da las predicciones para este año 2016. También podemos ver las de Fangraphs.
¿Nos sirve durante los Playoffs? Pues no. En el libro Mathelics de Wayne L. Winston nos explica que utilizando el Teorema de la temporada de 1980 a la 2007, éste únicamente acertó en el 54% de los casos el equipo que ganarían las 106 series de Playoffs, dando como vencedor al equipo que en teoría conseguiría más victorias, y no funcionó. Octubre es otro mundo.
El teorema también lo utilizan los equipos cuando realizan un intercambio de jugadores o un fichaje. Pongamos un ejemplo. Vamos a cambiar a nuestro catcher que produce 150 carreras por temporada por el catcher de otro equipo que produce 130 carreras; en el mismo número de PA, en teoría ganaremos 20 carreras, veremos cómo afecta esto a nuestro equipo que en teoría conseguirá 724 carreras y recibirá 701.
- Antes del fichaje aplicando el teorema: 83,61 victorias.
- Tras el fichaje aplicando el teorema: 85,81 victorias
Este jugador nos daría dos victorias extras al equipo, y, ¿cuánto nos costará cada victoria? A este jugador le deberemos pagar $6 millones de dólares más que al otro jugador, $3 millones por victoria, pero ¿estas dos victorias que nos faltan pueden meternos en Playoffs o seguiremos lejos del mejor equipo de la división? Podría ser mejor buscar un pitcher que nos haga recibir menos carreras y reforzar el ataque con un jugador más económico que nos dé únicamente 10 carreras más. Como véis, hay muchas variables y cábalas, no es nada fácil ser general manager de la MLB.
Pingback: Los College Sports desde dentro | Sports made in USA()
Pingback: Entender el Juego del Béisbol (IX): La Defensa | Sports made in USA()