lunes, 24 de octubre de 2011

¿Con qué probabilidad ganaremos la Copa?

En una discusión en el Otto Neurath salió a relucir una clásica objeción a la idea de probabilidad. Venía a decir Arriero que, en ausencia de una evidencia empírica, en plan frecuencialista, no tiene sentido hablar de probabilidad de un evento. Como ilustración nos ofrecía un diálogo en el que Aquiles le reta a la Tortuga a que asigne probabilidad al evento de que al tirar la moneda que tiene en la mano salga cara. La Tortuga dice que un medio. Aquiles tira su moneda una y otra vez y sale siempre cara. La Tortuga asignó probabilidades sin saber nada de la moneda de Aquiles, que tenía dos caras.

No es una buena objeción, aunque da pie para aclarar el significado de probabilidad. Como siempre, entenderé que la definición de probabilidad será interesante mientras sea operativa, es decir, mientras sepa cómo usarla y mientras eso me permita hacer cosas con ella mejor que sin ella.

Esta es mi respuesta a Arriero:

Imagina que sabemos que el 50% de una población tiene un gen que le hace tener una probabilidad del 100% de morirse de una enfermedad X y que el otro 50% tiene una probabilidad del 0%.

Hay una posible cura: una droga que te libra de esa enfermedad con total seguridad (si la tienes), pero que te puede matar por efectos secundarios el 10% de las veces (tanto si tenías el gen como si no. Si eres un individuo de esa población, ¿quieres tomar la droga? Por supuesto, querrás primero saber si tienes el gen o no. Pero si eso no es posible ¿qué haces? A todos los efectos tienes un 50% de probabilidad de padecer la enfermedad y morir, aunque Aquiles insista que no, que tienes un 100% o un 0% según el caso. La precisión de Aquiles no importa nada. El problema es tomar la droga o no en una situación de incertidumbre. Saber lo que desdeña Aquiles permite tomar una buena decisión y, con ella, la droga.

En el mejor de los casos, las probabilidades se han establecido como señalas (repitiendo experimentos), pero no tiene por qué ser así. Desde el momento en que cada observación (de cualquier cosa) se hace en un momento o en un lugar diferentes, es imposible mantener todo constante y no tendremos, estrictamente hablando, nunca una repetición de ningún evento.A partir de ahí, lo mismo que postulamos que el momento o el lugar no influye para una repetición (por seguir con el frecuencialismo) postulamos la similitud de poblaciones o la irrelevancia de algún detalle.La probabilidad solo se define rigurosamente en el modelo formal. En la realidad podemos ver si las predicciones con ese modelo son o no acertadas.

¿Podemos ver si es acertada la predicción de que el Athletic ganará la Copa con una probabilidad del 40%?

No y sí.

No, porque tanto si gana como si no, el resultado es compatible con la predicción, y no queremos predicciones no falsables. Sí, porque si la predicción viene tras un modelo que hace otras predicciones, podemos tener datos suficientes para hacer una inferencia estadística en toda regla. Como siempre, solo con grados de confianza. Si el modelo hace predicciones para las probabilidades de ganar de varios equipos en varios años y en varias competiciones, aunque cada una de las realizaciones de esas predicciones sea un evento único, es posible establecer estadísticamente el buen o mal ajuste del modelo.

Si alguien está interesado en las técnicas estadísticas que se usarían, son los llamados Datos de Panel.

No hay comentarios:

Publicar un comentario en la entrada