viernes, 28 de julio de 2017

Al monte se va con botas: ¡Judy Benjamin salvada!


Recordemos a la soldado Judy Benjamin. Hace cinco entradas la dejamos perdida en un terreno dividido en cuatro cuadrantes, NO, NE, SO, SE, donde las letras son los puntos cardinales. Llama al cuartel general y le dicen "si estás en el Norte, no estás en el Este", ahí la comunicación se interrumpe.

Se trata de saber qué probabilidades asignará Judy Benjamin a los otros tres cuadrantes. Algunos autores proponen resolver el problema con complicaciones como las siguientes para resolver el problema:


El Principio de Simetría lo mencionó BaUmol que interpretó que la frase “si estás en el Norte, no estás en el Este” es equivalente a “si estás en el Oeste, no estás en el Norte” y, por tanto, no tendría sentido privilegiar la separación Norte/Sur de la Este/Oeste, así que la respuesta no puede dar 1/2 de probabilidad a NO sin dársela también a SE.

No interesa mucho ahora explicar lo que es cada uno de estos conceptos, baste decir que son intentos de deducir cosas cuando no hay información suficiente apelando a principios que, a priori, pueden parecer razonables. Estos principios pueden tener una definición precisa y llevar a deducciones lógicas a partir de ellos.

Argumentaré que nada de esto es necesario. Es más, argumentaré que cualquier intento de resolver el problema está abocado al fracaso. Simplemente no hay datos suficientes para resolverlo. Es como si nos preguntan a qué hora se encontrarán dos trenes que salen desde dos ciudades distintas y no nos dicen a qué velocidad van o a qué hora han salido. Cualquier cábala para dar una respuesta, por muy razonable que parezca, no puede dar lugar a una manera general de resolver problemas sin datos. Y esto es lo que intentan hacer todos los proponentes de soluciones para el problema en cuestión.

En el problema de Judy Benjamín, nos falta el dato de cómo obtiene el cuartel general la información. Puede ser de muchas formas. Veamos dos:
  • El Cuartel General puede usar un satélite una vez nada más. Apunta el satélite al Norte, pero solo hay visibilidad en el cuadrante NE, donde no hay señales de Judy. No pueden hacer nada más con el satélite e informan a Judy: “Si estás en el Norte, no estás en el Este”.
  • El Cuartel General puede usar un satélite una vez nada más. Apunta el satélite al Norte y eligen decirle a Judy un cuadrante en el que no está (si no está en ninguno, le dicen uno al azar). El mensaje es, nuevamente: “Si estás en el Norte, no estás en el Este”.
Lo que cambia según cuál de los casos sea el que ocurre es la probabilidad condicional de que se obtenga la información “Si estás en el Norte, no estás en el Este” (u otra proposición lógicamente equivalente a ella). En el primer caso, la información tiene 1/3 de probabilidad de ocurrir si está en cualquier lugar que no sea NE y tiene 0 de probabilidad si está en NE. En el segundo caso, la probabilidad de la información es 1 si está en NW, es 0 (cero) si está en NE, 1/2 si está en SW y 1/2 si está en SE.

Estas distintas probabilidades darán, metidas en la fórmula de Bayes, las probabilidades que Judy debe asignar a cada cuadrante NO, NE, SO y SE, y que serán (1/3, 0, 1/3, 1/3) en el primer caso y (1/2, 0, 1/4, 1/4) en el segundo. La conclusión de todo esto es que, como ya hemos advertido varias veces en este blog, para ir al monte de la incertidumbre hay que ir con las botas de la teoría de la probabilidad. No basta con la lógica proposicional, ni hace falta inventarse teorías ad hoc. Sabiendo usar el equipamiento adecuado podremos disfrutar del monte sin perdernos.

Efectivamente, el caso se parece al de Monty Hall (cuando no se sabía cómo se elegía la puerta) y no al de la Bella Durmiente ni al del Dormilón, donde la historia sí especificaba cómo se obtenía la información. El ganador es Roberto, que acertó con esta idea.

6 comentarios:

  1. Hola, José Luis. Aunque le he dado algunas vueltas, no termino de identificar claramente cuál es tu posición respecto al problema.

    Por un lado, el problema pregunta qué probabilidad asignará Judy a cada cuadrante. Dices: "Estas distintas probabilidades darán, metidas en la fórmula de Bayes, las probabilidades que Judy debe asignar a cada cuadrante", lo cual no sé como interpretar ya que Judy no tiene acceso a esa información (de hecho, el enunciado está diseñado de forma que quede claro que Judy no puede disponer de ninguna información adicional). Según tú, si Judy supiera más cosas de las que sabe, respondería tal o cual; pero la pregunta es qué responder con la información que tiene, no con más. También podría decir yo que si Judy supiera dónde está asignaría probabilidad 1 a ese cuadrante, y estaremos de acuerdo en que esta no sería una respuesta válida a la pregunta.

    Por otro lado, parece que el problema asume una concepción subjetiva de la probabilidad y que la probabilidad asignada por Judy no tendría por qué ser la misma que la asignada por el cuartel general. Si no, no se entiende que el enunciado incida sobre el hecho de que Judy no recibe toda la información disponible. A mi modo de ver, la cuestión no es si se puede añadir más información hasta que sólo haya una asignación de probabilidad que cumpla todos los requerimientos (lo que es obvio), sino qué hacer cuando hay varias asignaciones compatibles con la información. Estoy seguro de que a Judy no le consuela el que en el cuartel general crean saber la asignación que ella "debería" hacer.

    Aquí una solución es buscar un criterio o principio para elegir; otra solución sería abandonar la probabilidad como herramienta; o por supuesto quedarse sentado esperando que el cuartel mande un helicóptero a buscarte.

    Otra salida sería impugnar la pregunta, que quizá es lo que tratas de hacer al decir que "faltan datos", aunque a mi modo ver el problema es precisamente qué hacer sin esos datos. Al fin y al cabo, si Judy fuera un robot autónomo en la superficie de Marte, esperaríamos que hiciese algo en lugar de autodesconectarse diciendo "no tengo datos suficientes para decidir qué tengo que hacer".

    En todo caso, también me llama la atención la frase de que "En el primer caso, la información tiene 1/3 de probabilidad de ocurrir si está en cualquier lugar que no sea NE y tiene 0 de probabilidad si está en NE.". Supongo que esa asignación la haces asumiendo algún principio, ya que no es la única compatible con la información. Lo que me resulta curioso es que si Judy usa algún principio (p.ej. simetría) disponiendo exactamente de la misma información, es decir, que no está en el NE, eso es ir al monte sin botas; pero cuando lo hace el cuartel general está bien, simplemente porque el cuartel general sabe cómo obtuvo esa información y Judy no.

    Saludos :)

    ResponderEliminar
  2. Hola, Pedro.

    Bienvenido al blog, y gracias por tu comentario.

    Efectivamente, como bien atisbas, mi postura es que faltan datos. Los que se refieren a cómo el cuartel general obtiene la información.

    Plantear el problema de qué debe pensar Judy si le faltan datos es plantearse un problema mal definido y en el que cada uno dará su interpretación favorita sin tener una manera de dar o quitar razón a nadie que opine.

    Imagina que el problema es el típico del cole: Un tren sale de Bilbao hacia Madrid y otro sale de Madrid hacia Bilbao. Los dos parten a las 9:00 horas, a qué hora se encontrarán. A Judy le cae este problema en sus deberes y no sabe qué decir, está perdida y llama al cuartel general (una compañera de clase que siempre atiende mejor en clase) que le dice que el profe había dicho que el tren que sale de Bilbao lo hace a 100 Km/h. Se corta la llamada y se estropean todos los teléfonos. ¿Cómo debe responder Judy si solo tiene esa información? No puede hasta que no llene de alguna manera los datos que le faltan. Puede poner, por ejemplo que la distancia son 400 km porque así lo ve en el mapa e imaginarse (por simetría) que el otro tren va también a 100 km/h, pero esto no es LA solución.

    Mira otros problemas pasados y ve que un tren suele ir al doble de velocidad que el otro, así que le da 1/2 de probabilidad a que el tren de Madrid vaya a 50 km/h y 1/2 a que vaya a 200 km/h.

    Todo eso son probabilidades subjetivas, de las que el modelo no dice nada. Pero haga lo que haga Judy y crea lo que crea, estará respondiendo implícita o explícitamente a unas probabilidades subjetivas. De otra manera, dime qué probabilidades tiene Judy al final y te diré qué probabilidades subjetivas está utilizando.

    Un saludo

    ResponderEliminar
  3. Pues yo entiendo que a falta de información lo lógico es usar la información que tienes (no está en NE) y asignar la misma probabilidad a los otros 3 cuadrantes. Es como si yo te digo que elijo un número entre 1 y 10 y te pregunto ¿que probabilidad hay de que elija el 7?

    Si te dijera como elijo los números podrías ir calibrando probabilidades. Por ejemplo: Jamás elijo número menores de 5 (por lo que la probabilidad de eligir de 1 a 4 es nula), elijo el doble de veces el 8 al 6... pero aunque la nueva información condiciones la probabilidad, en ausencia de información siempre hay que suponer equiprobabilidad.

    Es como si me dices que Judy está en un cuadrante y no me dices más. Yo tengo que suponer equiprobabilidad, incluso si me dices que Judy sabe perfectamente donde está (pero yo no).

    las probabilidades para ella serán 1, 0, 0, 0. pero para mi serán equiprobables.

    Vale que existe la probabilidad de que hayan usando el segundo método que describes, pero también podrían haber usado el segundo método descrito, pero también podrían enfocar al semiplano E y decirle uno de los cuadrantes en que no esté. Como la probabilidad de usar este método es 1/3, y cada uno de los tuyos 1/3, volvemos a que la probabilidad de estar en cada cuadrante que no sea NE es 1/3.

    Evidentemente en probabilidad siempre faltan datos, las verdades tienen probabilidad 1 siempre y las falsedades 0, pero se empieza siempre por un modelo equiprobable y a medida que se vayan sabiendo más datos se va condicionando la probabilidad. Un dado que no se sabe si está cargado o no se empieza suponiendo no cargado (ya que hay la misma probabilidad de que esté cargado cualquier número)

    Y el principio de simetría es una buena regla de razonamiento lógico para falsar posibles respuestas incorrectas al problema. En serio, decir que faltan datos es hacer trampa. En la vida real si adjudicaras probabilidades a 3 hechos excluyentes de los que no conoces probabilidad alguna, ¿que probabilidad les adjudicarían a cada uno?

    ResponderEliminar
  4. "decir que faltan datos es hacer trampa"

    No, si esa es la realidad. Como ya he mostrado, hay datos que faltan que pueden dar una solución u otra. Si no has entendido eso todavía, vuelve a mirar la solución.

    ResponderEliminar
  5. Hola
    Antes de nada enhorabuena por el blog.
    Me esta costando entender la solución. Si planteamos un problema casi igual podria ayudar: cuatro bolas en un bombo con los numeros 1,2,10 y 20. Saco una al azar, y alguien despues de verla me dice: "si es de dos cifras no es el 20". En este caso SI tengo toda la información y la probabilidad seria de P(1)=1/4 P(2)=1/4 y P(10)=1/2. ¿Correcto? Es cierto que ahora SI que se cómo se consiguio la información. Con respecto al problema de Judy se correspondería con la 2ª forma de recabar la info del cuartel. La primera sería que me dijera: "no es el 20", con lo que las restantes probabilidades serían de 1/3. ¿hasta aquí de acuerdo?. Por lo tanto, creo que en el problema de Judy tiene que trabajar con la info que tiene y punto. Ella tiene la informacion equivalente a "si el numero tiene 2 cifras no es 20". Que esa info sea insuficienteo o incorrecta no deberia plantearse en un problema de este tipo, por que entonces lo mejor es descartarla del todo y asignar 1/4 a cada cuadrante.
    Me he liado demasiado y no lo tengo muy claro
    Saludos

    ResponderEliminar
    Respuestas
    1. Cuando preguntas ¿correcto? la respuesta es "no".

      Cuando preguntas ¿hasta ahí de acuerdo? la respuesta es "no".

      Cuando dices que Judy tiene que trabajar con la información que tiene y punto no estás dando un argumento sobre nada. Si la información es incompleta simplemente no puede resolver el problema, como en el caso de los trenes.

      La información que te falta, y que hace que las dos repuestas anteriores sean "no" y "no" es la que se argumenta en la entrada: falta saber cómo se obtiene la información. Es decir, falta saber con qué probabilidades se dan los distintos mensajes en cada situación. Sin esas probabilidades condicionales no hay nada que hacer.

      Eliminar