martes, 29 de septiembre de 2009

La Teoría de los Juegos. La Historia Más Lúdica Jamás Contada. Parte 5.

Nash al rescate

El joven John Nash era un matemático brillante a quien se le ocurrió dedicarse a la Teoría de los Juegos. Tuvo la idea de que todos los juegos podrían analizarse basándose en un sencillo concepto: el punto de equilibrio. Ocurre que los juegos de suma cero se pueden resolver de una manera relativamente simple. Basta con seguir una estrategia maxmin. Consiste esta en calcular lo peor que nos puede pasar en cada cosa que hagamos y elegir aquella en la que lo peor sea lo menos malo de todo. Esto se puede interpretar como una estrategia prudente o, incluso, paranoica. Como el juego es de suma cero, tiene sentido suponer que el contrincante nos estará intentando fastidiar la fiesta. En otros juegos la paranoia no es de rigor.

Pero sucede que en los juegos de suma cero, si cada jugador juega la estrategia maxmin ocurre algo interesante, como vimos en al entrada anterior. Una vez que se llega a ella, nadie quiere hacer otra cosa. Esto hace de la Teoría de los Juegos de Suma Cero una teoría bastante completa. Tenemos una historia de cómo llegar al equilibrio (jugando la estrategia prudente) y una historia de por qué no se sale de él (el que se desvía, pierde).

Para definir su punto de equilibrio, Nash extendió esta idea del equilibrio como agujero negro (aquel punto del que, una vez en él, no se sale) a todos los juegos. El problema es que falta la historia de cómo se llega a él. Si solo hay un equilibrio en el juego, no hay problema, los jugadores racionales podrán anticipar lo que harán los demás y el resultado solo podrá ser el equilibrio de Nash. Para juegos con múltiples equilibrios el problema de selección ha abierto multitud de estudios que todavía no han dado una solución última (ni se espera que la den).

Nash recibió el premio Nobel, no solo por su definición de equilibrio (seguramente otros autores hubieran llegado a ella), sino por su teorema de existencia, por su propuesta de solución del juego cooperativo de negociación (otro ejemplo situación irresoluble por la razón moral) y por abrir y avanzar en una línea de investigación consistente en encontrar el juego no cooperativo que pueda estar detrás de una propuesta de solución para un juego cooperativo. Cada uno de los pocos artículos publicados en estos tres temas es un ejemplo de genialidad y elegancia. Desgraciadamente, poco después la esquizofrenia pudo con él. Afortunadamente, es uno de los pocos casos en los que, después de muchos años de sufrimiento de la enfermedad, se produce una recuperación. Parece ser que el Nobel no se le otorgó hasta que el comité estuvo seguro de que podría ir a recogerlo en condiciones.

Veamos un ejemplo sencillo de un juego y de sus equilibrios de Nash: Se cruzan dos coches en una carretera. ¿Hacia qué lado se apartarán para no chocarse? Si cada uno va por su derecha, problema resuelto. También si cada uno va por su izquierda. Ambas situaciones son equilibrios. Si el otro va por la derecha, mejor si yo voy también por la derecha y, claro, si yo voy por la derecha, el otro ve confirmado que hacía bien en ir por la derecha. Pero podemos hacer el mismo razonamiento si ponemos izquierda en lugar de derecha. Lo que no es un equilibrio es que cada uno vaya por un lado. Alguno de los dos (en este juego, los dos) se arrepentirá y querrá hacer otra cosa.

Podemos representar el juego en la siguiente tabla:

 

 

Conductor 2

 

 

Izquierda

Derecha

Conductor 1

Izquierda

1, 1

0, 0

Derecha

0, 0

1, 1

Los números pueden ser entendidos como las utilidades de los conductores: Cero, si van por lados distintos, con el riesgo de accidente; uno, si van por el mismo lado, evitando un susto.

Si los conductores tuvieran más simpatías por un lado de la calzada que por el otro, por ejemplo, porque fuera más fácil conducir por el lado derecho que por el izquierdo podríamos sustituir el juego anterior por este otro:

 

 

Conductor 2

 

 

Izquierda

Derecha

Conductor 1

Izquierda

1, 1

0, 0

Derecha

0, 0

2, 2

Sin embargo, en este nuevo juego, conducir ambos conductores por la izquierda sigue siendo un equilibrio. Si el otro va por la izquierda, no gano nada (pierdo mucho) si me empeño en ir yo solo por la derecha.

-Ya, pero es que si todos piensan como tú, las cosas no se mejoran.

-Claro, pero es que si todos piensan como yo, no voy a ser yo el único tonto que no piense como yo.

Lo cual me recuerda la historia de uno que conducía por la autopista y escucha en la radio:

-“Cuidado en la Autopista del Sur, que hay un loco conduciendo en sentido contrario”.

-“¿Uno?” Replica nuestro conductor. “¡Yo veo cientos!”.

5 comentarios:

  1. Dices "estrategia maxmin" pero yo conozco esto con el nombre de minimax. Cual es el termino correcto?

    ResponderEliminar
    Respuestas
    1. Maximin: para cada acción que puedes tomar, miras qué es lo peor que te puede pasar, luego tomas la acción que maximiza estos valores.

      Minimax: para cada acción, mira qué es lo mejor que le puede pasar a tu oponente, luego tomas la acción que minimiza estos valores.

      Ambos conceptos coinciden en juegos de suma cero. En general se usa más la estrategia maximin, que implica un comportamiento prudente (o paranoico, según se mire). La minimax se usa, por ejemplo, para diseñar castigos al oponente si se desvía de algún acuerdo colusivo.

      Con frecuencia escribo maxmin en lugar de maximin porque maxmin es lo que uno escribe en la fórmula matemática.

      Eliminar
    2. O sea, que en juegos de suma cero son equivalentes. La distincion solo tiene sentido en non-zero sum games. Creo que me sonaba mas el termino minimax por el teorema minimax y el algoritmo.

      Gracias

      Thanks

      Eliminar
  2. Hola, llegué a esta entrada, por otra de Nash (de este blog) que remitía a esta, en la cual se mencionaba que eso de "Si todo el mundo pensara como tú" no es un argumento válido. Pero se me ocurren algunos ejemplos, que podrían poner en tela de juicio tal premisa, como un tipo que tira basura a la calle, su amigo le reprocha el acto y el tipo contesta, "Es muy poquita cosa lo que yo contamino" y el amigo le rebate, "Si todos pensaran como tú, la contaminación del mundo sería terrible". Se me ocurren muchos ejemplos más, para dudar de la falta de validez del argumento, pero quizá lo que quisiste expresar, José Luis, es que eso vale, cuando se trata de juegos de suma cero. En todo caso, te pido paciencia, pues en tu blog discurres por temáticas que escapan a mis dominios.

    Saludos.

    ResponderEliminar
    Respuestas
    1. Creo que no has entendido bien. Cuando digo que decir "si todo el mundo pensara como tú" no es un argumento, no me refiero a que no sea verdad la consecuencia, sino a que el mero hecho de ser enunciado no permite un diagnóstico ni una solución del problema.

      Eliminar