Esta es la primera parte de la versión en español de mi artículo de octubre en Mapping Ignorance.
La Teoría de Juegos estudia modelos matemáticos de decisión estratégica. Históricamente, la primera aproximación fue estudiar las interacciones de individuos perfectamente racionales, con preferencias completas y transitivas y que son suficientemente inteligentes para analizar el juego en que están. Este es un enfoque normativo: viene a decir qué se debe hacer si se acepta que tanto los demás como uno mismo somos racionales. Hay otras normas posibles, pero esta es la que se ha estudiado más ampliamente. Pronto se hizo evidente que el modelo racional era una pobre descripción del comportamiento real en muchos juegos. Se propusieron y estudiaron entones nuevas teorías con un enfoque descriptivo (aprendizaje, complejidad, comportamiento en manada, imitación, adaptación evolutiva, etc.), pero en los últimos años algunos modelos de comportamiento han ganado notoriedad. Wright y Leyton-Brown (2017) [1] toman los cinco modelos más usados y llevan a cabo un meta-análisis para encontrar cuál de ellos funciona mejor como teoría descriptiva.
En la base de todas las teorías del comportamiento está el concepto de “respuesta”: cómo reaccionan los individuos en un determinado ambiente que, en el caso de la Teoría de Juegos, incluye el comportamiento de los demás. En el modelo racional –y su concepto clave, el equilibrio de Nash-, los jugadores siempre responden eligiendo su mejor respuesta dadas las acciones de los demás. A continuación describimos cinco teorías del comportamiento en términos de sus supuestos acerca de la manera en que los jugadores responden a lo que asumen es el comportamiento de los demás.
Equilibrio de respuesta cuantal (Quantal response equilibrium, QRE)
McKelvey y Palfrey (1995) [2] proponen que los individuos eligen las mejores respuestas con probabilidades más elevadas. Más específicamente, la probabilidad de elegir una acción determinada es proporcional al valor de la función exponencial donde el exponente es la utilidad del individuo multiplicada por una constante C. Esta constante le da al modelo un grado de libertad que, cuando vale cero, implica un comportamiento aleatorio y que se aproxima a la mejor respuesta racional a medida que C tiende a infinito.
Modelo nivel-k (level-k model)
De acuerdo con este modelo, propuesto por Costa-Gomes et al,. 2001 [3], los individuos son capaces de alcanzar únicamente k niveles de razonamiento. Un nivel 0 implica que los individuos eligen su acción de manera aleatoria. El nivel 1 implica que los individuos eligen la estrategia que maximiza su utilidad si todos los demás jugadores usan un nivel 0 de razonamiento. Por inducción, un nivel k significa que cada individuo elige la estrategia que maximiza su utilidad si todos los demás usan un nivel k-1 de razonamiento. Los autores consideran un modelo particular de nivel k en el que (i) un jugador puede ser de nivel 1, 2 o 3, (ii) los jugadores de nivel 1 y 2 comenten algún error cuando eligen su estrategia, y (iii) la predicción de las acciones es la media ponderada de las distribuciones de cada nivel. Este modelo tiene cuatro parámetros: las proporciones de los individuos de nivel 1 y 2, y las probabilidades de cometer un error por parte de esos mismos individuos.
Jerarquía cognitiva
Al igual que los modelos de nivel k, el modelo de jerarquía cognitiva, propuesto por Camerer et al. (2004) [4], se basa en un razonamiento iterativo. Difiere de los modelos de nivel k en dos aspectos. Primero, los jugadores no cometen errores y, segundo, un jugador de nivel k elige su mejor respuesta frente a la distribución completa de agentes de nivel 0, 1,…, k-1, y no solo frente a los de nivel k-1. Además, la proporción de jugadores de distintos niveles está gobernada por una distribución de probabilidad particular, la distribución de Poisson. Este modelo tiene únicamente un parámetro libre, el necesario para determinar la distribución de Poisson.
(Continua aquí.)
Referencias
1. Wright, J.R., y Leyton-Brown, K. 2017. Predicting human behavior in unrepeated, simultaneous-move games. Games and Economic Behavior 106, 16-37.
2. McKelvey, R., y Palfrey, T.,1995. Quantal response equilibria for normal form games. Games and Economic Behavior. 10 (1), 6–38.
3. Costa-Gomes, M.; Crawford, V., y Broseta, B. 2001. Cognition and behavior in normal-form games: an experimental study. Econometrica 69 (5), 1193–1235.
4. Camerer, C., y Hua Ho, T. 1999. Experience-weighted attraction learning in normal form games. Econometrica 67 (4), 827–874.
-----------------------------------------------------------------------------------------------------------
(Continua aquí.)
Referencias
1. Wright, J.R., y Leyton-Brown, K. 2017. Predicting human behavior in unrepeated, simultaneous-move games. Games and Economic Behavior 106, 16-37.
2. McKelvey, R., y Palfrey, T.,1995. Quantal response equilibria for normal form games. Games and Economic Behavior. 10 (1), 6–38.
3. Costa-Gomes, M.; Crawford, V., y Broseta, B. 2001. Cognition and behavior in normal-form games: an experimental study. Econometrica 69 (5), 1193–1235.
4. Camerer, C., y Hua Ho, T. 1999. Experience-weighted attraction learning in normal form games. Econometrica 67 (4), 827–874.
-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: ¿Cuánto ha producido España en los últimos años?
Y también: ¿Dónde están los liberales?
Y también: Índices de poder en el parlamento catalán.
Hace tres años en el blog: Odiosa comparación (6).
-----------------------------------------------------------------------------------------------------------
Y también: ¿Dónde están los liberales?
Y también: Índices de poder en el parlamento catalán.
Hace tres años en el blog: Odiosa comparación (6).
-----------------------------------------------------------------------------------------------------------
No hay comentarios:
Publicar un comentario