Mostrando entradas con la etiqueta Teoría de Juegos. Mostrar todas las entradas
Mostrando entradas con la etiqueta Teoría de Juegos. Mostrar todas las entradas

jueves, 5 de julio de 2018

El consumo ostentoso: mercados competitivos vs monopolio (2)

Esta es la segunda parte de la versión en español de mi artículo de mayo en Mapping Ignorance. Debe leerse la primera parte para entender esta.



Podemos resumir el equilibrio de la entrada anterior en otras palabras: gastar X es demasiado caro para el individuo normal y ser tratado como rico no le compensa. Para el rico, la cantidad X no significa tanto y sí se lo puede permitir. En este modelo, el gasto X no es una dilapidación de recursos, o por lo menos no en su totalidad, puesto que los individuos con la etiqueta “rico” obtienen algo a cambio. Puede suceder que una cantidad menor que X también satisfaga esas tres condiciones, pero el gasto debe ser necesariamente alto para que no atraiga a los individuos normales.

En el modelo anterior, Mandler (2018) [2] investiga las consecuencias teóricas de permitir la piratería frente al caso de monopolio de marca en el mercado de estos bienes. Para entender el alcance del modelo de Mandler, considérese primero la situación en la que el nivel X de consumo ostentoso se consigue mediante la compra de unos pocos bienes, pero muy caros, perteneciente a marcas exclusivas. El productor de la marca disfruta de un monopolio sobre el uso de la marca, lo que significa que puede extraer un alto margen de beneficio, la diferencia entre el coste de producción y el precio. En estas circunstancias, una parte elevada del gasto en X es simplemente una transferencia de renta de los individuos etiquetados como “rico” hacia las empresas que ofrecen los bienes de lujo, y una parte pequeña irá a retribuir los costes de producción.

Si ahora consideramos que una empresa que posee una marca no puede evitar que otros la copien, y si múltiples competidores pueden proveer en el mercado un bien indistinguible del original, entonces el precio de los bienes de esa marca particular bajarán, dejando solo un pequeño margen de beneficios a las empresas, tanto a la original como a las que copian el producto. En un primer momento, antes de que la mayoría de la gente conozca la existencia de las copias, muchos individuos normales pueden comprar la etiqueta “rico” a un coste muy inferior a X, puesto que la gente todavía creerá que el gasto en las copias es tanto como era el gasto en el original antes de aparecer los competidores. Esta situación, sin embargo, no puede prevalecer. Al final todo el mundo entenderá qué está pasando y se darán cuenta que para alcanzar el nivel de gasto X los individuos tienen que comprar una cantidad mucho mayor de los bienes de esa marca o pasar a comprar los de otra marca que todavía no ha sido copiada. Como vemos, en este primer caso los consumidores con la etiqueta “rico” estarán comprando mucho de empresas con poco margen de beneficios, lo que implica que la proporción de X que es una transferencia de rentas es baja, y que la proporción que se pierde en los costes de producción es muy alta. En este caso, la conclusión es que el coste total de conseguir la etiqueta “rico” es más alta en competencia perfecta (cuando hay competidores que producen copias perfectas) que en el caso de monopolio. En el caso de que los consumidores con la etiqueta “rico” opten por comprar otros bienes, observaremos un equilibrio al alza en el que las empresas produzcan bienes que no se puedan copiar fácilmente. Esto implica que las empresas competirán en producir bienes cada vez de calidad más alta y que sea difícil de copiar, pero esto también implicará altos costes de producción y un bajo margen de beneficios, con las mismas consecuencias que antes y un coste más alto que cuando se toleran las copias.

En este modelo, a los individuos que realizan un consumo ostentoso no les importa si el mercado está servido por empresas que compiten copiándose los bienes o no, puesto que gastan X en cualquier caso. Son las empresas monopolísticas las que se ven beneficiadas por los altos márgenes cuando no se permiten las copias. Hay otra manera de llegar al mismo nivel de eficiencia social sin otorgar poder de monopolio a ninguna empresa: basta con permitir la copia y poner un impuesto tal que el impuesto más el pequeño margen en competencia se iguale al margen de beneficio en el caso de monopolio.

Referencias:

2. Mandler, M. 2018. Piracy versus monopoly in the market for conspicuous consumptionThe Economic Journal, 128 1257–1275.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Odiosa comparación (5).
-----------------------------------------------------------------------------------------------------------

domingo, 1 de julio de 2018

El consumo ostentoso: mercados competitivos vs monopolio (1)

Esta es la primera parte de la versión en español de mi artículo de mayo en Mapping Ignorance.


El consumo ostentoso puede definirse de manera extensa como un tipo de consumo que no satisface directamente una necesidad o algo que se quiere por sí mismo, sino un deseo de ser reconocido como alguien que ocupa una posición más alta en una jerarquía. Por ejemplo, yo puedo comprar un Picasso no porque me guste particularmente el cuadro, sino porque, colgado un una pared destacada de mi casa, envía inmediatamente un mensaje a mis visitas y amigos acerca de cuán rico soy. Este status es lo que persigo, no el cuadro.

El análisis económico de este tipo de consumo no es fácil. Un error típico es pensar que la ley de la demanda no se satisface, puesto que el precio alto del bien es lo que lo hace atractivo. El error se advierte en cuanto uno se da cuenta de que si el mismo bien se pudiera comprar a un precio inferior (sin que los demás sepan que fue comprado de esa manera) el consumidor lo preferiría.

Si la razón principal del consumo ostentoso es comprar un lugar en un ranking, el resultado es el de un equilibrio al alza en el que aquellos que puedan permitirse bienes de lujo los terminarán comprando en demasiada cantidad. Pongamos que después de que los individuos toman sus decisiones se establece un ranking. Inmediatamente notamos que ese mismo ranking se puede establecer sin tanto gasto (el escalar posiciones en un ranking es un jugo de suma cero). Las empresas y los individuos que proveen los bienes de consumo obtienen un beneficio, pero este no es más que una transferencia de rentas de los consumidores a los productores. Sin embargo, el coste de producir estos bienes es un gasto perdido en la medida en que no contribuyen directamente a un incremento en la utilidad que compense el gasto de acuerdo con el consumidor que lo compra. Este fallo de mercado abre la cuestión acerca de las consecuencias de diferentes tipos de regulación para estos bienes, como el impuesto de lujo sugerido por Stuart Mill en el siglo 19 [1].

Hay otras maneras de modelizar el consumo ostentoso. En lugar de comprar un lugar en un ránking, este consumo compra la pertenencia a un grupo. Como antes, lo que importa es la pertenencia al grupo, no el bien en sí. Sin embargo, contrariamente al modelo anterior, este no es de suma cero, puesto que varios miembros pueden pertenecer al mismo club. Esto es, si un individuo gasta una cantidad suficiente de dinero en consumo ostentoso será clasificado como “rico”, y pertenecerá al grupo de personas con esa etiqueta, lo cual es algo que disfruta. En este caso, el gasto en consumo ostentoso puede analizarse dentro de los modelos de la Economía de la Información. Básicamente, dice lo siguiente: sea que hay gente normal y gente rica (si hablamos de gente rica y gente más rica, nada cambia), pero que no pueden ser distinguidas. En estas circunstancias podemos tener el siguiente equilibrio. Hay un nivel X de consumo ostentoso tal que:

  • Todo el mundo en la sociedad cree que los individuos con un nivel de consumo ostentoso igual o superior a X son ricos, que los individuos con un nivel inferior a X son normales.
  • Los individuos ricos están mejor gastando la cantidad X en consumo ostentoso y disfrutando la etiqueta de “rico” que no gastando esa cantidad y no tener la etiqueta.
  • Los individuos normales están mejor gastando menos de X en bienes ostentosos y no disfrutando de la etiqueta de “rico” que lo contrario.
(Continúa aquí)

Referencias:


2. Mandler, M. 2018. Piracy versus monopoly in the market for conspicuous consumption. The Economic Journal, 128 1257–1275.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Los efectos de la inmigración en el mercado de trabajo (1).
Y también: Los efectos de la inmigración en el mercado de trabajo (2).
Hace tres años en el blog: La jugada del referéndum griego.
Y también: Once fallos en la negociación de Syriza.
-----------------------------------------------------------------------------------------------------------

miércoles, 18 de abril de 2018

Mayoría con veto versus unanimidad (2)

Esta es la segunda parte de la versión en español de mi artículo de marzo en Mapping Ignorance. Debe leerse la primera parte para entender esta.


El ejemplo de la entrada anterior ilustra los dos resultados de Bouton et al. (2018) [1]: 
  1. Las reglas mayoritarias con poder de veto son preferidas a la regla de unanimidad por todos los votantes.
  2. Las reglas mayoritarias con poder de veto son eficientes ex-ante (seleccionan la opción que los votantes estiman correcta antes de conocer su información privada) en una clase amplia de situaciones. 
En el ejemplo, la regla de mayoría con derecho de vero es eficiente también si los jugadores aprenden la toda información. En casos más complicados, los agentes pueden diferir sobre la bondad de la reforma después de tener la información completa, pero si están de acuerdo que es buena con la información que tienen a la hora de emitir el voto, será eficiente ex-ante que la aprueben. 

Hay muchos más detalles para generalizar el ejemplo. Uno de los más importantes es asegurarse de que los agentes votan “bien” en el equilibrio, lo que significa que el voto estratégico no impide que el mecanismo funcione como se pretende. El agente que prefiere el statu quo siempre querrá usar su veto. Solo los agentes a quienes gusta la reforma son potencialmente problemáticos. Si la información negativa es igual de precisa que la positiva, los agentes votarán según la información que obtienen. Si hay asimetría en la información, los agentes que reciben la información menos precisa pueden estar indiferentes entre votar de una u otra manera. Mientras la información negativa no sea muy precisa, los agentes no usarán su poder de veto, pero cuando se alcanza un límite empezarán a vetar con alguna probabilidad. La clave es ver que en caso de indiferencia (entre sí y no, o entre no y veto), las probabilidades de votar de una manera u otra en equilibrio son las adecuadas para la eficiencia del resultado. 

En el equilibrio de agregación de información en el juego general, el comportamiento de los agentes puede interpretarse como una combinación entre lo que harían según la regla de unanimidad y lo que harían según la regla de mayoría (con o sin poder de veto). El veto permite a los agentes reproducir cualquier estrategia que se pueda jugar en cualquiera de las dos reglas. En particular, usan su poder de veto para proteger su interés privado (lo que no pueden hacer en la regla mayoritaria), y votarán contra la reforma (sin vetarla) cuando tengan un informe negativo, pero no concluyente, sobre ella (lo que no pueden hacer con la regla de unanimidad). 

Tras resolver el equilibrio, los autores llegan a poder estudiar la eficiencia de la regla de mayoría con veto, y muestran que los agentes la prefieren sobre la de unanimidad para una elección adecuada del número de vetos necesario para vetar de hecho una reforma. También muestran que para todos los problemas hay siempre una regla de veto que es eficiente, y que la regla de veto donde se necesita una mayoría de vetos para, efectivamente, vetar la reforma es asintóticamente eficiente a medida que el número de votantes tiende a infinito. 

En palabras de los autores, además de las fuertes propiedades teóricas, la simplicidad de la regla del veto la hace particularmente atractiva en aplicaciones reales. Como se ha discutido, hay grupos de agentes que usan este sistema o alguna de sus variantes. Aún así, hay muchos otros que usan la regla de unanimidad o el consenso, incluyendo la OTAN, el Consejo de la UE en temas sensibles, y Mercosur. Los resultados sugieren que (i) deberían considerar el uso de la regla del veto, y que (ii) esta reforma institucional no debería encontrar mucha resistencia. 

Referencias: 

Bouton, L.; Llorente-Saguer, A., y Malherbe, F. 2018. Get Rid of Unanimity Rule: The Superiority of Majority Rules with Veto Power. Journal of Political Economy 126:1, 107-149.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: El bitcoin explicado sin tonterías.
Hace tres años en el blog: Shakespeare escéptico y burlón.
-----------------------------------------------------------------------------------------------------------

lunes, 16 de abril de 2018

Mayoría con veto versus unanimidad (1)

Esta es la primera parte de la versión en español de mi artículo de marzo en Mapping Ignorance.


En muchas decisiones de grupo se requiere unanimidad para asegurarse que una reforma será adoptada solamente si beneficia a todos los miembros. Las organizaciones multinacionales son tal vez el mejor ejemplo de este hecho. Sin embargo, cuando los miembros tienen información incompleta y privada sobre la conveniencia de la reforma, la regla de mayoría con poder de veto funciona mejor en el sentido de que sería preferida a la regla de unanimidad por parte de todos los participantes antes de que adquieran su información privada. Esta es la tesis del trabajo de Bouton et al. (2018) [1].

Considérese el siguiente ejemplo. Hay tres agentes que tienen que votar sobre si adoptar una reforma o mantener el statu quo. La reforma puede ser buena o mala para todos con iguales probabilidades. Si los agentes supieran que es buena, todos la votarían. En caso contrario, votarían contra ella. Los tres quieren evitar un error en cualquier sentido. Antes de votar, cada agente puede obtener información privada que básicamente indica que la reforma será buena o mala. Sin embargo, la información no está libre de error. Con probabilidad 2/3 la información es correcta. La información recibida por un agente es estadísticamente independiente de la recibida por los otros. Así, si la reforma va a ser buena, la probabilidad de que los tres agentes reciban una información positiva es 2/3x2/3x2/3 = 8/27, la probabilidad de dos positivos y un negativo es 3x2/3x2/3x1/3 = 4/9 (nótese el primer tres en la multiplicación es necesario puesto que la información negativa puede venir de cualquiera de los tres agentes), la probabilidad de un informe bueno y dos negativos es 3x2/3x1/3x1/3 = 2/9, y, finalmente, la probabilidad de tres informes negativos es 1/3x1/3x1/3 = 1/27. Cálculos similares muestran que si la reforma va a ser mala, las probabilidades de tres, dos uno o ningún informe negativo son 8/27, 4/9, 2/9 y 1/27, respectivamente. Usando la regla de Bayes uno puede comprobar que si hay dos informes positivos la probabilidad de que la reforma sea buena es 2/3: la probabilidad de dos positivos si la reforma es buena es 4/9 y si es mala, 2/9, dando una proporción de 4 a 2 (o 2 a 1) a favor de la hipótesis de que la reforma es buena. De manera similar, dos informes negativos implican que la reforma es buena con probabilidad 1/3. 

Así, en este ejemplo, si hay al menos dos informes positivos, la reforma debería ser aprobada según las expectativas de los tres agentes. El agente que recibe el informe negativo quiere que la reforma se apruebe si los otros dos agentes reciben sendos informes positivos. Si votaran basándose solo en su información privada, el agente con el informe negativo votaría en contra. La regla de unanimidad implicaría que la reforma no se aprobaría con dos votos, mientras que la regla de mayoría implicaría que sería aprobada. 

En el ejemplo, todos los agentes prefieren la reforma si esta es buena. Si lo complicamos para incluir la posibilidad de que algunos agentes prefieran el statu quo incluso si la reforma es buena, la regla de mayoría no mejoraría para estos agentes, pero la regla de mayoría con derecho de veto, sí lo haría. Con esta nueva regla, el agente que prefiere el statu quo vetaría la reforma, mientras que el agente que prefiere una buena reforma, pero recibe un informe negativo votará en contra (o se abstendrá), pero no ejercerá el poder de veto. Así, la reforma saldrá adelante sí y solo sí es satisfactoria para todos los miembros.

Referencias:

Bouton, L.; Llorente-Saguer, A., y Malherbe, F. 2018. Get Rid of Unanimity Rule: The Superiority of Majority Rules with Veto Power. Journal of Political Economy 126:1, 107-149.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Cuándo funciona bien la planificación.
Hace tres años en el blog: Sobre la definición de pseudociencia.
Y también: La debilidad del marxismo y del psicoanálisis.
-----------------------------------------------------------------------------------------------------------

sábado, 25 de noviembre de 2017

Hacia una teoría de la economía del comportamiento (1)

Esta es la primera parte de la versión en español de mi artículo de octubre en Mapping Ignorance.


La Teoría de Juegos estudia modelos matemáticos de decisión estratégica. Históricamente, la primera aproximación fue estudiar las interacciones de individuos perfectamente racionales, con preferencias completas y transitivas y que son suficientemente inteligentes para analizar el juego en que están. Este es un enfoque normativo: viene a decir qué se debe hacer si se acepta que tanto los demás como uno mismo somos racionales. Hay otras normas posibles, pero esta es la que se ha estudiado más ampliamente. Pronto se hizo evidente que el modelo racional era una pobre descripción del comportamiento real en muchos juegos. Se propusieron y estudiaron entones nuevas teorías con un enfoque descriptivo (aprendizaje, complejidad, comportamiento en manada, imitación, adaptación evolutiva, etc.), pero en los últimos años algunos modelos de comportamiento han ganado notoriedad. Wright y Leyton-Brown (2017) [1] toman los cinco modelos más usados y llevan a cabo un meta-análisis para encontrar cuál de ellos funciona mejor como teoría descriptiva.

En la base de todas las teorías del comportamiento está el concepto de “respuesta”: cómo reaccionan los individuos en un determinado ambiente que, en el caso de la Teoría de Juegos, incluye el comportamiento de los demás. En el modelo racional –y su concepto clave, el equilibrio de Nash-, los jugadores siempre responden eligiendo su mejor respuesta dadas las acciones de los demás. A continuación describimos cinco teorías del comportamiento en términos de sus supuestos acerca de la manera en que los jugadores responden a lo que asumen es el comportamiento de los demás.

Equilibrio de respuesta cuantal (Quantal response equilibrium, QRE)

McKelvey y Palfrey (1995) [2] proponen que los individuos eligen las mejores respuestas con probabilidades más elevadas. Más específicamente, la probabilidad de elegir una acción determinada es proporcional al valor de la función exponencial donde el exponente es la utilidad del individuo multiplicada por una constante C. Esta constante le da al modelo un grado de libertad que, cuando vale cero, implica un comportamiento aleatorio y que se aproxima a la mejor respuesta racional a medida que C tiende a infinito.

Modelo nivel-k (level-k model)

De acuerdo con este modelo, propuesto por Costa-Gomes et al,. 2001 [3], los individuos son capaces de alcanzar únicamente k niveles de razonamiento. Un nivel 0 implica que los individuos eligen su acción de manera aleatoria. El nivel 1 implica que los individuos eligen la estrategia que maximiza su utilidad si todos los demás jugadores usan un nivel 0 de razonamiento. Por inducción, un nivel k significa que cada individuo elige la estrategia que maximiza su utilidad si todos los demás usan un nivel k-1 de razonamiento. Los autores consideran un modelo particular de nivel k en el que (i) un jugador puede ser de nivel 1, 2 o 3, (ii) los jugadores de nivel 1 y 2 comenten algún error cuando eligen su estrategia, y (iii) la predicción de las acciones es la media ponderada de las distribuciones de cada nivel. Este modelo tiene cuatro parámetros: las proporciones de los individuos de nivel 1 y 2, y las probabilidades de cometer un error por parte de esos mismos individuos.

Jerarquía cognitiva

Al igual que los modelos de nivel k, el modelo de jerarquía cognitiva, propuesto por Camerer et al. (2004) [4], se basa en un razonamiento iterativo. Difiere de los modelos de nivel k en dos aspectos. Primero, los jugadores no cometen errores y, segundo, un jugador de nivel k elige su mejor respuesta frente a la distribución completa de agentes de nivel 0, 1,…, k-1, y no solo frente a los de nivel k-1. Además, la proporción de jugadores de distintos niveles está gobernada por una distribución de probabilidad particular, la distribución de Poisson. Este modelo tiene únicamente un parámetro libre, el necesario para determinar la distribución de Poisson.

(Continua aquí.)

Referencias

1. Wright, J.R., y Leyton-Brown, K. 2017. Predicting human behavior in unrepeated, simultaneous-move games. Games and Economic Behavior 106, 16-37.

2. McKelvey, R., y Palfrey, T.,1995. Quantal response equilibria for normal form games. Games and Economic Behavior. 10 (1), 6–38.

3. Costa-Gomes, M.; Crawford, V., y Broseta, B. 2001. Cognition and behavior in normal-form games: an experimental study. Econometrica 69 (5), 1193–1235.

4. Camerer, C., y Hua Ho, T. 1999. Experience-weighted attraction learning in normal form games. Econometrica 67 (4), 827–874.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: ¿Cuánto ha producido España en los últimos años?
Y también: ¿Dónde están los liberales?
Y también: Índices de poder en el parlamento catalán.
Hace tres años en el blog: Odiosa comparación (6).
-----------------------------------------------------------------------------------------------------------

sábado, 26 de agosto de 2017

¿Sabemos lo que quiere el pueblo?


La irrupción de los nuevos partidos ha atraído una renovada atención por los sistemas de votaciones. En esta entrada voy a recordar un ejemplo que se deberíamos estudiar todos desde pequeñitos, antes de que nos dejen votar. Es muy sencillo e ilustra cómo no existe “lo que quiere el pueblo”, la antesala al concepto de que no existe un sistema de votación (o de agregación de preferencias) que tenga todas las propiedades que nos gustaría (ver aquí).

Pongamos que hay una sociedad con 100 personas divididas en seis partidos (PT, PU, PV, PX, PY y PZ). Deben elegir entre cinco propuestas distintas, pero cada grupo las ordena de mejor a peor según se indica en la tabla.

Partido (# personas)
PT (33)
PU (16)
PV (3)
PX (8)
PY (18)
PZ (22)

---------
---------
--------
--------
---------
---------
Ránking
A
B
C
C
D
E
B
D
D
E
E
C
C
C
B
B
C
B
D
E
A
D
B
D
E
A
E
A
A
A

Por ejemplo, las 100 personas pueden ser parlamentarios, los grupos, partidos políticos y las propuestas, candidatos a la presidencia.

Cuál es el candidato que debe ser elegido? Es pregunta trampa, no hay tal cosa como “el que debe ser elegido” (enunciado normativo) sin hacer referencia a una norma, y la norma puede ser una entre muchas, sin que ninguna de ellas sea claramente la más justa y mejor. Tomemos cinco posibles normas (sistemas de votación) y veamos quién gana si las personas votan sinceramente:

Regla de la pluralidad (mayoría relativa): Cada uno vota la propuesta preferida y la que más votos obtenga es la que sale elegida.

Gana A con 33 votos frente a los 16 de B, los 11 de C, los 18 de D y los 22 de E.

Recuento de Borda: Cada votante asigna cuatro puntos a su propuesta preferida y luego tres, dos, uno y cero a cada una de las siguientes según decrezcan sus preferencias. Gana la que más puntos tenga.

Gana B, que suma 33x1 + 16x4 + (3+8+22)x2 + 18x1 = 171 puntos, más que cualquier otro (p.e., A suma 33x4 + 3x1 = 136).

Método de Condorcet: Gana aquella propuesta que vence a cada una de las demás por separado. (No siempre hay un ganador de Condorcet).

Gana C: Cuando se enfrenta a A, C tiene 77 votos (y A el resto hasta 100). Frente a B, D, y E, la propuesta C tiene 51, 66 y 60, respectivamente.

Voto único transferible (segunda vuelta instantánea): Se vota una primera ronda, la propuesta con menos votos se elimina. Se vota una segunda vuelta entre las restantes, de nuevo se elimina la menos votada. Así hasta que solo queda una.

Gana D: En al primera ronda se elimina C. En la segunda ronda, de los 11 que votaron C, 3 votarán D y 8 votarán E (de ahí lo de transferible) y se eliminará B. En tercera ronda los 16 votos de B pasan a D y la cosa queda: A con 33, D con 37 y E con 30, con lo que se elimina E. Entre A y D gana D con 77 votos.

Doble vuelta: Los dos con más votos en una primera vuelta se enfrentan en segunda vuelta. Quien más votos tenga en la segunda vuelta, gana.

Gana E: En primera vuelta A y E quedan primero y segundo, respectivamente. En la segunda vuelta A obtiene 36 votos frente a los 64 de E.

Pues eso. ¿Qué quiere el pueblo?

----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: La economía de la discriminación (4).
-----------------------------------------------------------------------------------------------------------

domingo, 20 de agosto de 2017

La Teoría de Juegos y el dilema discursivo (2)

Esta es la segunda parte de la versión en español de mi artículo de mayo en Mapping Ignorance. Debe leerse la primera parte para entender esta.


Clipper y Eliaz (2015) [2] usan los juegos bayesianos para desarrollar su análisis. Esto significa que las distintas creencias de los miembros del jurado se deben a que cada miembro tiene acceso a distinta información. En el modelo bayesiano, ex-ante todos los miembros del jurado están de acuerdo en las probabilidades a priori de que cada premisa sea cierta. En un segundo momento cada miembro del jurado tiene acceso a una información privada (llamada señal) a partir de la cual pueden actualizar sus creencias de acuerdo con la regla de Bayes. Como cada uno puede recibir información distinta, los tres miembros pueden acabar con distintas creencias acerca de las premisas. En el modelo de Clipper y Eliaz (2015) la señal está restringida a los valores 0 y 1 para cada una de las premisas y las reglas de decisión comprenden todas la reglas super-mayoritarias (una proposición es aceptada si una mayoría cualificada de los votantes están de acuerdo en que es cierta, donde el valor cualificación puede ser cualquier proporción de votantes entre la mitad, para una mayoría simple, hasta la casi unanimidad).

Expliquemos esto con el ejemplo primero. Hay cuatro posibilidades para el verdadero estado: (1,1), (1,0), (0,1) y (0,0), donde un 1 en la primera posición de la señal significa “la primera premisa es cierta”. Un cero significa “falsa”, y la segunda posición se refiere a la segunda premisa. Hay una probabilidad a priori de que cada uno de estos estados posibles sea cierto y los tres miembros del jurado conocen estas probabilidades. A partir de ahí cada miembro recibe una señal sobre el estado. En el caso más simple hay tantas señales como estados. El primer miembro del jurado recibirá una señal correcta o incorrecta con unas probabilidades. Por ejemplo, si el estado verdadero es (1,1), puede recibir la señal (1,1) con probabilidad 0,7, la señal (1,0) con probabilidad 0,2 y cada una de las señales (0,1) y (0,0) con probabilidad 0,05. Los otros dos miembros recibirán sus señales con sus propias probabilidades. Cada miembro del jurado desconoce las señales que reciben los otros, pero sabe las probabilidades. Usando la regla de Bayes, cada miembro del jurado puede calcular la probabilidad de que cada premisa sea cierta y puede también calcular la probabilidad que cada uno de los otros miembros asignará a cada premisa dependiendo de qué señales reciben.

En el juego de la premisas, después de recibir las señales, los miembros votan sí o no a cada proposición de la forma “la premisa x es cierta”. Según los votos, una premisa se declarará cierta o falsa. En el juego de los resultados, votan a favor o en contra de la aceptar la conclusión lógica. En ambos casos cada miembro del jurado quiere minimizar la distancia esperada entre la decisión y el estado verdadero. Por ejemplo, si el estado verdadero implique que el candidato debe ser aceptado (1), pero en equilibrio se acepta solo con probabilidad 0,6, la distancia será 1-0,6=0,4. Por supuesto, los miembros no saben si el estado cierto implica que el candidato deba ser aceptado, pero pueden calcular las probabilidades de acuerdo con las señales recibidas y, a partir de ahí, calcular el valor verdadero esperado y la distancia esperada entre el equilibrio y el este valor.

En el modelo, los autores logran probar los siguientes teoremas:
  1. Para cada grupo finito de individuos, recabar opiniones sobre las premisas es sistemáticamente por lo menos tan bueno como recabarlas sobre los resultados, pero lo contrario no es cierto. Para ser más precisos, la primera parte dice que para cada equilibrio de Nash bayesiano simétrico en el juego basado en resultados existe un equilibrio de Nash bayesiano en el juego basado en premisas tal que, par cada vector de realizaciones de la señal, el perfil estratégico del segundo juego induce la misma distribución de probabilidad sobre las decisiones que el primero.
  2. Genéricamente, las ganancias del juego basado en las premisas sobre el juego basado en el resultado solo pueden llegar a ser marginales cuando muchos individuos expresan su opinión independientemente.
  3. Ambos procedimientos son casi siempre eficientes asintóticamente.
En lenguaje llano, la conclusión puede resumirse así: a pesar de que el método basado en las premisas es mejor que el basado en los resultados, solo lo es de manera marginal, puesto que ambos métodos tienden a ser eficientes cuando el número de miembros aumenta, excepto en casos extremadamente raros.

Referencias:

2. de Clippel, G., and Eliaz, K. 2015. Premise-based versus outcome-based information aggregationGames and Economic Behavior 89, 34–42. 

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Alemania-Grecia.
Hace cinco años en el blog: El que quiera entender que entienda.
-----------------------------------------------------------------------------------------------------------

sábado, 19 de agosto de 2017

La Teoría de Juegos y el dilema discursivo (1)

Esta es la primera parte de la versión en español de mi artículo de mayo en Mapping Ignorance.


He aquí un ejemplo del “dilema discursivo” o “paradoja doctrinal”: Pongamos que hay un jurado de tres miembros que deben decidir mayoría si un candidato debe ser aceptado en un grupo. Las reglas especifican que el candidato debe cumplir dos requisitos, A y B, para ser aceptado. El primer miembro del jurado cree que el candidato cumple ambos requisitos, el segundo miembro cree que solo cumple el A, mientras que el tercero cree que solo cumple B. La paradoja aparece cuando uno compara dos métodos diferentes para decidir la admisión del candidato.

El primer método requiere que el jurado vote sobre si el candidato cumple el requisito A y, a continuación, sobre si cumple el B. Si el candidato obtiene una mayoría en ambas votaciones, será aceptado. Dos de los tres miembros creen que se satisface la condición A (el primero y el segundo así lo creen), y también dos de tres creen que se satisface la condición B (ahora lo creen el primero y el tercero). De acuerdo con este método el candidato es aceptado.

El segundo método requiere que el jurado vote directamente si piensa que el candidato debe ser aceptado. Ahora solamente el primer miembro piensa que se cumplen ambas condiciones y votará a favor. Los otros dos, al creer que una de las dos condiciones no se cumplen, votarán en contra.

Podemos entender los dos métodos de votación como dos maneras diferentes de agregar información. La paradoja muestra que la regla mayoritaria da resultados inconsistentes cuando agrega información sobre las premisas frente a la situación cuando agrega las conclusiones. En el ejemplo, la conclusión se sigue de la conjunción de las premisas, pero se podrían usar otras proposiciones lógicas para mostrar la paradoja. Más aún, numerosos resultados han mostrado que este no es un problema especial de la regla mayoritaria. De hecho, estos resultados muestran que es imposible encontrar un método de agregación que ofrece juicios lógicamente consistentes, esto es, que dan el mismo resultado sin importar sin se agregan premisas o conclusiones. Para obtener un panorama de sobre estos resultados léase List y Puppe (2009) [1].

Dada la imposibilidad de encontrar consistencia, la siguiente cuestión es saber qué procedimiento, agregar opiniones acerca de premisas o resultados, es la mejor. Para enfrentarse a este problema, lo primero que se necesita es especificar qué significa “mejor”. Clippel y Eliaz (2015) [2] comparan ambos procedimientos en términos de su capacidad para agregar información en presencia de individuos que toman decisiones estratégicas y que tienen intereses comunes. Contrariamente a lo que se asumía en el ejemplo introductorio, los individuos estratégicos pueden votar o no de acuerdo con su información privada (la literatura sobre votaciones está llena de ejemplos en que los votantes no lo hacen). El interés común significa que todos los votantes quieren lo mismo: agregar la información y generar una correcta conclusión a partir de premisas correctas. In nuestro ejemplo eso significaría que los tres miembros del jurado quieren que el candidato sea aceptado si se cumplen las premisas y quieren saber si estas premisas se cumplen verdaderamente. Las consideraciones estratégicas en la paradoja doctrinal han sido estudiadas por primera vez en Dietrich y List (2007) [3], pero solo para agregadores por unanimidad (donde todas la premisas deben ser ciertas para que se cumpla la conclusión).

Referencias:

1. List, C., and Puppe, C. 2009. Judgement aggregation. In Handbook of Rational and Social Choice, pp. 457–483. Chapter 19.

2. de Clippel, G., and Eliaz, K. 2015. Premise-based versus outcome-based information aggregation. Games and Economic Behavior 89, 34–42. 

3. Dietrich, F., and List, C. 2007. Strategy-proof judgment aggregation. Economics and Philosophy 23, 269–300.

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Sobre el nacionalismo (2).
Y también: Economistas contra la crisis y el hombre de paja.
Hace cinco años en el blog: ¿El 99%?
Y también: O ano da morte de José Saramago.
-----------------------------------------------------------------------------------------------------------

sábado, 29 de julio de 2017

Al monte se va con botas: La paradoja del examen sorpresa.


Una profesora anuncia un examen sorpresa para la semana siguiente. Los alumnos razonan de la siguiente manera. El viernes no podrá ser, puesto que si llega el viernes sin haber tenido examen, sabremos que será ese día. El jueves tampoco podrá ser, puesto que hemos descartado el viernes, así que si llega el jueves, tampoco será sorpresa. Por inducción, no podrá ser ningún día de la semana. Los alumnos deducen que la profesora no podrá poner ningún examen sorpresa.

Para asombro de todos, llega el miércoles y la profesora pone el examen.

La paradoja está resuelta desde hace muchos años. Se trata de mostrar que el enunciado de la profesora consta de varias proposiciones incompatibles entre sí. Lo vemos mejor si la semana solo tuviera dos días. Así, la profesora está diciendo:

  1. Si el examen es el día 1, la víspera (o ese día antes de clase) de ese día los estudiantes no sabrán que el examen es el día 1.
  2. Si el examen es el día 2, la víspera de ese día los estudiantes no sabrán que el examen es el día 2 y sabrán que no ha sido el día 1.
  3. El examen será alguno de esos dos días.
Es posible, usando las reglas de la lógica proposicional, mostrar que las tres afirmaciones no pueden ser ciertas a la vez (no lo voy a hacer). Hasta aquí no hay problema, todos los lógicos están de acuerdo. Lo que ha creado una larga confusión es que, a pesar de que la profesora ha dicho algo falso, resulta que consigue su objetivo de dar un examen sorpresa.

Llegados a este punto, la discusión ha dado lugar a decenas de artículos en revistas serias. Casi todos van al monte sin botas. Hay autores que se inventan ramas de la lógica sólo para intentar abordar la cuestión.

Borwein y compañía miden el grado de sorpresa con una definición de entropía y buscan así una estrategia para la profesora que maximice la tal entropía.
Según Shaw, la profesora hace unas afirmaciones autorreferenciales de tal manera que nada bueno se puede deducir de ellas.
Olin y Sorensen se ponen a definir “puntos ciegos” epistemológicos y no sé qué diantre hacen con ellos.
Otros se ponen a decir cosas como que saber una preposición un día no es lo mismo que saberla otro día.
Sober, que propone una buena manera de abordar el problema, sin embargo se pone a decir que hay que distinguir entre predicciones prudenciales y evidenciales para concluir no sé tampoco muy bien qué cosa.

En realidad, la cosa es más sencilla. Pensemos en una semana de dos días. Cada día la profesora decide si poner o no un examen, y cada día los alumnos apuntan un SÍ o un NO en un sobre. Si hay examen y apuntaron SÍ, o si no hay examen y apuntaron NO, no hay sorpresa. En caso contrario sí la habrá. Pongamos que la sorpresa le reporta un beneficio (felicidad, utilidad, como quiera llamarse) de 1 a la profesora y de -1 a los alumnos. La no sorpresa cambia el beneficio de cada uno. Los pagos son arbitrarios y podemos cambiarlos si se quiere.

Si no ha habido examen el día 1, el día 2 se enfrentarán al siguiente juego

Día 2
NO
Examen
-1,1
1,-1
No examen
1,-1
-1,1

La única manera de elegir consistentemente en este juego es echar a cara o cruz entre poner examen o no por parte de la profesora y escribir SÍ o NO por parte de los alumnos. El beneficio esperado para cada uno será cero.

Sabido esto, el día 1 el juego es parecido. Ambos tienen que elegir como antes, pero aquí surge un problema. Si la profesora elige no poner examen y los alumnos eligieron SÍ, ¿seguimos con el juego? Si es así, esto querría decir que los alumnos pueden anticipar el examen cada día, de manera que alguno acertarán. Una cosa sensata es decir que, en ese caso, perdieron su oportunidad y el juego se acaba. Otra es decir que esto les impide decir SÍ en el futuro, de manera que el juego del día dos tras (No examen, SÍ) habría sido trivial, con la profesora poniendo el examen los alumnos sorprendidos. Voy a seguir el primer caso, que deja así el primer día:

Día 1
NO
Examen
-1,1
1,-1
No examen
1,-1
0,0

En la casilla (No examen, No) hemos puesto ceros, que son los pagos que se esperan obtener el día siguiente. La casilla (No examen, NO) la podemos interpretar como que el juego se acaba o como que, aún siguiendo, los beneficios son (1,-1) no importa lo que pase el segundo día, porque ya se erraron los alumnos en su elección. La única manera consistente de decidir ahora es, para la profesora, elegir poner examen con probabilidad 2/3 y, para los alumnos, elegir SÍ con probabilidad 1/3. (Otras posibles variantes las tengo publicadas con Jesús Zamora aquí. Se puede leer también aquí.) En el análisis vemos claramente los dos hechos fundamentales de la paradoja:
No es posible poner un examen y que sea sorpresa. Pero esto es porque no es posible que ocurra con probabilidad uno. Vemos que, en nuestro análisis, hay una probabilidad 1/3 x 1/2 = 1/6 de que no hay examen, y una probabilidad positiva de que, habiéndolo, no sea sorpresa. Podíamos haber insistido en que debía haber examen, sólo habría que alterar el juego del día 2 y tendríamos la misma conclusión acerca de que el examen no puede se sorpresa con probabilidad 1.

¡Pero la profesora consigue poner un examen sorpresa! Esto es porque nos cuentan sólo uno de los posibles finales de la historia, cuando los dados cayeron de manera que la profesora pone el examen y los alumnos no lo adivinaron. Lo que he expuesto aquí dice que eso sólo puede pasar con alguna probabilidad si, al lado, está la probabilidad de que no pase.

Lo que ha pasado es que ni alumnos ni profesora pueden razonar al margen de lo que crean que va a hacer el otro, ni al margen de cómo valoren acertar o no, y esto nos coloca en el mundo de la Teoría de los Juegos, puesto que la lógica proposicional no podrá dar cuenta de la interacción entre las acciones y creencias de los dos jugadores. No estaban hechas esas botas para este monte.

viernes, 21 de julio de 2017

La razón moral en bancarrota


Propongo considerar un pequeño problema moral para el que la razón pura (sea lo que sea eso) es incapaz de ofrecer una solución. El ejemplo, por ser tan mundano él, no debería preocupar a los proponentes de una moral basada en la razón. Aún así lo propongo porque ayudará a entender la postura de quienes no creemos posible que la razón pueda dar ningún salto para poder deducir lógicamente la moral.

Este es el ejemplo:

Una empresa se declara en bancarrota. Sus activos están valorados en 120, pero tiene dos acreedores a quienes debe 60 y 120, respectivamente. ¿Cómo se dividen los activos entre los acreedores?
  • Regla igualitaria: Se reparte entre ellos a partes iguales, 60 para cada uno.
  • Regla proporcional: Se reparte proporcionalmente a la deuda, 40 para el primero, 80 para el segundo.
  • Regla del Talmud: El primero reclama la mitad, el segundo todo. La mitad que reclaman los dos se reparte a medias (30 para cada uno). La segunda mitad que reclama sólo el segundo es para él (60 más para el segundo). El reparto queda así: 30 para el primero y 90 para el segundo.
¿Cuál es el reparto moralmente justo?

No es posible saberlo. Cada uno obedece a un principio distinto, todos tienen en cuenta cierto principio de igualdad, pero cada regla lo trata de forma distinta. De hecho podríamos imaginarnos muchas más, todas sensatas. Podemos poner un mínimo asegurado para cada acreedor y un reparto proporcional del resto de la deuda, o hacer el reparto proporcional al logaritmo de la deuda (por aquello de que más dinero da cada vez menos felicidad), o dárselo todo al más rico (la regla Reaganiana), por poner unos pocos ejemplos más.

Esta es la discusión:

El problema es interesante porque está perfectamente definido. Si se dice que hacen falta más datos, por ejemplo sobre quién es cada uno de los acreedores, supóngase que son dos personas exactamente iguales excepto por su posición en este caso de bancarrota. Ni aún así podemos deducir una u otra regla de reparto sin mediar por medio algún otro principio que implique esa regla en particular. Esto no tiene por qué ser redundante. En teoría de juegos hay toda una rama dedicada a derivar fórmulas de reparto a partir de axiomas deseables. Ocurre que cada regla obedece a un subconjunto particular de estos axiomas y que ninguna regla los puede tener todos. En otras palabras, muchos axiomas que son deseables son incompatibles entre sí. Fijémonos que la elección de los axiomas será convencional, mientras que será la razón la que nos lleve de esa elección de principios a una regla de reparto (si es posible) o a concluir que una regla que satisfaga esos axiomas no existe.

Todo eso está muy bien, se objetará, pero la razón moral no se mete con asuntos mundanos como el de la bancarrota (con permiso del Corán, del Talmud y de los códigos civiles y mercantiles, supongo), sino con problemas más importantes. Es posible, pero mi argumento es que los intentos para sustentar una moral en la razón se enfrentarán siempre a este tipo de problemas.

¿Por qué lo creo? Por dos razones. Primera, porque en todos los problemas que se han podido analizar con rigor (bancarrota, negociación, votaciones, provisión de bienes públicos, agregación de preferencias,…) se han encontrado estos problemas. Segunda, porque los que proponen que tal empresa es posible no han conseguido avanzar un milímetro. Todos los avances han sido a partir de concesiones en los principios o a partir de una formulación de acuerdos normativos sobre qué es lo deseable: un punto económicamente eficiente, un punto aceptable tras el velo de la ignorancia, un punto de equilibrio, un punto en el que no haya envidias, una cesión de soberanía a un líder o algún otro principio por el estilo. Todo ellos serán perfectamente discutibles por personas razonables.