Mostrando entradas con la etiqueta Economía experimental. Mostrar todas las entradas
Mostrando entradas con la etiqueta Economía experimental. Mostrar todas las entradas

viernes, 18 de mayo de 2018

Qué motiva el esfuerzo (2)

Esta es la segunda parte de la versión en español de mi artículo de abril en Mapping Ignorance. Debe leerse la primera parte para entender esta.


Esta es la segunda parte de la versión en español de mi artículo de abril en Mapping Ignorance. Debe leerse la primera parte para entender esta.
Tratamiento 9: Un céntimo adicional por cada 100 puntos que será pagado al cabo de dos semanas.
Tratamiento 10: Un céntimo adicional por cada 100 puntos que será pagado al cabo de cuatro semanas.

De acuerdo con la literatura de la Economía del Comportamiento, el descuento hiperbólico se ajusta mejor a las preferencias temporales de los individuos. Sin embargo, los resultados experimentales de estos dos tratamientos, con incrementos respectivos de un 31,7% y un 29,5% comparados con el Tratamiento 2 de recompensa inmediata, son más compatibles con el descuento exponencial más usado en la literatura teórica. Los expertos tampoco acertaron en estas previsiones. (Aquí se puede leer qué son y cómo se calculan estos dos tipos de descuento, y su importancia para el diseño de mecanismos económicos).

Los siguientes tres tratamientos intentan medir las diferencias en esfuerzo cuando los incentivos se describen en términos de ganancias respecto a cuando se describen como pérdidas. De acuerdo con la literatura conductual, los efectos deberían ser mayores cuando la referencia es el pago máximo antes de mencionar pérdidas a partir de él en comparación al caso en que la referencia es el pago antes de las ganancias netas.

Tratamiento 11: Un bonus de 40 céntimos si el resultado llega a los 2000 puntos.
Tratamiento 12: Una pérdida de 40 céntimos si el resultado no llega a 2000 puntos.
Tratamiento 13: Un bonus de 80 céntimos si el resultado alcanza 2000 puntos.

El resultado es un aumento del 40-41% en el nivel de esfuerzo. Sin embargo, y contrariamente a la Economía del Comportamiento, la diferencia entre los dos primeros tratamientos no es estadísticamente significativa. Según esta misma literatura se necesita un bonus dos veces mayor para obtener los mismos resultados cuando los incentivos se describen como una ganancia frente a cuando se describen como una pérdida. El Tratamiento 13 mide esto último y encuentra que el efecto es mucho mayor del esperado (un 44% de aumento frente al 40%). Los expertos realizaron sus predicciones según esta literatura y también calcularon mal los niveles de esfuerzo en esta ocasión.

Tratamiento 14: Una probabilidad del 1% de ganar un dólar adicional por cada 100 puntos.
Tratamiento 15: Una probabilidad del 50% de ganar 2 céntimos adicionales por cada 100 puntos.

Nótese que los incentivos esperados de estos dos tratamientos son idénticos y coinciden con los del Tratamiento 2. Como era de esperar según la teoría de la utilidad esperada, la más estándar, los pagos inciertos reducen los incentivos en relación con los que ofrecen el mismo pago cierto equivalente (un incremento del 24-29% frente al 33%). Sin embargo, los resultados no validan la hipótesis estándar de la Economía del Comportamiento según la cual las probabilidades pequeñas se tienden a sobrevalorar, puesto que el Tratamiento 14 muestra un nivel de esfuerzo menor que tanto el Tratamiento 15 como el 2.

Tratamiento 16: Se informa al sujeto que muchos participantes han puntuado por encima de 2000.
Tratamiento 17: Se informa al sujeto que al final del tratamiento se revelarán las posiciones relativas.
Tratamiento 18: Se pide al sujeto que se esfuerce para ayudar en el experimento.

Estos últimos tres tratamientos se refieren a motivaciones psicológicas, sin pagos monetarios adicionales. Estos tratamientos dan los menores incrementos en los resultados (21%, 15% y 14%, respectivamente) excepto por el Tratamiento 8. Aún así son efectivos, puesto que el incremento en el esfuerzo se hace sin incurrir en costes adicionales.

Así resumen los autores los resultados:

Encontramos que (1) los incentivos monetarios en gran medida funcionan como se esperaba, incluyendo el tratamiento con un pago muy pequeño por resultado que no tiene un efecto de desplazamiento respecto al esfuerzo; (2) la evidencia es parcialmente consistente con los modelos conductuales estándar, incluyendo el warm-glow (la utilidad por donar a causas altruistas), aunque no se encuentran evidencias en lo que respecta a la ponderación de las probabilidades; (3) los motivadores psicológicos son efectivos, pero menos que los incentivos. Comparamos los resultados con las predicciones de 208 académicos. En media, los expertos anticipan varios resultados clave, como el efecto de los motivadores psicológicos. Una parte importante de los expertos, sin embargo, esperaban efectos desplazamiento, ponderación excesiva de las probabilidades pequeñas y altruismo puro, que no se encuentran en los resultados. Para mayor comparación, presentamos un meta análisis de tratamientos similares en la literatura. En general, las predicciones basadas en la literatura están correlacionadas con las predicciones de los expertos, aunque presentan un nivel inferior de aciertos.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Marxismo vs Economía moderna (1).
-----------------------------------------------------------------------------------------------------------

miércoles, 16 de mayo de 2018

Qué motiva el esfuerzo (1)

Esta es la primera parte de la versión en español de mi artículo de abril en Mapping Ignorance.


Uno de los temas de discusión dentro de la Economía del Comportamiento es la motivación del esfuerzo. A pesar de que el típico modelo económico normalmente asume incentivos monetarios, esto no excluye la existencia de otros factores, como las preferencias por ser el primero u otro tipo de beneficios psicológicos o económicos debidos a la reputación. La creciente literatura experimental en esta área ayudará a determinar en qué circunstancias funcionan mejor los distintos tipos de incentivos. En este contexto, Dellavigna y Pope (2018) [1] llevan a cabo un extensivo experimento y comparan sus resultados con la literatura teórica y experimental previa, y también con las predicciones realizadas por expertos.

Los autores usan la plataforma Amazon Mechanical Turk que les permite usar una gran muestra de sujetos experimentales a un coste muy bajo (la tarea se realiza on-line, lleva poco tiempo y es barata). La muestra consiste en casi 10.000 sujetos (cerca de 550 por tratamiento) y refleja la población de los EE.UU. excepto por una cierta sobre representación de los grupos con mayor educación y de personas jóvenes. La tarea del experimento consiste en pulsar botones; una tarea repetitiva y aburrida que se asume requerirá de incentivos para realizarse rápidamente. En todos los tratamientos los sujetos reciben un dólar por participar y, a partir de ahí, diferentes incentivos en 18 tratamientos diferentes.

Estos son los resultados de los distintos tratamientos:

Tratamiento 1: No incentivos.
Tratamiento 2: Un céntimo adicional por cada 100 puntos.
Tratamiento 3: 10 céntimos adicionales por cada 100 puntos.

Estos tratamientos constituyen la referencia sobre la que calibrar el modelo teórico de incentivos que incluye tanto los monetarios como los psicológicos. También servirán como punto de partida para compararlos con el resto de los tratamientos y para que los expertos puedan ajustar sus predicciones. La media de puntos en el Tratamiento 1 es 1521. El tratamiento 2 obtuvo un 33% más y el Tratamiento 3 todavía un 9% adicional sobre el Tratamiento 2.

Tratamiento 4: 4 céntimos adicionales por cada 100 puntos.
Tratamiento 5: Un céntimo adicional por cada 1000 puntos.

El resultado del Tratamiento 4 fue razonablemente bien previsto por los expertos y responde a lo esperado según el modelo teórico. Sin embargo, el Tratamiento 5, con una recompensa muy baja, podía haber mostrado un efecto de desplazamiento según la literatura. Cuando el incentivo es muy bajo se puede percibir como un insulto y puede inducir un nivel de esfuerzo todavía menor que en ausencia de incentivos. Sin embargo, en el Tratamiento 5 el resultado fue un 24% mayor que el Tratamiento 1 (sin incentivos), mucho mayor que el previsto por los expertos, basándose en la literatura, y cercano al valor del modelo teórico sin efecto desplazamiento.

Los siguientes tres tratamientos tienen que ver con preferencias sociales que se estudian en la literatura de la Economía del Comportamiento.

Tratamiento 6: Se donará un céntimo a la Cruz Roja por cada 100 puntos.
Tratamiento 7: Se donarán 10 céntimos a al Cruz Roja por cada 100 puntos.
Tratamiento 8: El participante recibirá un bonus de 40 céntimos por haber participado.

En ninguno de estos tres tratamientos la cantidad que recibe el participante depende de su esfuerzo. Los dos primeros miden el altruismo del sujeto, mientras que el tercero mide cómo responde a un “intercambio de regalos”. Los tratamientos 6 y 7 mostraron un nivel de esfuerzo mayor que el Tratamiento 1, pero, contrariamente a lo esperado, menor que en el Tratamiento 2, lo que indica un peso pequeño de las preferencias sociales en la motivación. El bonus incondicional de 40 céntimos en el Tratamiento 8 tuvo el menor de los efectos de entre todos los tratamientos, solo un 5% de incremento en el resultado respecto al Tratamiento 1.

(Continúa aquí).

Referencias:

1. Dellavigna, S., y Pope, D. 2018. What Motivates Effort? Evidence and Expert Forecasts. Review of Economic Studies 85, 1029–1069.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Sector privado, sector público.
Y también: Conciliando falsabilidad sí, falsabilidad no.
Hace tres años en el blog: Cómo afectan las patentes a la innovación acumulativa (1).
Y también: Cómo afectan las patentes a la innovación acumulativa (2).
Y también: Vivimos en un Universo que salpica.
Y también: De Salvados, mis primeras finanzas y altas susceptibilidades.
-----------------------------------------------------------------------------------------------------------

miércoles, 7 de febrero de 2018

Cómo extender un programa piloto (2)

Esta es la segunda parte de la versión en español de mi artículo de enero en Mapping Ignorance. Debe leerse la primera parte para entender esta.


Una generalización exitosa: enseñar en el nivel adecuado

Pratham, una organización no gubernamental india, diseñó un enfoque engañosamente simple, que se ha dado en llamar "enseñar en el nivel adecuado". La idea básica es agrupar a los niños, durante algún período del día o parte del año escolar, no según su edad, sino según lo que saben.

De los barrios pobres de Bombay a 33 millones de niños

La asociación entre los investigadores y Pratham comenzó con un ensayo controlado aleatorizado como "prueba de concepto" del Programa Balsakhi de Pratham en las ciudades de Vadodara y Mumbai, realizado entre 2001 y 2004 (Banerjee et al., 2007 [5]). Los niveles de aprendizaje de los niños participantes aumentaron en 0,28 desviaciones estándar.

A continuación, Pratham repitió este enfoque hecho en centros urbanos relativamente prósperos del occidente de India para llevarlo a las áreas rurales, donde se vieron forzados a depender en gran medida de voluntarios en lugar de maestros remunerados. Para facilitar este cambio, la pedagogía se volvió más estructurada y más formal, con énfasis en la realización de pruebas frecuentes. Todo ello requirió diseñar una nueva evaluación aleatorizada para probar el modelo basado en voluntarios en el contexto mucho más problemática de las zonas rurales del norte de la India.

Los resultados fueron muy positivos, pero también revelaron nuevos desafíos: el entusiasmo de los voluntarios disminuía con el tiempo, las clases terminaban prematuramente, y solo el 12% de los niños elegibles participaron en el programa, dejando atrás desproporcionadamente a los estudiantes del extremo inferior.

Un primer intento de generalizar con el gobierno

A partir de 2008, Pratham y Abdul Latif Jameel Poverty Action Lab se embarcaron en una serie de nuevas evaluaciones para medir los resultados del enfoque de Pratham al integrarse con el sistema escolar del gobierno.

Se llevaron a cabo diferentes implementaciones para determinar las causas del éxito o el fracaso. En las intervenciones en que el programa proporcionaba material escolar o material más capacitación no encontraron ningún efecto. Cuando se agregaron voluntarios al programa, la evaluación mostraba un impacto positivo en Bihar, pero no en Uttarakhand, los dos estados donde se realizó el estudio. A primera vista, parecía que el hecho de que las escuelas no utilizaran a los voluntarios según lo previsto (formaban parte del equipo escolar) podría ser la razón por la cual la intervención de Uttarakhand no funcionó. Sin embargo, un análisis cuidadoso mostró que la razón no era la distinción entre voluntarios y maestros de escuela del gobierno, sino entre el personal que incorporaba el aspecto de enseñanza específico y el que no. En otras intervenciones, donde el programa fue implementado por maestros de escuela durante los campamentos de verano, arrojó resultados positivos. ¿Por qué no se tienen estos resultados cuando el programa se aplica durante el día escolar normal?

Conseguir que los maestros se tomen la intervención en serio

Primero, se hicieron todos los esfuerzos para enfatizar que el programa fue totalmente respaldado e implementado por el gobierno, en lugar de una entidad externa. Segundo, el programa se implementó en una hora específica durante la jornada escolar. Este cambio envió una señal de que la intervención era ordenada por el gobierno, rompió la inercia del statu quo de seguir rutinariamente el plan de estudios y facilitó el cumplimiento. Tercero, durante la hora extra, los niños fueron reasignados y trasladados físicamente a las aulas en función de los niveles. Esto eliminó la discreción del maestro sobre si agrupar a los niños por logros.

Esta nueva versión del programa se evaluó en el año escolar 2012-2013 en 400 escuelas, de las cuales 200 recibieron el programa. Esta vez los resultados fueron positivos. Aún así, en áreas donde esto era difícil de implementar porque la cultura de la enseñanza era muy débil (Pratham) y con el permiso de la administración del distrito, se desarrolló el modelo de "Campamentos de aprendizaje" dentro de la escuela utilizando voluntarios.

Se necesitaron cinco ensayos de control aleatorio y varios años para recorrer la distancia de un concepto a una política exitosa a gran escala, beneficiando a millones de niños.

Referencias

1. Banerjee, A.; Banerji, R.; Berry, J.; Duflo, E.; Kannan, H.; Mukerji, S.; Shotland, M., y Walton, M. 2017. From Proof of Concept to Scalable Policies: Challenges and Solutions, with an Application. Journal of Economic Perspectives 31(4), 73–102.

5. Banerjee, A.; Cole, S.; Duflo, E., y Linden, L. 2007. Remedying Education: Evidence from Two Randomized Experiments in India. Quarterly Journal of Economics 122(3), 1235–64.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Ignorancia supina sobre las pensiones.
-----------------------------------------------------------------------------------------------------------

lunes, 5 de febrero de 2018

Cómo extender un programa piloto (1)

Esta es la primera parte de la versión en español de mi artículo de enero en Mapping Ignorance.


La economía necesita teoría, experimentos de laboratorio, datos históricos y pruebas de campo. Los programas piloto y los ensayos controlados aleatorios son particularmente creíbles desde el punto de vista de su validez interna. Sin embargo, los resultados de estos programas y ensayos son más bien una "prueba de concepto" y no se extienden necesariamente más allá del contexto en el que se implementan y pueden no mantenerse si se generalizan.

Banerjee et al. (2017) [1] estudian seis desafíos principales para extraer conclusiones de ensayos controlados aleatorios localizados: efectos de equilibrio de mercado, efectos indirectos, reacciones políticas, dependencia del contexto, aleatorización o sesgo de selección del sitio, y sesgo de prueba. A continuación, documentan la superación de algunos de estos desafíos usando como ejemplo una intervención exitosa que comenzó con una organización no gubernamental en algunos barrios marginales, y se desarrolló a una política implementada a escala por los gobiernos estatales en India. Aquí presentamos un resumen de su trabajo usando párrafos seleccionados del artículo.

Los desafíos

1. Efectos de equilibrio de mercado

El primer desafío debería ser familiar para los economistas. Una implementación a pequeña escala puede tener solo consecuencias de equilibrio parcial, mientras que una implementación a gran escala puede afectar el equilibrio general. Como consecuencia, los resultados de un programa a pequeña escala pueden subestimar o sobreestimar los resultados es caso de ser generalizado. Por ejemplo, otorgar una beca a un pequeño grupo de estudiantes puede tener un gran efecto en el grupo, pero una generalización de las becas aumentará el logro educativo en toda la población, disminuyendo el rendimiento general de la educación (Heckman et al., 1998). [2]).

Como otro ejemplo, considérese el bajo impacto de los microcréditos en los beneficiarios según los ensayos de control aleatorizados (Barnejee et al., 2105 [3] revisan esta literatura). Sin embargo, el repentino colapso del microcrédito en Andhra Pradesh, India, debido a razones políticas y no a razones económicas, causó un gran efecto negativo en las comunidades donde se utilizó. Aunque el mecanismo no se entiende completamente, parece que el microcrédito tiene un efecto multiplicador donde se implementa, algo que no se habría capturado en los microdatos.

2. Efectos indirectos (spillovers)

Muchos tratamientos realizados en un colectivo tienen efectos indirectos en colectivos vecinos, lo que implica que esos colectivos no son grupos de control ideales. Algunos efectos indirectos están relacionados con la tecnología. Por ejemplo, las lombrices intestinales son contagiosas, por lo que si un niño es desparasitado, esto afectará también a su vecino. Otros fuentes de efectos indirectos son causas informativas: cuando se introduce una nueva tecnología (como una tela mosquitera de cama tratada con insecticida de larga duración); las primeras personas que están expuestas a ella pueden no aceptarla o usarla adecuadamente.

3. Reacciones políticas

Las reacciones políticas, incluida la resistencia o el apoyo a un programa, pueden variar a medida que los programas se amplían. Es probable que los funcionarios corruptos se interesen en aprovecharse de los programas una vez que alcanzan cierto tamaño (Deaton 2010 [4]).

4. Dependencia del contexto

Las evaluaciones generalmente se llevan a cabo en unas pocas ubicaciones (cuidadosamente elegidas), con organizaciones específicas. ¿Se extenderían los resultados en una configuración diferente (incluso dentro del mismo país)? ¿Dependerían de algunas características observadas o no observadas de la ubicación donde se llevó a cabo la intervención?

5. Aleatorización o sesgo de selección del sitio

Las organizaciones o individuos que aceptan participar en un experimento temprano pueden ser diferentes del resto de la población. Esto puede deberse a que los socios dispuestos son particularmente competentes y motivados, porque los que tienen más probabilidades de beneficiarse también tienen más probabilidades de ser tratados, o porque la organización, sabiendo que será evaluada, elige una ubicación o un subgrupo donde se espera que los efectos sean particularmente grandes.

6. Control del sesgo / desafíos de implementación

Un programa a gran escala será dirigido inevitablemente por una burocracia también a gran escala. El monitoreo intenso que es posible en un programa piloto puede que ya no sea factible cuando eso ocurra, o puede requerir un esfuerzo especial.

Referencias 

1. Banerjee, A.; Banerji, R.; Berry, J.; Duflo, E.; Kannan, H.; Mukerji, S.; Shotland, M., y Walton, M. 2017. From Proof of Concept to Scalable Policies: Challenges and Solutions, with an Application. Journal of Economic Perspectives 31(4), 73–102. 

2. Heckman, J. J.; Lochner, L., y Taber, C. 1998. Explaining Rising Wage Inequality: Explorations with a Dynamic General Equilibrium Model of Labor Earnings with Heterogeneous Agents. Review of Economic Dynamics 1, 1–58. 

3. Banerjee, A.; Karlan, D.; y Zinman, J. 2015. Six Randomized Evaluations of Microcredit: Introduction and Further Steps. American Economic Journal: Applied Economics 7(1), 1–21. 

4. Deaton, A. 2010. Instruments, Randomization, and Learning about Development. Journal of Economic Literature 48(2), 424–55.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Política ficción.
Hace tres años en el blog: El papel del Gobierno en la financiación del sistema de salud (1).
Y también: El papel del Gobierno en la financiación del sistema de salud (2).
-----------------------------------------------------------------------------------------------------------

lunes, 27 de noviembre de 2017

Hacia una teoría de la economía del comportamiento (2)

Esta es la segunda parte de la versión en español de mi artículo de octubre en Mapping Ignorance. Debe leerse la primera parte para entender esta.

Cuantal de nivel k (QLk)

Stahl y Wilson (1994) [5] proponen un modelo de razonamiento estratégico que combina elementos de los modelos QRE y nivel k. En QLk los agentes tienen tres niveles de razonamiento, como en el modelo nivel k, y cada agente responde a sus creencias de manera cuantal, como en QRE. El modelo se caracteriza por cinco parámetros: dos para determinar las proporciones de individuos de niveles 0, 1 y 2, y tres más para especificar una manera particular de modelar los errores: las probabilidades de cometer un error por parte de los individuos de niveles 1 y 2 y –esta es una novedad- las creencias de los jugadores de novel 2 acerca de la probabilidad de cometer un error que tienen los jugadores de nivel 1.

Introspección con ruido

Goeree y Holt (2004) [6] proponen un modelo en el que los niveles de razonamiento estratégico no están limitados a un número fijo. Como otros modelos, considera una mezcla de diferentes jugadores con diferentes niveles de razonamiento. Además, el modelo requiere un vector de parámetros para definir la distribución de los tipos de jugadores, un parámetro por los errores de los individuos de nivel 0 y un último parámetro que determina cuán rápidamente aumentan los errores con el nivel de razonamiento. Sin embargo, los autores muestran que el modelo converge a una única predicción tras un número finito de iteraciones en el nivel de razonamiento estratégico no importa cuál sea la elección de parámetros que definen la distribución de jugadores. De esta manera solamente dos parámetros son realmente importantes.

Comparando los modelos

Los modelos predicen no solo las probabilidades de elegir una estrategia, sino también una distribución de probabilidad completa sobre el conjunto de posibles estrategias. Así, uno no puede simplemente ordenar qué tal predicen los modelos la elección de una estrategia en particular. De acuerdo con esto, los autores usan el criterio de verosimilitud: para cada dato de un juego experimental computan la probabilidad de las acciones observadas de acuerdo con la predicción del modelo.

Hay un segundo problema que surge por tener los modelos distintos grados de libertad dados por los parámetros necesarios para su especificación. Tras descartar tres posibilidades, los autores siguen el enfoque usado en el aprendizaje automático (machine learning). Primero calibran los parámetros de cada modelo que mejor se ajustan a un subconjunto de los datos experimentales y después evalúan el modelo resultante en el resto de los datos. Para este propósito, los datos experimentales se dividen aleatoriamente en dos conjuntos, uno para la calibración y el otro para la comprobación.

Como los autores están interesados en comparar la verosimilitud de los datos experimentales y puesto que el equilibrio de Nash asigna una probabilidad cero a cualquier estrategia que no sea una mejor respuesta, hace falta una modificación del equilibrio de Nash. Los autores introducen una probabilidad de que los jugadores cometan errores, de manera que cualquier resultado tiene una probabilidad positiva. De esta manera se pueden aplicar las técnicas de calibración usadas en otros modelos.

Hay todavía más complicaciones que resolver, como la interpretación de los parámetros, su robustez y la comparación entre modelos con diferentes grados de libertad. De especial importancia es considerar variaciones de los modelos, puesto que algunos de ellos parecen depender de supuestos arbitrarios.

Tras construir su conjunto de datos con todos los experimentos publicados sobre los diferentes modelos para juegos no repetidos, y tras resolver las cuestiones antes mencionadas, los autores encuentran que el mejor modelo, con diferencia, es el cuantal de nivel k (QLk). Este resultado contradice sugerencias anteriores a favor del modelo de jerarquía cognitiva. Los autores van más allá y proponen algunos cambios en el modelo que reducen el número de parámetros a tres y que aun así aumenta su poder predictivo. De acuerdo con los autores, los buenos resultados de QLk se deben a su combinación de razonamiento acotado e iterativo, y de errores proporcionales a los costes. Estas características del modelo pueden describir el razonamiento humano o pueden simplemente ser una aproximación al comportamiento humano mejor que la acostumbrada especificación de errores uniformes.

Referencias

5. Stahl, D., y Wilson, P. 1994. Experimental evidence on players’ models of other players. Journal of Economic Behavior and Organization 25 (3), 309–327.

6. Goeree, J.K., y Holt, C.A. 2004. A model of noisy introspection. Games and Economic Behavior 46 (2), 365–382.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Ciencia, pseudociencia y periodismo.
Hace tres años en el blog: La presentación de la propuesta económica de V. Navarro y J. Torres para Podemos.
-----------------------------------------------------------------------------------------------------------

sábado, 13 de mayo de 2017

Un experimento sobre el sesgo de confirmación (2)

Esta es la segunda parte de la versión en español de mi artículo de abril en Mapping Ignorance. Debe leerse la primera parte para entender esta.


Los autores explican así los resultados de estos experimentos:

Uno puede imaginar al menos tres posibles resultados ex-ante. Primero, tenemos la hipótesis nula de que el entorno no tiene efecto a la hora de adaptar el comportamiento a las distintas condiciones experimentales. Segundo, el elemento estratégico puede servir para exacerbar los errores al actualizar las estimaciones para el jugador más interesado en conocer el estado de la naturaleza, particularmente cuando las bolas extraídas favorecen su estado de la naturaleza preferido. Tercero, esta consideración adicional puede servir para mejorar los errores de actualización del jugador Par en la parte estratégica del experimento, tal vez porque esto le induce a prestar más atención a la tarea o tal vez porque el sesgo de confirmación le ayuda a contrarrestar otros sesgos en la toma de decisiones.

De hecho, encontramos que los jugadores en el papel Par son menos susceptibles de caer en el sesgo de confirmación. Encontramos un grado considerable de conservadurismo (infra-actualización) en ambos jugadores y en ambas condiciones; los individuos raramente actualizan lo suficiente según las extracciones observadas. Los individuos sí estiman alrededor del 50% en el caso sencillo en que se extraen un número igual de bolas blancas o negras. Sin embargo, encontramos que la creencia media está más cerca al 50% que lo que debería según la predicción bayesiana para cualquier otra combinación de extracciones; más aún, los resultados de nuestras regresiones indican que la tendencia a infra-actualizar es mayor para los jugadores Impar que para los Par.

Como es esperable que un individuo que sufre de sesgo de confirmación diera más peso que un bayesiano a una señal confirmatoria, se puede ver esta mejora como una simple consecuencia. Sin embargo, el efecto en la actualización ocurre tanto cuando el estado de la naturaleza preferido (que para los jugadores Par es que se extraigan más bolas blancas) es probable como cuando es improbable. Nuestra manera de entender la situación es que una persona que tiene interés en un estado de la naturaleza particular estará, si acaso, emocionalmente inclinada a dar menos peso a una señal desfavorable que confirme el estado no preferido; en este caso uno esperaría ver un sesgo de disconfirmación, o al menos un menor sesgo de confirmación. Esto sugiere que el efecto puede ser debido a factores tales como el aumento de la atención que se presta al problema de actualización de las probabilidades o el que se presta a la complejidad del entorno.

Un aspecto del experimento es el juego que los individuos juegan tras las actualizaciones. Una especificación alternativa daría directamente un pago a los jugadores. La razón de elegir un juego era forzar a que se preste más atención a los estados de la naturaleza (el tipo de urna). Los juegos son muy simples y, efectivamente, los jugadores juegan las estrategias de equilibrio la mayoría de las veces (alrededor de un 85% los jugadores Impar y un 90% los Par). Para analizar esta característica del diseño experimental, los autores llevan a cabo un experimento con una especificación alternativa, y encuentran que los jugadores Par parecen ser menos conservadores que cuando los estados finales se asocian con juegos. Sin embargo, estos jugadores Par se ven más afectados por el sesgo de confirmación que en la especificación no estratégica. Esto sugiere que las creencias motivadas por el hecho de que los estados finales sean juegos se traduce en menos sesgo de confirmación debido a la mayor atención prestada, mientras que el nivel de conservadurismo puede no variar.

Finalmente, se realizó otro experimento con distintos juegos finales para asegurarse de que no había nada especial con algún juego en particular que afectara el comportamiento de los jugadores. No se encontraron resultados distintos en estos casos.

Los autores concluyen: Tal vez sorprenda que un efecto tan fuerte en el comportamiento resulte de nuestra pequeña manipulación para motivar creencias. La única diferencia en nuestro diseño es que un grupo de jugadores tiene un pago de equilibrio ligeramente superior en un estado de la naturaleza en comparación con el otro, mientras que el otro grupo de jugadores no lo tiene. Aún así, parece que la gente presta más atención cuando les importa cuál es el estado de la naturaleza.

-----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: El benefactor al rescate.
Hace tres años en el blog: Escépticos en el pub. El diseño inteligente ¡Vaya timo!
Y también: Antes de leer "El Capital en el Siglo 21".
-----------------------------------------------------------------------------------------------------------

miércoles, 10 de mayo de 2017

Un experimento sobre el sesgo de confirmación (1)

Esta es la primera parte de la versión en español de mi artículo de abril en Mapping Ignorance.


Esta entrada resume el artículo “Confirmation bias with motivated beliefs”, de Charness y Dave, publicado en Games and Economic Behavior en 2017 [1].

El sesgo de confirmación puede definirse como la tendencia a buscar, interpretar y usar las evidencias de una manera sesgada hacia la confirmación de creencias o hipótesis preexistentes. Esto constituye un error de juicio que limita la capacidad de aprender que tiene el individuo (Rabin y Schrag, 1999 [2]), induce un cambio en las creencias para justificar acciones pasadas (Yariv, 2005 [3]), y puede conducir a un incremento de la polarización de las creencias dentro de una población (Wilson, 2014 [4]). Las implicaciones para situaciones de la vida real son abundantes: un exceso de volatilidad y de inercia a la hora de comprar y vender en la bolsa de valores, la perpetuación de los estereotipos y la falta de acierto en los diagnósticos médicos, entre muchas otras.

Una cuestión importante es, por tanto, qué clase de entornos hace que los individuos integren la nueva información sin caer en el sesgo de confirmación. Para este fin, Charness y Dave llevan a cabo un experimento en el que el aprendizaje racional debería seguir una actualización bayesiana, miden el sesgo de confirmación como la distancia a la actualización bayesiana y comparan las diferentes medidas en distintos escenarios para poder sacar conclusiones.

El experimento es como se indica a continuación:
  • Hay dos urnas, la “más negra” (MN) contiene 7 bolas negras y 3 blancas, mientras que la “más blanca” (MB) tiene 3 negras y 7 blancas.
  • Se elige una urna de manera aleatoria. Si resulta ser la urna MN, los jugadores experimentales juegan el juego MN. Si se elige la urna MB, juegan el juego MB. Ambos son juegos simples. Si los jugadores juegan correctamente, el jugador Impar gana 20 puntos, mientras que el jugador Par gana 25 en el juego MN y 30 en el juego MB. Si un sujeto es Impar o Par se determinará por adelantado, y se comunicará al jugador.
  • Antes de conocer la información sobre qué urna ha sido elegida, se extrae de ella una bola, que se enseña a los jugadores y se vuelve a introducir en la urna. Este proceso se repite seis veces antes de mostrar el contenido de la urna. Después de cada extracción se pide a los jugadores que estimen la probabilidad de que la urna sea MN o MB. Las mejores estimaciones se recompensan con más puntos.
  • Los sujetos experimentales juegan este juego, cada vez con un oponente distinto y anónimo, diez veces.

En este experimento hay unas probabilidades repartidas al 50% cada una de que la urna sea de un tipo o de otro, y hay una única manera correcta de actualizar estas probabilidades tras cada extracción de una bola, siguiendo la fórmula de Bayes. Las desviaciones con respecto a estas actualizaciones ofrecen una medida de un posible sesgo de confirmación. Finalmente, los autores presentan la hipótesis de que, en comparación con los jugadores Par, los jugadores Impar deberían mostrar un sesgo de confirmación mayor, en el sentido de que no usarán la información ofrecida por el color de las bolas extraídas de manera eficiente para corregir su estimación sobre si la urna es MN o MB, y en cambio realizarán actualizaciones más cercanas a las predicciones a priori que las que deberían hacerse. De acuerdo con esta hipótesis, los jugadores Impar no están interesados en el tipo de urna, puesto que sus pagos no dependen de ello. Por el contrario, los pagos de los jugadores Par sí dependen del tipo de urna y tiene un mayor interés en prestar atención a las actualizaciones de las probabilidades.

(Continúa aquí).

Referencias

1. Charness, G, y Chetan, D. 2017. Confirmation bias with motivated beliefs. Games and Economic Behavior 104, 1-23.

2. Rabin, M., y Schrag, J.L. 1999. First impressions matter: a model of confirmatory bias. Quarterly Journal of Economics 114, 37–82.


4. Wilson, A., 2014. Bounded memory and biases in information processing. Econometrica 82:6, 2257–2294.

-----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: El modelo de Cournot. Una historia de éxito (1).
Y también: El modelo de Cournot. Una historia de éxito (2).
-----------------------------------------------------------------------------------------------------------

jueves, 14 de julio de 2016

¿Qué información hace falta para cooperar? (2)

Esta es la segunda parte de la versión en español de mi artículo de junio en Mapping IgnoranceDebe leerse la primera parte para entender esta.


Todo lo anterior ha sido estudiado de manera teórica y experimental. Sin embargo, la mayoría de experimentos en reputación se han diseñado en un escenario sin ruido donde, para cada individuo, la reputación consiste en sus acciones pasadas, una información que está inmediatamente disponible para el resto de individuos. En momentos más recientes, algunos experimentalistas han explorado qué ocurre cuando la reputación se conoce de manera imperfecta (con ruido). Esto ocurre, por ejemplo, cuando tras cada interacción, los individuos son evaluados y esta evaluación no es un registro automático de las acciones llevadas a cabo, sino de otra información, como cuando asignamos más o menos estrellas a una película).

Este es el enfoque que usan Masclet y Pénard (2012) [1], donde los autores usan un juego de confianza repetido con un momento adicional en el que los participantes evalúan a sus parejas, y en el que las evaluaciones (no las acciones) son conocidas por todos. Con este diseño experimental analizan cómo afectan a la cooperación distintos sistemas de evaluación. Encuentran que las evaluaciones están fuertemente correladas con los niveles de inversión. La confianza es mayor en los tratamientos en los que los participantes se evalúan simultáneamente, y cuando se evalúan secuencialmente los participantes usan evaluaciones negativas como medio de perjudicar a los participantes que les dieron evaluaciones también negativas.

Más recientemente, Greiff y Paetzel (2016) [2] esta idea, pero en lugar de analizar cómo cambia el comportamiento según las evaluaciones, estudian qué clase de información sobre las evaluaciones es relevante para fomentar la cooperación. En su experimento, los participantes se emparejan de manera aleatoria y anónima. En el experimento cada participante empieza con una asignación de tres unidades monetarias y debe decidir cuántas de estas unidades usar para contribuir a una inversión pública y cuántas guardad para una inversión privada. La inversión privada multiplica el dinero por un factor de 4, mientras que la pública lo hace por un factor de 6 (que luego se divide entre los dos socios). Por ejemplo, si el Jugador 1 se queda con una unidad para si inversión privada (y contribuye con 2 para la pública), y el Jugador 2 se queda con 2 unidades para su inversión privada (y contribuye con una para la pública), la inversión pública producirá 6x(2+1) = 18. De esta manera el Jugador 1 ganará 13 (4 de su inversión privada y 9 de la pública); y el Jugador 2 ganará 17 (8 y 9). En este juego, los individuos pueden ganar hasta 18 cada uno si ambos contribuyen sus tres unidades a la inversión pública. Esta es, sin embargo, una decisión de riesgo, puesto que cualquier jugador puede estar tentado a no invertir nada en la parte pública y ganar 21 (12 de la privada y 9 de la pública), aprovechándose de la contribución pública del otro jugador. En el experimento los individuos se emparejan de esta manera 15 veces. Al final de cada encuentro, los individuos deben evaluar al oponente. Antes de cada nuevo encuentro los individuos conocen cómo ha sido evaluado el oponente, pero no qué decisiones tomó en el pasado. El experimentos se desarrolla en tres tratamientos separados. En uno, los individuos también saben las evaluaciones que se les ha otorgado a ellos, mientras que en otro tratamiento, no. En el tercer tratamiento, el grupo de control, no se les da ninguna información.

Los autores proponen y confirman tres hipótesis:
  1. Contribuciones más altas reciben mejores evaluaciones.
  2. Los participantes contribuyen más cuando se emparejan con un individuo con mejores evaluaciones.
  3. En el tratamiento en el que los individuos conocen también su propia evaluación, el efecto en 2. Es mayor para los participantes cuya evaluación es buena.
La hipótesis tercera muestra un resultado novedoso. A pesar de que los resultados experimentales detectan más contribuciones cundo se da información sobre el oponente (hipótesis 2), el aumento real en contribuciones con respecto al grupo de control ocurre cuando la información sobre la propia evaluación también es conocida. Esto significa que, en contraste con lo que ocurre en un escenario sin ruido, un participante no puede inferir su propia reputación a partir de sus acciones pasadas. La explicación que proponen los autores es que la información acerca de la propia evaluación facilita la cooperación condicional al influir en las creencias de segundo orden: para cooperar, necesito saber no solo que yo soy un cooperador, sino que los demás saben que los soy.

Referencias:

1. Masclet, D., y Pénard, T. 2012. Do reputation feedback systems really prove trust among anonymous traders? An experimental study. Applied Economics 35, 4553–4573.

2. Greiff, M., y Paetzel, F. 2016. Second-order beliefs in reputation systems with endogenous evaluations – an experimental study. Games and Economic Behavior 97, 32–43.

----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Demasiado grandes para caer.
Hace tres años en el blog: Sobre Economía e ideología.
-----------------------------------------------------------------------------------------------------------

martes, 12 de julio de 2016

¿Qué información hace falta para cooperar? (1)

Esta es la primera parte de la versión en español de mi artículo de junio en Mapping Ignorance.


Al contrario de lo que ocurre con los mercados competitivos, hay muchos casos de situaciones económicas en las que un comportamiento racional y egoísta no implica una asignación eficiente de los recursos. Un ejemplo es la financiación de los bienes públicos. Pongamos que a unos vecinos se les pide contribuir para la construcción de un parque de una hectárea (10.000 m2) en el barrio. Si el coste de construirlo es 100.000€ y debe ser sufragado a partes iguales entre los 100 vecinos, cada uno debería pagar 1.000€. Si, además, cada vecino valora el parque en más de 1.000€, entonces la construcción es una inversión eficiente. Ahora bien, si los vecinos no están obligados a pagar esos 1.000€ y solamente se les pide una contribución voluntaria, el parque no se construirá o, por lo menos, no en ese tamaño. Cada vecino pensará: “Si todos contribuyen, mi aportación solo cambiará la extensión del parque de 9,990 m2 a 10.000 m2. El parque será solo marginalmente menor si me ahorro mi aportación. Si nadie contribuye, mis 1.000€ solo darán para 10 m2. En cualquier caso, prefiero no contribuir. Diez metros cuadrados adicionales no me compensan los 1.000€ que me cuestan”. Este es el problema del “polizón”. El argumento “si todo el mundo piensa como tú, perderemos una oportunidad de estar todos mejor” no funciona para resolver el problema, puesto que no cambia la manera en la que los demás piensan. Esta es la razón por la que la obligatoriedad del pago de impuestos se respalda con la fuerza de la ley. El ejemplo es, también, una versión de la famosa paradoja del dilema del prisionero.

¿No hay maneras de escapar a esta lógica? De hecho, hay muchas. Algunas requieren una interacción repetida, de manera que el análisis lógico cambie. En una situación repetida, los individuos pueden pensar de la siguiente manera: “De acuerdo, empezaré contribuyendo, y seguiré haciéndolo en el futuro mientras todo el mundo haya estado cooperando en el pasado. En caso contrario dejaré de contribuir”. Ahora hay un incentivo para contribuir: mantener la producción de los bienes públicos deseados; y hay también un castigo para los polizones: si no contribuyes, los demás tampoco lo harán y tú también te verás perjudicado por la ausencia de bienes públicos.

Podemos complicar el problema de muchas maneras. En la solución anterior, el castigo es demasiado severo. Una vez que alguien dejó de cooperar, el castigo es para siempre y, además, afecta tanto al polizón como a quien se comportaba de manera cooperativa. Es posible suavizar el problema haciendo que la fase de castigo dure solamente unos pocos periodos. Otra complicación surge si el conjunto de vecinos cambia con el tiempo, o si el conjunto de interacciones no involucra a todos los vecinos cada vez. Hoy, A, B y C se enfrentan a un problema de bienes públicos que solo les afecta a ellos tres. Mañana, una situación semejante se produce entre D y E. Al día siguiente hay otra entre B, D y F, y así sucesivamente. Si el comportamiento de cada vecino es perfectamente conocido por el resto, y si todos los vecinos esperan verse involucrados en este tipo de interacciones en el futuro, entonces está en el interés de cada uno mantener la reputación de ser cooperativo, de manera que cuando se encuentren dos o más vecinos con un registro de haber sido cooperativos, la cooperación se podrá mantener.

Continúa aquí.

----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: La trama de la SGAE.
Y también: Las propiedades emergentes.
Hace tres años en el blog: Odiosa comparación (5).
Y también: Sobre las becas universitarias.
-----------------------------------------------------------------------------------------------------------

martes, 5 de abril de 2016

Negociaciones formales frente a las informales (2)

Esta es la segunda parte de la versión en español de mi artículo de marzo en Mapping Ignorance. Debe leerse la primera parte para entender esta.


En el modelo de negociación descrito en la primera parte, los autores primero consideran el caso de polarización débil, que ocurre cuando el statu quo es preferido al punto de desacuerdo por todos los jugadores. En este caso el resultado del acuerdo coincidirá con las preferencias del jugador mediano, el Jugador 2. Para ver esto nótese que el Jugador 1, el que quiere disminuir el presupuesto, aceptará mantenerlo puesto que, de no aceptar una disminución menor que Y, el Jugador 2 siempre podrá acordar con el Jugador 3 un aumento menor que esa cantidad Y. Un argumento similar sirve para mostrar que el Jugador 3 también aceptará mantener el presupuesto.

El segundo caso es el de fuerte polarización. Esto ocurre cuando no hay ningún acuerdo entre el mejor punto para el Jugador 1 y el statu quo que sea preferido al punto de desacuerdo por los jugadores 1 y 2, porque uno de los dos debe ceder demasiado para atraer al otro. Lo mismo ocurre entre los jugadores 2 y 3. En este caso, el resultado será el punto de desacuerdo.

Finalmente, la polarización puede ser moderada. En este caso el punto de desacuerdo es preferido al statu quo para los jugadores 1 y 3, pero hay espacio para el acuerdo entre los jugadores 1 y 2 o entre los jugadores 2 y 3. En este caso no hay un equilibrio claro, puesto que para cualquier posible acuerdo siempre podemos encontrar que hay dos jugadores que preferirían cambiar a otro punto: considérese que los jugadores 2 y 3 llegan a un acuerdo que está a mitad de camino entre el statu quo (mantener el presupuesto) e incrementarlo en B euros, que es el punto preferido del Jugador 3 (es decir, el acuerdo es subirlo en X=B/2). Esta situación puede ser mejorada por los jugadores 1 y 2 eligiendo un punto más cercano al statu quo, pero con una disminución del presupuesto. Con polarización débil este proceso continuaría con acuerdos cada vez más cercanos al statu quo, pero con una polarización moderada los jugadores 1 y 3 preferirán el punto de desacuerdo antes que el statu quo, de manera que este no tiene por qué ser el resultado. Tampoco lo tiene por qué ser el punto de desacuerdo, puesto que, a partir de él, los jugadores 2 y 3 preferirán el punto X (o algún otro intermedio entre las posturas de ambos jugadores) al desacuerdo, algo que no ocurre en el caso de fuerte polarización, y de esta manera volvemos a empezar el círculo, siempre con dos jugadores dispuestos a votar en contra de cualquier acuerdo. 

En suma, una polarización débil mantiene el statu quo y una polarización fuerte lleva al desacuerdo, mientras que una polarización moderad puede resultar en cualquier cosa. En otras palabras, con un procedimiento formal de negociaciones, la polarización daña al jugador mediano. 

En cuanto al procedimiento informal, los autores eligen una situación en la que los jugadores pueden hacer cualquier oferta en cualquier momento a cualquiera de los otros jugadores. En estas circunstancias, y para cualquier polarización de las preferencias, cualquier resultado entre una reducción del presupuesto por la cantidad A y un aumento por la cantidad B pueden ser un equilibrio, como también lo puede ser el desacuerdo. 

Tras detallar la teoría, los autores la ponen a prueba en el laboratorio. De acuerdo con la predicción, en los experimentos el jugador mediano está significativamente peor con bajos niveles de polarización. Sin embargo, en contraste con el resultado teórico, más polarización perjudica al jugador mediano, incluso cuando la polarización es débil. Los resultados sugieren que esto se debe a consideraciones de equidad dentro de las coaliciones. Con el tiempo, la competición entre coaliciones parece atenuar tales consideraciones y el jugador mediano aprende a explotar su poder de negociación en su beneficio y así verse menos perjudicado por la polarización. 

El segundo y más importante resultado es que la formalidad importa. Teóricamente es difícil analizar los efectos de la formalidad, puesto que la negociación informal tiene como principal característica el imponer muy pocas restricciones estratégicas a los negociadores. El jugador mediano del experimento está significativamente mejor con un procedimiento informal sin reglas que delimiten los momentos para presentar o aceptar y rechazar ofertas. Los resultados del tratamiento informal son más a menudo el ideal del jugador mediano y significativamente menos un compromiso entre el jugador mediano y uno de los otros dos. Parece que el procedimiento informal da al jugador mediano más flexibilidad para explotar su mejor posición negociadora. El resultado confirma la observación casual de que los jugadores con mejor posición negociadora prefieren una menor regulación de las negociaciones a la vez que requiere el desarrollo de modelos de negociación que expliquen este hecho. 

----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Prejuicios económicos (2).
-----------------------------------------------------------------------------------------------------------

sábado, 2 de abril de 2016

Negociaciones formales frente a las informales (1)

Esta es la primera parte de la versión en español de mi artículo de marzo en Mapping Ignorance.


Cuando compro en un mercado solo tengo que lidiar conmigo mismo, sin importarme si el mercado es competitivo o está en manos de un monopolio. El precio está dado y yo elijo cuánto comprar. En una subasta para conseguir un proyecto que el gobierno saca a licitación pública, cada empresa participante debe anticipar lo que las empresas rivales van a pujar, pero a no ser que se pongan de acuerdo ilegalmente en coludir no hablan entre ellas sobre el tema. Hay, sin embargo, muchas decisiones que deben tomarse tras una negociación entre unas pocas partes, como las decisiones para ponerse de acuerdo en el precio que pagar por un proyecto o para pasar una ley en el parlamento. En estos casos hay a menudo un espacio para el acuerdo en la forma de un precio a medio camino entre las aspiraciones máximas de comprador y vendedor, o de un compromiso sobre el alcance de la ley, y por eso es que firmamos contratos y aprobamos leyes votadas por coaliciones de diferentes partidos. Hay también espacio para una diversidad de preferencias sobre los posibles acuerdos, y por eso seguimos usando la expresión latina quid pro quo en estas situaciones.

Típicamente, la manera de estudiar los problemas de negociaciones es a través de un proceso de negociación bien definido. El problema es que hay muchos procedimientos entre los que elegir. Los jugadores pueden alternar ofertas y contraofertas de una manera pre-especificada o pueden hacerlo de manera aleatoria, los acuerdos pueden requerir unanimidad o algún tipo de mayoría, el procedimiento puede tener una ronda final, no tener un final definido o terminar con cierta probabilidad, o también el tamaño del pastel que repartir puede disminuir con el tiempo o permanecer fijo, solo por mostrar algunas posibles variaciones. Las buenas noticias son que aún así los modelos presentan ciertas regularidades. Por ejemplo, ser impaciente o mostrar aversión al riesgo hace perder poder de regateo, y el jugador que tenga la capacidad de hacer una última oferta del tipo “lo tomas o lo dejas” tendrá normalmente una posición ventajosa. Además, el no saber los beneficios y costes de los demás jugadores retrasará el momento del acuerdo.

En este contexto, de Groot et al. (2016) [1] introducen un elemento nuevo. Los autores estudian los efectos de tener un procedimiento de negociación informal frente a uno formal, y lo hacen de manera teórica y experimental. Primero consideran una situación en la que tres jugadores deben negociar el nivel de una variable. Por ejemplo, pueden ser partidos que deben ponerse de acuerdo en aumentar, disminuir o mantener el gasto dedicado a un programa gubernamental. Un único partido no puede tomar la decisión, pero cualquier coalición de dos puede hacerlo. Además, si no llegan a un acuerdo acabarán en un mal punto de desacuerdo (por ejemplo, el programa deberá desmantelarse, algo que ninguno quiere). Pare el Jugador 1 el mejor resultado es reducir el presupuesto por, digamos A euros, y a partir de ahí evalúa cada otro posible resultado según lo lejos que esté de esa reducción, tanto por exceso como por defecto. De manera similar, el Jugador 2 prefiere que no haya cambios en el presupuesto, mientras que el Jugador 3 prefiere un incremento en el presupuesto de B euros, y también estos jugadores evalúan los posibles resultados según la distancia a su política preferida.

Como procedimiento formal, los autores eligen un modelo de ofertas alternas, en concreto el usado en Baron y Ferejohn (1998) [2], y muestran cómo el resultado cambia dependiendo de la polarización de las preferencias de los jugadores. En cuanto al procedimiento informal, los autores eligen una situación en la que los jugadores pueden hacer cualquier oferta en cualquier momento a cualquiera de los otros jugadores. Veremos los resultados en la siguiente entrada.

Referencias:

[1] de Groot Ruiz, A.;  Ramer, R. y Schram, A. 2016. Formal versus informal legislative bargaining. Games and Economic Behavior 96, 1–17.

[2] Baron, D.P., y Ferejohn, J. 1989. Bargaining in legislatures. American Political Science Review 83, 1181–1206.

----------------------------------------------------------------------------------------------------------
Hace cinco años en el blog: Horarios.
Y también: Prejuicios económicos (1).
Hace tres años en el blog: Experimentos sobre equidad (1).
Y también: Experimentos sobre equidad (2).
Y también: Cómo ser escéptico de la economía en 15 lecciones.
Y también: Acabar una discusión con los papeles intercambiados.
-----------------------------------------------------------------------------------------------------------

viernes, 29 de mayo de 2015

España es una potencia en Economía Experimental. El Ministerio reacciona cargándosela.


Mis colegas que realizan Economía Experimental en España me llaman la atención sobre un punto en las instrucciones de ejecución y justificación del presupuesto de los proyectos del Ministerio de Economía y competitividad. Son los que se suelen llamar proyectos de investigación del Plan Nacional, del que se nutren la mayoría de los equipos investigadores españoles. Léelo bien, amigo lector:
No son elegibles en ninguna de las modalidades: 
  • Compensaciones del personal de investigación no vinculado a las entidades beneficiarias cuando participen en la ejecución de las actuaciones objeto de subvención, como por ejemplo pagos a estudiantes, sujetos experimentales, gratificaciones y honorarios.
Puedes poner el texto en Google y te llevará a las instrucciones de las convocatorias de los años 2013 y 2014.

Si no se entiende bien el alcance de estas tres líneas, lo traduzco al castellano:
El Ministerio no financiará ningún experimento con personas. Punto.
Bueno, no dice eso exactamente. Puedes hacer experimentos, pero no pagar a quienes que se presten a ser sujetos experimentales. Tengo alguna idea de cómo afectará esto a los experimentos médicos o de Psicología, pero voy a hablar de lo que conozco: la Economía Experimental dejará de tener financiación del Ministerio. Habrá que buscarse la vida con proyectos europeos, privados o autonómicos. Los experimentos en Economía simulan distintos mecanismos de interacción económica, desde todo tipo de mercados a juegos de cooperación y conflicto, pasando por cualquier otra cosa que al investigador de turno se le ocurra. Para ello es indispensable simular el incentivo monetario (además de otros que pueda haber) que el mecanismo tendría fuera del laboratorio. Sin pago a los voluntarios no hay experimentos en Economía. El lector curioso puede leer en estas entradas varios ejemplos de la utilidad de estas simulaciones (1, 2, 3, 4, 5).

La Economía Experimental es una rama en auge en estos momentos. Así, por poner tres ejemplos, la Economía del Comportamiento intenta sistematizar los sesgos que nos separan del Homo economicus, las simulaciones en Organización Industrial nos ayudan a diseñar mejores regulaciones en los mercados de competencia imperfecta, y la experimentación en mercados financieros nos ayuda a entender la formación de burbujas y los comportamientos en manada que profundizan crisis como la actual. Las revistas que publican resultados de Economía experimental están subiendo posiciones en los ránkings de citas y las mejores revistas generales de Economía publican cada vez más investigaciones experimentales. Es un área con un futuro prometedor y, lo que es mejor, en ella España está reconocida como una de las potencias mundiales, con muy buenos y reconocidos investigadores. Lo malo es que nos los quitan de las manos y se van a Inglaterra y a USA, sobre todo.

Uno diría que el Estado debería hacer lo posible por mantener e, incluso, potenciar las áreas de investigación relevantes en las que el país es competente, pero nuestras autoridades ven las cosas de otra manera: lo mejor es poner todavía más trabas a ver si no solo no crecemos, sino que nos cargamos lo que ya tenemos. Nuestros experimentalistas se irán en mayor medida, los laboratorios que se han creado en varias universidades languidecerán y en España la investigación llorará un poco más. Y en este caso no es cuestión de dinero; los equipos que tradicionalmente realizaban experimentos económicos no tenían una financiación mayor que los que no los hacían. Simplemente dedicaban más dinero del escaso que recibían a pagar a los sujetos experimentales y menos a viajes a congresos y a compra de material, por ejemplo. Es cuestión de entender muy mal las prioridades y atender antes a la burocracia que al investigador. El pago a los sujetos experimentales tiene su truco: ¿es renta? ¿dietas? ¿paga impuestos? ¿cómo se registra? Lo que recibe un voluntario son cantidades muy pequeñas, unos pocos euros en cada experimento, para las que podía establecerse fácilmente un encaje, como se ha hecho hasta ahora. Claro que eso quiere decir que alguien en el Ministerio tiene que pensar cómo hacerlo, y no hablo de los funcionarios que diligentemente tramitan con paciencia todo lo que les mandan las autoridades desde arriba y los investigadores desde abajo.

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Rajoy, que nos pilla el toro.
Hace cinco años en el blog: La votación de mañana-hoy.
Y también: Jugar a ser dios.
-----------------------------------------------------------------------------------------------------------

lunes, 8 de diciembre de 2014

Economía experimental y la desregulación eléctrica (2)

Esta es la segunda parte de la versión en español de mi artículo de noviembre en Mapping Ignorance. Se trata de una sección de un artículo mío publicado recientemente en la revista Economía Industrial [1]. Debe leerse la primera parte para entender esta.


Una de las idiosincrasias del sector eléctrico la constituye el diseño de red, con sus limitaciones de transporte entre nodo y nodo. Por ejemplo, cuando hay una restricción de capacidad en una línea que conecta generadores con comercializadores, los productores pueden subir sus precios, de manera que los gestores de las líneas no se apropian del excedente y no van a tener los incentivos adecuados para invertir en mayor capacidad. Backerman et al. (2000) [6] realizan un experimento con cuatro distribuidores en un nodo central y tres generadores en un lado y cuatro en el otro unidos con el nodo central por sendas líneas. Cuando reducen la capacidad de una de ellas obtienen una verificación experimental de esta hipótesis. Encuentran, además, que cuando se introduce una subasta doble uniforme se aumenta la eficiencia del sistema, incidiendo en la importancia de tener una demanda activa.

En el poder de mercado en el sector eléctrico intervienen más componentes que la mera concentración. Debido a las restricciones de capacidad en las líneas, algunas empresas pueden inducir a propósito problemas de congestión según su localización si saben que, con alta probabilidad, serán llamadas a resolverlos porque el operador del sistema les pida aumentar la producción en otra parte de la red, lo que les permitirá poner precios altos. Zimmerman et al. (1999) [7], diseñan una plataforma experimental (la “PowerWeb”) para simular estas situaciones y encuentran que, efectivamente, se da este comportamiento estratégico. A partir de ahí analizan cómo detectar los nodos susceptibles de presentar este problema y cómo hacerlo disminuir cuando aumentan el número y la capacidad de los generadores en estos nodos.

Los problemas para diseñar la subasta del mecanismo de casación comienzan cuando no es posible extender las propiedades ya conocidas de las subastas de producto único a subastas de múltiples productos. Las restricciones técnicas del sector eléctrico y sus procesos dinámicos de optimización hacen que las subastas deban ser del segundo tipo, con ofertas “en paquete” para producir en distintos momentos. Las propiedades de estas subastas no son bien conocidas, así que los análisis experimentales pueden ofrecer su ayuda. En particular, hay dos preguntas principales a las que responder. La primera se refiere a las diferencias entre subastas a sobre cerrado frente a las subastas con pujas continuas. La segunda está relacionada con el precio que imponer según las ofertas y demandas, y debe comparar las subastas con precio homogéneo (todas las transacciones se realizan al mismo precio) con las subastas a precio diferenciado (donde las transacciones se van cerrando a precios distintos). Los trabajos de Bernard et al. (1998) [8], Denton et al. (2001) [9], Han y Van Boening (1990) [10] y Olson et al. (2003) [11] permiten decir que, en general, las subastas a sobre cerrado son más eficientes que las continuas y que las de precio homogéneo dan mejores resultados que las de precio diferenciado. La razón para esto último parece ser que la volatilidad en precios beneficia más al lado de la oferta en el reparto del excedente, y que esto afecta a la eficiencia global al limitar la disciplina que puede imponer el lado de la demanda.

Referencias:

1. Ferreira, J.L. 2014. Investigación experimental en Economía Industrial. Revista de Economía Industrial 393, 69-77.

6. Backerman, S.R.; Rassenti ,S.J., and Smith V.L. 2000. Efficiency and income shares in high demand energy networks: Who receives the congestion rents when a line is constrained? Pacific Economic Review 5:3, 331-347.

7. Zimmerman, R.D.; Bernard, J.C.; Thomas R.J., and Schulze W. (1999): Energy auctions and market power: An experimental examination. Proceedings of the 32nd Hawaii International Conference on System Sciences.

8. Bernard, J.C.; Mount, T., and Schulze, W. 1998. Alternative auction institutions for electric power markets. Agricultural and Resources Economics Review 27:2, 125-131.

9. Denton, M.; Rassenti, S.J., and Smith, V.L. 2001. Spot market mechanism design and competitivity issues in electric power. Journal of Economic Behavior and Organization 44, 435-453.

10. Hahn, R.W., and Van Boening, M.V. 1990. An experimental examination of spot markets for electricity. The Economic Journal 100, 1073-1094.

11. Olson, M.A.; Rassenti S.J.; Smith, V.L., and Rigdon, M.L. 2003. Market design and motivated human trading behavior in electricity markets. Institute ofIndustrial Engineering Transactions 35:9, 833-849.

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: El buen samaritano. Solidaridad vs caridad.
Hace cinco años en el blog: Copiar no es robar.
-----------------------------------------------------------------------------------------------------------