De los primeros juegos
En 1959, cuando la amenaza de un enfrentamiento nuclear entre los Estados Unidos la Unión Soviética era lo más cercano a la realidad, el filósofo y matemático Bertrand Rusell trataba de entender la actitud de los dirigentes de ambas potencias, aparentemente irracionales, comparándola con un jugo de moda que había aparecido en la película “Rebelde sin causa”, en el que dos coches se precipitaban uno contra el otro sobre una larga línea recta hasta que alguno de los dos se asustará.
Esta dinámica protagonizada por James Dean, fue bautizado tiempo después como el famoso juego de “la gallina”, y ejemplificaba de manera muy precisa la conducta que las dos grandes potencias mundiales habían tenido por aquella época.
Veinte años antes, John Von Neuman había propuesto un lenguaje matemático para expresar y resolver este tipo de conductas entre los agentes, a lo que denominó una “Teoría de Juegos”.
“El ajedrez no es un juego. El ajedrez es en realidad una forma bien definida de la computación. Puede que no sea posible concebir las respuestas, pero en teoría debe existir una solución, un procedimiento exacto en cada posición. Ahora bien, los juegos verdaderos no son así. La vida real no es así. La vida real consiste en farolear, en tácticas pequeñas y astutas, en preguntarse a uno mismo que será lo que el otro hombre piensa que voy a hacer. Y en eso consiste los juegos de mi teoría”.
Von Neumann había demostrado en 1928 un teorema matemático que permitía resolver “estratégicamente” actitudes de las personas (el famoso teorema minimax), que se basaba en elegir los resultados menos malos posibles (el mínimo de los máximos), y a partir del cual busco revolucionar a economía y la matemática.
Sin embargo, la obra que escribiría Von Neuman con Oskar Morgnstern en 1948 dedicado a estas reflexiones, pasó prácticamente desapercibida, principalmente debido a que los “juegos” de Von Neuman se limitaban a aquellos donde los participantes tenían intereses diametralmente opuestos. Todo lo demás había quedado sin una solución matemática satisfactoria.
Y este fue el principal logró de John Nash. En su artículo de 1950, Nash sentó las bases de la teoría de juegos cooperativos y la teoría de la negociación, donde se analizan situaciones estratégicas en la que los intereses en conflicto de los jugadores no son totalmente opuestos y pueden conciliarse o negociarse para llegar a un resultado “aceptable” para todos.
En 1953, en su tesis de doctorado, Nash extendió su propuesta a la solución de juegos no cooperativos, donde analizó conflictos de intereses insolubles mediante coaliciones o negociaciones, lo que ha pasado a conocerse como el famoso equilibrio de Nash.
Una vez terminada su tesis, John Nash se fue a la RAND Corporation con un grupo de científicos de primera fila que mostraron gran interés en el desarrollo de esta nueva teoría. Fue en esos años cuando Nash tuvo la oportunidad de trabajar con el propio Von Neuman, con Thomas Schelling (pionero en la aplicación de la teoría de juegos a problemas políticos), y con Lloyd Shape (quien avanzaría en mayor medida dentro de los juegos cooperativos).
Pero a partir de 1960 Nash vivió un largo peregrinar en distintos hospitales afligido por un problema de esquizofrenia que esta emotivamente retratado en la novela de Silvia Nasa “A Beutiful Mind” de 1998, y que fue llevada al cine posteriormente en el 2001 por Ron Howard.
Después del gran hallazgo de Nash, la teoría de juegos quedó prácticamente confinada en el terreno de las matemáticas durante veinte años, sin que nadie se preocupase por su aplicación a las ciencias sociales, e incluso Schelling llegó a afirmar en 1980 que no tenía ya esperanza sobre que esta teoría pudiese aplicarse por completo a la economía o la política (como puede verse en su prefacio de The Strategy of Conflict).
Sin embargo, precisamente en la década de los ochenta, sin que nadie lo advirtiese, la teoría de juegos resurgió con amplia fuerza y para 1994 Nash fue condecorado con el premio Nobel de Economía junto a Reinhard Selten y John Harsanyi, por haber sido precursores en el desarrollo de esta teoría, brindando con sus resultados una nueva perspectiva sobre aspectos que antes estaban ocultos o que resultaban opacos. En este sentido, la potencia de la teoría de juegos para generar deducciones que enriquezcan la interpretación del mundo es avasalladora y desafiante, y justo hoy, a dos años de distancia de la muerte de Nash, ha parecido precisos recordarlo, aunque sea sólo un poco.
Los juegos sin economía
Como es bien sabido, hay dos grandes grupos dentro de la teoría de juegos: los juegos cooperativos y los no cooperativos, y la clave para saber que juego se está jugando reside en la posibilidad de que los jugadores puedan concretar acuerdos vinculantes en relación con sus acciones.
En los juegos no cooperativos no existen este tipo de acuerdos, lo que significa que no se puede denunciar el incumplimiento de un acuerdo ante alguna autoridad, o que no hay garantía de que se respetan compromisos entre los jugadores, por lo que la unidad de análisis se centra en el individuo.
En el juego cooperativo en cambio, se permite tener acuerdos vinculantes entre jugadores y ello hace que la unidad de análisis sea el grupo o la coalición.
Para ambas clases de juegos existe una solución matemática: el equilibrio de Nash para los no cooperativos y el Core o núcleo para los cooperativos. La lógica de ambos equilibrios es la misma: encontrar una solución estable en la que nadie encuentre beneficio de desviarse sobre alguna estrategia.
El equilibrio de Nash se entiende someramente como la solución donde un perfil de estrategias para cada jugador (para cada individuo) es la mejor respuesta posible ante la decisión de los demás. Mientras que el núcleo (propuesto por Donald B. Gillies en 1953), se ejemplifica como la solución donde ningún jugador resulta perjudicado en relación a la situación inicial del juego (racionalidad individual) y ningún grupo de jugadores puede desviarse de dicha estrategia o formar otra coalición para conseguir un mayor beneficio (racionalidad colectiva).
Así, mientras el equilibrio de Nash tiene segura su existencia prácticamente en cualquier juego no cooperativo, no ocurre lo mismo con el núcleo. Y lo que es peor, donde el núcleo no está vació es muy normal encontrar existencias múltiples.
De hecho, la poca aplicación universal del núcleo ha incentivado fuertemente la búsqueda de otro tipo de soluciones como es el famoso valor Shapley, o la descripción de juegos cooperativos a través de juegos no cooperativos, lo que se denomina como la programación de Nash, donde claramente se presenta una solución a través de varios equilibrios de Nash, lo que sigue dejando a algunos inconformes para encontrar soluciones generales.
El equilibrio de Nash por su parte ha presentado limitaciones tanto a nivel teórico como a nivel práctico, lo que ha incentivado un campo de desarrollo importante para dicha herramienta.
Las limitaciones a nivel teórico se generaron debido a que Nash presentó una solución dentro de lo que ahora conocemos como juegos estáticos con información completa y sin repetición, pero esos tres apellidos simplificaban mucho el mundo de estrategias con el que funciona el mundo real.
Centrarse dentro de situaciones estáticas sin repetición es una gran limitante, porque la mayoría de las relaciones de largo plazo se construyen de manera dinámica y en juegos repetidos. El problema es que cuando un determinado juego se repite un número finito de veces los resultados son decepcionantes, puesto que el equilibrio del juego repetido es simplemente repetir en cada etapa un equilibrio de Nash del juego estático. Por tanto, si queremos encontrar resultados de equilibrios donde los jugadores cambien sus estrategias, aprendan y cooperen, es necesario plantear repeticiones infinitas. La idea básica de esto es que cada periodo tenga un mañana donde se puedan castigar comportamientos no deseados, y para que el castigo futuro sea efectivo para reprimir traiciones en el presente, se necesita que el futuro sea lo suficientemente largo (que no termine), al tiempo que los agentes valoren adecuadamente dicho futuro.
Volver los juegos dinámicos y con repeticiones es lo que se conoce dentro de la teoría de juegos como teoremas Folk, y establecen prácticamente lo que los jugadores pueden conseguir con distintos niveles de paciencia.
La segunda limitación del equilibrio de Nash, es que en sus inicios se encontró restringido a la llamada forma normal. Esto es, la forma en que se representaba una situación estratégica para tomar decisiones simultáneas y cuando todos los jugadores poseían la misma información del juego.
La forma extensiva de los juegos (propuesta por Harrold Kuhn) permite enriquecer el análisis al especificar el orden exacto en que los jugadores toman sus decisiones y la información que cada uno posee, pero el problema con los juegos de forma extensiva es que el concepto de equilibrio de Nash se vuelve débil tanto porque comienza a aparecer un número elevado de equilibrios (lo que vuelve impredecible el juego) tanto porque algunos de ellos incorporan un comportamiento irracional.
Un juego básico puede demostrar lo anterior: “El jugador A decide repartir 100 monedas de oro entre él y el jugador B. Jugador A decide exactamente cómo repartir ese dinero, y B decides si acepta o no dicha repartición. En caso de que no lo acepte las monedas desaparecen.”
Si uno resuelve este juego utilizando el equilibrio de Nash encontrará que el equilibrio es “A ofrece las 100 monedas de oro y B aceptes la repartición, cualquier otro ofrecimiento lo rechaza B”. Este es un equilibrio de Nash porque A debe creer que B rechazaría cualquier ofrecimiento distinto de 100 monedas de oro, y B debería saber que A sabe que B rechazaría cualquier otra oferta. Sin embargo, este equilibrio de Nash tiene un comportamiento irracional, porque para cualquier jugador que tenga una estrategia de maximización de beneficios (racionalidad individual) cualquier repartición de monedas es mejor a no tener nada (99 monedas son mejor que cero).
Este tipo de problemas es lo que en teoría de juegos se conoce como “amenazas no creíbles” y puede arrojar equilibrios de Nash irracionales (sobre todo cuando el juego es no simultáneo, como se presentan en forma extensiva). Por lo que para excluir este tipo de resultados se generan subjuegos perfectos, un refinamiento ideado por Selten en 1965, y que acota el equilibrio de Nash a acciones donde se maximiza la utilidad no sólo en la historia del juego, sino en cualquier historia posible, o dicho de otra forma; el subjuego perfecto exige racionalidad en cualquier subjuego y no sólo en aquellos que lleven a una senda de equilibrio.
Finalmente, la tercera y última limitación del equilibrio de Nash es que se partía del supuesto de información completa, en otras palabras, todos los jugadores conocen los pagos de todos los jugadores para distintas estrategias posibles, lo cual es clave para encontrar el equilibrio de Nash.
Harsanyi enfrentó este problema al modelar juegos con información asimétrica, introduciendo potencialmente distintos jugadores: el jugador A podía enfrentar distintos tipos de jugadores B, que podían diferenciarse preferencias y restricciones. El truco por tanto consiste en hacer más grande el juego original y suponer que hay un jugador imaginario llamado naturaleza que elige siguiendo una distribución de probabilidad conocida por los jugadores. Una vez que la naturaleza elige se comunica esto de forma individual y privada a cada jugador y a partir de entonces se genera un juego en condiciones normales.
La esencia por tanto es que las probabilidades con las que la naturaleza escoge son creencias de los otros jugadores (expectativas), y una vez que se completan dichas probabilidades se puede hallar un equilibrio de Nash, lo que se conoce como equilibrio bayesiano.
Ahora bien, la dificultad mayor esta cuando se trabaja con información imperfecta, que es cuando el jugador no conoce la historia del juego; esto es, las acciones generadas antes que él juegue, y no puede obtener una distribución de probabilidades, lo que limita su conocimiento acerca de lo que la naturaleza escoge, y a partir de donde se sigue trabajando actualmente.
Los juegos de la economía
Es bien sabido que a partir de los años 70 la teoría de juegos empezó a colarse de manera sigilosa dentro de la teoría económica, principalmente cuando diversos autores comenzaron a relajar uno de los supuestos esenciales del equilibrio general competitivo: la simetría de la información. George Akerlof inauguró esta revolución al preguntarse qué sucedería con el mercado si la información no estuviese distribuida simétricamente entre los agentes. Su respuesta fue devastadora: era posible que el mercado desapareciera o se redujese de forma importante debido a un problema de selección adversa, el cual podía ser aplicable a una multitud de situaciones. Razón que le llevó a justificar la aparición de instituciones públicas.
De manera simultánea Michael Spence complementó las reflexiones de Akerlof al detallar que las “estrategias” de los agentes para resolver el problema de selección adversa radicaban en usar mecanismos de señalización que revelasen información privada. Su modelo se desarrolló específicamente en el mercado laboral, donde el trabajador poseía una mejor información sobre su capacidad productiva que la empresa que contrata, y la fijación de salarios mediante este problema de información asimétrica. Debido a que el empresario no conoce la capacidad productiva de los trabajadores, debe ofrecer un salario igual a la productividad esperada (la productividad media), y esto puede llevar al colapso del mercado de trabajo como afirmó Akerlof, con una fijación de salarios inadecuada.
A partir de ahí, Spence intuyó que los empresarios buscaban algún parámetro que les permitiese obtener información acerca de la productividad laboral, como es la educación.
Stiglitz haría lo propio en el caso de información asimétrica inferior en el marco de los seguros cuando las empresas no conocen el riesgo de accidente de sus clientes.
Para todos estos trabajos, las aportaciones de la teoría de juegos fueron de notable importancia, porque permitía analizar la conducta estratégica de los agentes en distintas situaciones, lo cual eran palabras mayores en el mundo de la economía, porque una vez que se puede analizar el comportamiento estratégico se abre la puerta para diseñar instituciones donde los resultados de las interacciones estratégicas se determinen por las autoridades hacia un equilibrio deseable desde algún punto de vista.
A partir de aquí se generó una rama de la economía conocida como teoría del diseño de mecanismos, cuyo objetivo fundamental era el diseño de instituciones que satisficieran determinados objetivos independientemente de la información que es conocida por el diseñador.
La dificultad de esta tarea no obstante, es que pueden existir una infinidad de mecanismos imaginables, por lo que tratar de responder a la pregunta de si existe un mecanismo que implemente una decisión eficiente resulta ser excesivamente complejo. Para enfrentar este problema, Roger Myerson formuló el llamado principio de revelación, donde permite que el diseñador se centre en mecanismos directos.
Los mecanismos directos se entienden como el espacio de mensajes disponibles para los jugadores, lo que se denomina comúnmente espacio de tipos. De esta forma, la tarea de los jugadores es decir cuál es su tipo, y el diseñador puede encausar (si bien la dificultad es que obviamente se puede mentir).
Lo que Roger Myerson demostró en particular, es que por cada mecanismo que se nos pueda ocurrir, debe existir un mecanismo directo equivalente, es decir; que dé el mismo resultado, y la búsqueda de mecanismos (instituciones) se restringe a mecanismos directos compatibles con los incentivos (o sea los que dicen la verdad acerca del tipo de equilibrio).
El principio de revelación deja abierta, sin embargo, una pequeña rendija por la que podría escaparse todo su poder: a veces un mecanismo admite más de un equilibrio, y aunque sepamos que uno de ellos cumple con la propiedad deseada, es posible que el resto de los equilibrios no lo haga. Así que no tenemos la seguridad de que la institución económica que describe el mecanismo realmente nos ayude a la hora de perseguir nuestros objetivos.
La cuestión por tanto es que en el diseño de mecanismos, todos los equilibrios (y no sólo uno), cumplan con la propiedad deseada, lo que dio paso a la teoría de la implementación.
Aquí se requiere que los incentivos individuales estén alineados con los objetivos sociales. Hay veces que esta alineación surge de forma espontánea, como ocurre en los mercados competitivos (el primer teorema del bienestar en economía establece que: todo equilibrio competitivo es eficiente).
El problema es que no siempre podemos conseguir que el mercado para la asignación de un bien sea competitivo, que es uno de los trabajos en los que se ha ocupado Alvin Roth. Hay bienes para los que no existe un número elevado de demandantes y oferentes, por lo que el mercado no puede ser competitivo, ¿cómo podemos entonces conseguir una alineación entre incentivos individuales y objetivos sociales?; a través de la implementación de incentivos.
Esta implementación puede establecerse con distintos esquemas: o bien mediante la redacción de contratos formales que puedan llevarse a un tribunal, o bien mediante el establecimiento de relaciones de largo plazo. Así la teoría de implementación (subrama de la teoría del diseño de mecanismos) se ocupa de como diseñar los contratos, y la teoría de juegos repetidos se encarga de brindar recompensas y castigos por futuras interacciones. Lo que sigue dando premios Nobel en la economía actualmente.
El futuro de la teoría de juegos tras Nash
El trabajo original de Nash cimentó las bases de la teoría de juegos moderna, y fundamentó la manera de encontrar soluciones estratégicas en ambos mundos de la teoría de juegos; pero fue su generalización a través de los juegos dinámicos de información imperfecta con repeticiones que esta herramienta avanzó de manera significativa.
En la época de Nash el supuesto de información perfecta reinaba en la economía. En los ochenta, la ciencia económica avanzó hacia la información imperfecta, y hasta hace unos años, el supuesto de racionalidad perfecta era central. El relajamiento de este supuesto es lo que está motivando el avance de la teoría de juegos.
La economía del comportamiento ya ha avanzado de manera importante en este trayecto al comenzar a combinar rasgos de la psicología y la economía, al mostrar que los seres humanos tenemos limitaciones cognitivas y de cálculo, lo que restringe a su vez nuestra capacidad para optimizar.
El primero en advertirlo fue Herbert Simon en la década de los 50, cuando acuñó el término de racionalidad limitada. El punto aquí, es que si existen límites cognitivos y de cálculo, entonces tiene mucho sentido que los seres humanos utilicemos reglas simples (de dedo) a la hora de tomar decisiones en lugar de resolver óptimamente un problema.
La incorporación de esta “irracionalidad” ha florecido enormemente desde hace varios años, y uno de los campos más nutridos son las propias finanzas, que incorporaron dentro de su análisis el estudio de las finanzas conductuales.
Hay de hecho todo un conjunto de anomalías en el comportamiento de los inversionistas que se suelen explicar con argumentos psicológicos más que económicos (como en propio Keynes hizo dentro de la Teoría General).
Un segundo pilar de la economía del comportamiento es el llamado sesgo hacia el presente, donde se muestra que los seres humanos decidimos sin tener en cuenta siempre las consecuencias de largo plazo, lo que implica que hacemos una especie de descuento hiperbólico donde se penaliza el momento futuro respecto al presente. Algo que ya está muy bien incorporado dentro de las teorías del consumo intertemporal en la economía
Por último, un tercer planteamiento de la economía del comportamiento es que los seres humanos sacrificamos pagos propios por ayudar a los demás, en una especie de altruismo económico.
Es muy probable que en consecuencia con esto, la teoría de juegos después de Nash avance hacia una especie de teoría de juegos del comportamiento, y hay muchas líneas de investigación sobre esta nueva corriente que parecen ya estarse desarrollando, como son: las funciones de utilidad social; el análisis de la primera jugada; y los juegos evolutivos. Todas ellas representan un nuevo paradigma frente al juego tradicional estudiado por Nash en los cincuenta.
Las funciones de utilidad social consisten en hacer ver que los pagos de los rivales tienen un peso sobre nuestras decisiones, lo que incorpora una especie de aversión a la desigualdad entre los individuos y acciones reciprocas (una especie de simetría de pagos).
La primera jugada hace referencia a que cuando los jugadores interactúan por primera vez las estrategias de los jugadores no siguen una razonamiento similar a un equilibrio de Nash (algo que ha estado demostrándose a través de la economía experimental), lo que supone que hay una especie de “aprendizaje” en los primeros juegos, y que los jugadores van encontrando estrategias óptimas mediante ensayo y error, sin llegar inmediatamente a un equilibrio.
Finalmente, uno de los grandes grupos de la nueva frontera en teoría de juegos es en efecto los modelos evolutivos, donde se supone que cada jugador está determinado genéticamente para jugar una estrategia mediante un emparejamiento aleatorio entre distintos jugadores de una población. Aquellas estrategias que consiguen pagos mayores se hacen relativamente más frecuentes en la población. Esta interacción genera lo que se denomina dinámica del replicador donde sólo van sobreviviendo cierto tipo de estrategias en una especie de dinámica darwinista.
Esto ha abierto un mar de nuevas reflexiones, porque los jugadores por ejemplo, ya no tienen que formar expectativas del juego de sus rivales cuando hay información asimétrica, sino que responden al estímulo de un pago recibido tras desarrollar cierta jugada, y van actualizando sus estrategias. En este sentido, los jugadores dejan de ser bayesianos, y entran en lo que se conoce como juego ficticio, donde cada jugador supone que su rival escoge estrategias a partir de una distribución de probabilidad estacionaria, y por lo tanto eligen con base a una frecuencia histórica, lo que es una especie de estrategia por refuerzo.
Más recientemente ha aparecido los modelos de Experience-weighted Attraction Learning, que combinan modelos de aprendizaje entre estrategias de refuerzo y creencias bayesianas, lo que ha mostrado amplia capacidad para predecir comportamientos evolutivos.
Asimismo, se está trabajando en el Quantal-Response Equilibrium (QRE), que podemos traducir como equilibrio de respuestas estocásticas, donde básicamente los jugadores pueden cometer errores a la hora de escoger sus estrategias, pero se asume que no todos los errores tienen probabilidades iguales, por lo que los errores más probables son los que tienen un menor costo asociado y viceversa. El resultado muestra que los jugadores son más proclives a elegir buenas estrategias, aunque no necesariamente la mejor, por lo que no alcanzan el equilibrio de Nash sino un QRE, entendido como el estado donde coinciden las creencias de los jugadores acerca del juego de sus rivales con las probabilidades con las que estos eligen sus estrategias.
Esto resulta muy interesante, porque el QRE está basado en un modelo logit, donde las probabilidades son proporcionales a la exponencial del pago esperado, y el factor se proporcionalidad (el odd-ratio) puede interpretarse como una medida de la racionalidad del individuo. Si es muy pequeño, entonces el individuo elige prácticamente de forma aleatoria, mientras que en el extremo contrario, el jugador que es muy sensible al pago esperado se acerca a escoger la mejor estrategia posible. Por tanto, en el límite, un QRE tiende al equilibrio de Nash.
En suma, la teoría de juegos después a dos años de Nash, aún sigue desdoblándose de la camisa de fuerza con la que el autor empezó a modelar la interacción estratégica. El tabique de la racionalidad es el nuevo frente de la teoría de juegos, y aunque hay muchas semillas plantadas, aún falta que terminen de germinar.
