Introducción A La Teoría de Juegos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 51

Introducción a la Teoría de

Juegos No Cooperativos

1
¿Qué es un Juego?
Un juego es un modelo estilizado que representa una situación de comportamiento estratégico
entre varios agentes (usualmente llamados jugadores), en donde los pagos (o beneficios) que
recibe cualesquiera de estos agentes dependen de su propio actuar así como del actuar de los
otros agentes que participan en el juego.

Note que un juego introduce una serie de consideraciones importantes. La estrategia óptima de
cualesquier jugador depende de su propia conjetura acerca del actuar de los otros jugadores.
Porque los otros jugadores actúan en forma similar, cuando un jugador arma la conjetura acerca
de lo que harán los otros jugadores, puede que éste necesite conjeturar lo que los otros
jugadores conjeturan acerca de su propio comportamiento, y así sucesivamente.

Adicionalmente, si la interacción estratégica se lleva a cabo durante varios periodos, cada juga-
dor debe tomar en cuenta que sus acciones presentes afectaran las conjeturas y las acciones fu-
turas de los otros jugadores en el futuro

2
3
¿Qué es la Teoría de Juegos?
La teoría de los juegos es una colección de herramientas que sirve para predecir las acciones
que adoptan un grupo de agentes que interactúan entre sí, cuyas acciones individuales afectan
directamente a los beneficios de todos los agentes participantes.

La teoría de juegos es especialmente útil cuando:


1. Las acciones individuales de cada agente afectan directamente a los beneficios de todos los
agentes participantes.
2. El número de agentes que interactúan es pequeño, en cuyo caso la acción de cada agente
puede tener un efecto significativo en la rentabilidad de los otros agentes participantes.

Por lo tanto, la teoría de los juegos es extremadamente útil en el análisis de industrias com-
puestas por un número pequeño de empresas competidoras, ya que cualquier acción de cada
empresa, ya sea la elección del precio, la cantidad producida, la investigación y el desarrollo o
las técnicas de comercialización, tiene un efecto importante sobre los beneficios de las empre-
sas que compiten con ésta.
4
Anotación
El análisis de teoría de juegos que vamos a llevar a cabo va a estar únicamente enmarcado en
las necesidades del curso de “organización industrial” que les he organizado. Por lo tanto, hay
una cantidad importante de temas en esta área del conocimiento que no vamos a analizar. Por
ejemplo,
1. En todos los modelos que les voy a explicar, los agentes tienen información perfecta acerca
de las acciones que tomaron los otros agentes y ellos mismos en el pasado.
2. Asimismo, vamos a suponer que las acciones de todos los agentes están enmarcadas en un
contexto de estrategias puras. Es decir, éstos no aleatorizan sus acciones como ocurriría en
el caso en que consideráramos estrategias mixtas.
3. Por último, todos los juegos considerados son juegos no cooperativos.

En el dado caso de que necesitemos más adelante en el curso algún concepto de teoría de jue-
gos que no este incluido en esta presentación, entonces con anterioridad les hare la introdu-
cción respectiva del concepto.
5
Juegos en Forma Normal
Un juego en forma normal se caracteriza porque:
1. Tiene un conjunto de 𝑁 jugadores cuyos nombres figuran en el conjunto 𝐼 = 1,2, … , 𝑁 .
2. Cada jugador 𝑖, 𝑖 ∈ 𝐼, tiene un conjunto de acciones 𝐴𝑖 el cual es el conjunto de todas las
acciones disponibles para el jugador 𝑖. Sea 𝑎𝑖 ∈ 𝐴𝑖 una acción particular tomada por el ju-
gador 𝑖. Por lo tanto, el conjunto de acciones del jugador 𝑖 es una lista de todas las acciones
disponibles para el jugador 𝑖 y, por tanto, 𝐴𝑖 = 𝑎1𝑖 , 𝑎2𝑖 , … , 𝑎𝑘𝑖 , donde 𝑘𝑖 es el número de
acciones disponibles para el jugador 𝑖.
Sea 𝑎 ≡ 𝑎1 , 𝑎2 , … 𝑎𝑖 , … , 𝑎𝑁 una lista de las acciones elegidas por cada jugador. Llamamos a
esta lista de acciones elegidas por cada jugador 𝑖 un resultado del juego.
3. Cada jugador 𝑖 tiene una función de pago, 𝜋 𝑖 , que asigna un número real, 𝜋 𝑖 𝑎 , a cada re-
sultado del juego. Formalmente, cada función de pagos 𝜋 𝑖 mapea un vector N-dimensional,
𝑎 = 𝑎1 , … , 𝑎𝑁 (la acción de elegido por cada jugador), y le asigna un número real, 𝜋 𝑖 𝑎 .

6
Anotación
A menos de que se exprese lo contrario, vamos a suponer que los jugadores deciden sus accio-
nes de forma simultanea.

Claro que es importante hacer una aclaración acerca de este supuesto. Este supuesto también
aplica para aquellos juegos en los que aunque los jugadores no decidan sus acciones en forma
simultanea, cada jugador ha de tomar su decisión antes de conocer el actuar de los otros juga-
dores.

7
Ejemplo
Una forma sencilla de describir los datos que definen un juego en particular es mostrarlos en forma ma-
tricial. Por ejemplo, considere el siguiente juego: Dos países se plantean independientemente si van a llevar a cabo una con-
País 2 frontación armada entre ellos. Si ambos países juegan GUERRA, entonces
cada país gana una utilidad de 1. Si ambos países juegan PAZ, entonces ca-
Guerra Paz
da país gana una utilidad de 2. Si un país juega a GUERRA mientras que el
Guerra 1,1 3,0 otro juega a PAZ, entonces el país agresivo alcanza la máxima utilidad posi-
País 1 ble, ya que "gana" una guerra contra el país no violento sin ningún esfuer-
Paz 0,3 2,2 zo. Bajo este resultado, la utilidad del "país pacifista" debería ser la más ba-
ja posible (igual a cero en nuestro ejemplo).
Este cuadro contiene todos los datos necesarios para definir correctamente un juego de acuerdo con la
definición de la pasada diapositiva:
1. Tenemos dos jugadores, 𝑁 = 2, llamados país 1 y 2.
2. Los dos jugadores tienen los mismos conjuntos de acción: 𝐴1 = 𝐴2 = {𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍}. Hay exactamente
cuatro resultados para este juego: 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 , 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 , (𝑃𝐴𝑍, 𝐺𝑈𝐸𝑅𝑅𝐴), (𝑃𝐴𝑍, 𝑃𝐴𝑍).
3. Las entradas de la matriz (es decir, los cuatro cuadrados) contienen las ganancias del jugador 1 (en el lado
izquierdo) y del jugador 2 (en el lado derecho), correspondiente al resultado relevante del juego. Por
ejemplo, el resultado 𝑎 = (𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍) especifica que el jugador 1 juega a la guerra mientras que el
jugador 2 juega la paz. El pago para el jugador 1 es 𝜋 1 𝑎 = 𝜋 1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 = 3. Similarmente, el pa-
go para el jugador 2 es 𝜋 2 𝑎 = 𝜋 2 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 = 0, ya que el país 2 no se defiende a sí mismo. 8
Ejemplo
En la literatura, el juego descrito en la anterior diapositiva se conoce comúnmente como el juego del
Dilema de los Prisioneros. En lugar de tener dos países luchando en una guerra, considere a dos pre-
sos sospechosos de haber cometido un crimen, por lo que la policía carece de pruebas suficientes
para condenar a cualquiera de los sospechosos. Los dos presos son colocados en dos celdas aisladas
diferentes y se les ofrece un castigo menor (o una recompensa más alta) si confiesan haber cometi-
do conjuntamente este crimen. Si reemplazamos GUERRA con CONFESAR, y PAZ con NO CONFESAR,
obtenemos el llamado juego de Dilema de Prisioneros
Preso 2
Confesar No Confesar
Confesar 1,1 3,0
Preso 1 No Confesa 0,3 2,2

9
Conceptos de Equilibrio
Con el fin de hacer predicciones, tenemos que desarrollar métodos y definir algoritmos para
reducir el conjunto de todos los resultados a un conjunto más pequeño que llamamos resulta-
dos de equilibrio. También debemos especificar las propiedades que consideramos deseables
para que un equilibrio se cumpla.
Antes de proceder a definir nuestro primer concepto de equilibrio, necesitamos definir una no-
tación adicional. Recordemos que un resultado del juego 𝑎 = 𝑎1 , 𝑎2 , … , 𝑎𝑁 es una lista de lo
que hacen los 𝑁 jugadores (jugando). Ahora, elige a un jugador determinado, a quien llamare-
mos jugador 𝑖. Elimine del resultado 𝑎 la acción jugada por el jugador 𝑖. Entonces, nos queda-
mos con la lista de lo que todos los jugadores están jugando, excepto el jugador 𝑖, que denota-
mos como 𝑎¬𝑖 . Formalmente, 𝑎 ¬𝑖 ≡ 𝑎1 , … , 𝑎𝑖−1 , 𝑎𝑖+1 , … , 𝑎𝑁
Por lo tanto, podemos expresar un resultado como la unión de la acción del jugador 𝑖 con todas
las acciones de los otros jugadores. Es decir, un resultado puede expresar como 𝑎 = 𝑎𝑖 , 𝑎¬𝑖

10
1. Equilibrio en Estrategias Dominantes
Nuestro primer concepto de equilibrio, llamado equilibrio en estrategias dominantes, es un
equilibrio altamente deseable, en el sentido de que si existe, describe la predicción más intuiti-
vamente plausible de lo que los jugadores realmente harían.

Una acción particular 𝑎𝑖 ∈ 𝐴𝑖 es una acción dominante para el jugador 𝑖 si no importa lo que
jueguen todos los demás jugadores, jugar 𝑎𝑖 maximiza siempre la ganancia del jugador 𝑖. For-
malmente, para cada elección de acciones de todos los jugadores excepto 𝑖, 𝑎¬𝑖 , se tiene que
𝜋 𝑖 𝑎𝑖 , 𝑎¬𝑖 ≥ 𝜋 𝑖 𝑎𝑖 , 𝑎¬𝑖 para todo 𝑎𝑖 ∈ 𝐴𝑖 .

Por ejemplo, en el juego del siguiente cuadro la acción 𝐺𝑈𝐸𝑅𝑅𝐴 es una acción dominante para
el País 1. País 2
Guerra Paz Prueba: Note que al País 1 siempre le va mejor jugando a
Guerra 1,1 3,0 𝐺𝑈𝐸𝑅𝑅𝐴 sin importar lo que juegue el País 2,
País 1 • 𝜋 1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 = 1 ≥ 0 = 𝜋 1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍
Paz 0,3 2,2 • 𝜋 1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 = 3 ≥ 2 = 𝜋 1 𝑃𝐴𝑍, 𝑃𝐴𝑍
11
1. Equilibrio en Estrategias Dominantes
Note que si un jugador tiene una estrategia dominante y si este jugador es racional, se espera
que el jugador escoja la estrategia dominante. Note que éste jugador no necesita asumir que el
otro jugador es racional. Aún más ni siquiera tenemos que asumir que el jugador en cuestión
conoce los pagos de los otros jugadores.

Pasamos ahora a definir nuestro primer concepto de equilibrio. Un equilibrio en estrategias do-
minantes es simplemente un resultado en el que cada jugador juega una acción dominante.
Formalmente, un resultado 𝑎1 , 𝑎2 , … , 𝑎𝑁 (donde 𝑎 𝑖 ∈ 𝐴𝑖 para cada 𝑖 = 1, 2, … , 𝑁) se dice
que es un equilibrio en acciones dominantes si 𝑎 𝑖 es una acción dominante para cada jugador 𝑖.

12
1. Equilibrio en Estrategias Dominantes
Evidentemente, como 𝐺𝑈𝐸𝑅𝑅𝐴 es una acción dominante para cada jugador en:
País 2
Guerra Paz
Guerra 1,1 3,0
País 1 Paz 0,3 2,2

el resultado 𝑎1 , 𝑎2 = 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 es un equilibrio en las acciones dominantes. Aun-


que un equilibrio en las acciones dominantes es una predicción racional de cómo los jugadores
pueden interactuar en el mundo real, lamentablemente, este equilibrio no existe para la mayo-
ría de los juegos que nos interesan. Para demostrar este punto, analicemos el siguiente juego
popularmente conocido como la Batalla de los Sexos:
Luis
Opera (𝜔) Futbol (𝜙)
Opera (𝜔) 2,1 0,0
Jeimmy Futbol (𝜙) 0,0 1,2 13
1. Equilibrio en Estrategias Dominantes
Luis
Opera (𝜔) Futbol (𝜙)
Opera (𝜔) 2,1 0,0
Jeimmy Futbol (𝜙) 0,0 1,2

La intuición detrás de este juego es que es relativamente importante que Jeimmy y Luis estén
juntos. Es decir, suponiendo que los pagos a los jugadores en la tabla representan utilidades pa-
ra cada jugador bajo cada resultado, cada jugador gana la utilidad más baja posible cuando el ju-
gador va solo a uno de estos eventos de entretenimiento. Ambos ganan una mayor utilidad si
van juntos a uno de estos eventos. Sin embargo, comparando los dos resultados donde los juga-
dores están "juntos", podemos observar que Jeimmy prefiere la 𝑂𝑃𝐸𝑅𝐴, mientras que Luis pre-
fiere el 𝐹𝑈𝑇𝐵𝑂𝐿. Así, la batalla de los sexos también se conoce como el juego de la coordina-
ción. Este tipo de juego describe algunas situaciones de la vida real. Por ejemplo, el juego de la
Batalla de los Sexos resulta ser un marco teórico ideal para modelar dos firmas con dos acciones
disponibles: elegir el estándar 1, o el estándar 2. El hecho de no tener ambas empresas eligien-
do el mismo estándar puede hacer que los consumidores rechacen el producto, llevando a que
las dos empresas obtengan cero beneficios. 14
1. Equilibrio en Estrategias Dominantes
Después de formular el juego de la Batalla de los Sexos, ahora buscamos encontrar algunas pre-
dicciones para este juego. Luis
Opera (𝜔) Futbol (𝜙)
Opera (𝜔) 2,1 0,0
Jeimmy Futbol (𝜙) 0,0 1,2

No existe un equilibrio en estrategias dominantes para el juego de la Batalla de los Sexos.


Prueba. Basta con demostrar que uno de los jugadores (por ejemplo, Jeimmy) no tiene una es-
trategia dominante. Si Luis elige 𝑎𝐿 = 𝜔, entonces Jeimmy elegiría 𝜔 porque
𝜋 𝐽 𝜔, 𝜔 = 2 > 0 = 𝜋 𝐽 𝜙, 𝜔
Sin embargo, cuando Luis va a un partido de fútbol, 𝑎𝐿 = 𝜙, entonces Jeimmy elegiría 𝜙 porque
𝜋 𝐽 𝜙, 𝜙 = 1 > 0 = 𝜋 𝐽 𝜔, 𝜙

15
1. Equilibrio en Estrategias Dominadas
En el juego de abajo note que ninguno de los jugadores tiene una estrategia dominante.

Jugador 2
L C R
T 1,1 2,0 1,1
Jugador 1
M 0,0 0,1 0,0
B 2,1 1,0 2,2

Sin embargo, note que el jugador 1 tiene una estrategia dominada 𝑀. Es decir, una estrategia
que le implica pagos menorescon respecto a alguna de sus otras estrategias disponibles. Mas
específicamente, si el jugador 2 juega 𝐿, 𝐶 o 𝑅 entonces para el jugador 1 es mejor escoger 𝑇 o
𝐵 en lugar de 𝑀.

Si un jugador tiene una estrategia dominada y si este jugador es racional, entonces no espera-
mos que el jugador juegue dicha estrategia. Es decir, si el jugador 1 es racional no esperamos
que juegue la estrategia 𝑀.
16
1. Equilibrio en Estrategias Dominadas
Jugador 2
L C R
T 1,1 2,0 1,1
Jugador 1
M 0,0 0,1 0,0
B 2,1 1,0 2,2

Suponga que el jugador 2 conoce los pagos del jugador 1 y, además, conoce que el jugador 1 es
racional. Entonces, el jugador 2 espera que el jugador 1 no juegue 𝑀. Bajo este contexto, en
donde el jugador 1 no juega 𝑀, el jugador 2 encuentra que su estrategia 𝐶 esta dominada (por
las estrategias 𝐿 o por 𝑅).
Asimismo, si el jugador 1 es racional, cree que el jugador 2 es racional, y cree que el jugador 2
cree que el jugador 1 es racional, entonces el jugador 1 encuentra que su estrategia 𝑇 esta
dominada por la estrategia 𝐵.
Finalmente, si el jugador 2 es racional, entonces el jugador 2 encuentra que su estrategia 𝐿 esta
dominada por la estrategia 𝑅.
17
En consecuencia, la solución del juego es 𝐵, 𝑅
1. Equilibrio en Estrategias Dominantes vs.
Equilibrio en Estrategias Dominadas
Note que el equilibrio (si es que existe) con estrategias dominadas es más restrictivo que el
equilibrio (si es que existe) con estrategias dominantes.

En un equilibrio con estrategias dominantes sólo se asume que los agentes son racionales (es
decir, agentes que maximizan su utilidad respectiva); mientras que en un equilibrio con estrate-
gias dominadas se tiene que asumir que cada agente es racional, que cada agente asume que
los otros agentes son racionales, que los otros agentes asumen que el agente asume que los
otros agentes asumen que él es racional, y así iterativamente dependiendo del número de
estrategias dominadas que sea necesario eliminar

18
2. Equilibrio de Nash
El juego de abajo no puede ser resuelto utilizando estrategias dominantes o estrategias domi-
nadas. Sin embargo, como veremos más adelante puede ser resuelto utilizando el concepto del
equilibrio de Nash.

Jugador 2
L C R
T 2,1 2,2 0,1
Jugador 1
M 1,1 1,1 1,1
B 0,1 0,0 2,2

19
2. Equilibrio de Nash
Hasta ahora no hemos podido desarrollar un concepto de equilibrio que seleccione un resultado
que sea una predicción "racional" para el juego de la Batalla de los Sexos. En 1951, John Nash
proporcionó una prueba de la existencia de un concepto de equilibrio (utilizado anteriormente
por Cournot al estudiar el duopolio) que se ha convertido en el concepto de equilibrio más utiliza-
do en el análisis de los juegos.
Un resultado 𝑎 = 𝑎1 , 𝑎2 , … , 𝑎𝑁 (donde 𝑎𝑖 ∈ 𝐴𝑖 para cada 𝑖 = 1, 2, … , 𝑁) se dice que es un equi-
librio de Nash si ningún jugador encuentra beneficioso desviarse a condición de que todos los
demás jugadores no se desvíen de sus estrategias jugadas. Formalmente, para cada jugador 𝑖 =
1, 2, … , 𝑁, 𝜋 𝑖 𝑎𝑖 , 𝑎¬𝑖 ≥ 𝜋 𝑖 𝑎𝑖 , 𝑎¬𝑖 para todo 𝑎𝑖 ∈ 𝐴𝑖 .
La metodología general para buscar qué resultados constituyen un equilibrio de Nash es verificar
si los jugadores se benefician de una desviación unilateral de un determinado resultado. Es decir,
para descartar un resultado como un equilibrio de Nash sólo necesitamos demostrar que uno de
los jugadores puede aumentar el beneficio al desviarse a una acción diferente a la jugada en este
resultado específico, suponiendo que todos los demás jugadores no se desvían. Una vez que en-
contramos un resultado en el que ningún jugador puede beneficiarse de ninguna desviación de la
acción jugada en ese resultado, podemos afirmar que encontramos un equilibrio de Nash 20
2. Equilibrio de Nash
Continuamos nuestra discusión del Equilibrio de Nash mostrando la relación entre este equilibrio
y el equilibrio en Estrategias Dominantes. Para demostrar la relación entre los dos conceptos de
equilibrio, primero buscamos los Equilibrios de Nash para el juego
País 2
Guerra Paz
Guerra 1,1 3,0
País 1 Paz 0,3 2,2

Recordemos que ya hemos encontrado que 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 es un equilibrio en Estrategias


Dominantes, pero ¿este hecho puede ayudarnos en la búsqueda de un Equilibrio de Nash para
este juego? sí, puede! Puesto que un Equilibrio Estrategias Dominantes significa que cada jugador
juega una Estrategia Dominante, por lo que ningún jugador encontraría beneficioso desviarse sin
importar cómo jueguen los otros jugadores. En particular, ningún jugador se desvía si los otros ju-
gadores se adhieren a sus Estrategias Dominantes. Por lo tanto, un Equilibrio en Estrategias Domi-
nantes es también un Equilibrio de Nash. Sin embargo, un Equilibrio de Nash no necesariamente
es un Equilibrio en Estrategias Dominantes 21
2. Equilibrio de Nash
País 2
Guerra Paz
Guerra 1,1 3,0 • 𝜋 1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 = 1 > 0 = 𝜋 1 𝑃𝐴𝑍, 𝐺𝑈𝐸𝑅𝑅𝐴
País 1 Paz 0,3 2,2 • 𝜋 2 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 = 1 > 0 = 𝜋 2 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍

Por lo tanto, el resultado 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 es un Equilibrio de Nash para el juego descrito
arriba. Verifiquen que ningún otro resultado en este juego es un Equilibrio de Nash . Por lo tanto,
este equilibrio se llama único. Asimismo, noten que en el juego de la Batalla de los Sexos existen
dos Equilibrios de Nash (los resultados 𝜔, 𝜔 y 𝜙, 𝜙 ) y no existe un Equilibrio en Estrategias
Dominantes
Luis
Opera (𝜔) Futbol (𝜙) • 𝜋 𝐽 𝜔, 𝜔 = 2 > 0 = 𝜋 𝐽 𝜙, 𝜔
Opera (𝜔) 2,1 0,0 • 𝜋 𝐿 𝜔, 𝜔 = 1 > 0 = 𝜋 𝐿 𝜔, 𝜙
Jeimmy Futbol (𝜙) 0,0 1,2 • 𝜋 𝐽 𝜙, 𝜙 = 1 > 0 = 𝜋 𝐽 𝜔, 𝜙
• 𝜋 𝐿 𝜙, 𝜙 = 2 > 0 = 𝜋 𝐿 𝜙, 𝜔 22
2. Equilibrio de Nash
El juego de abajo no puede ser resuelto utilizando estrategias dominantes o estrategias domi-
nadas. Sin embargo, puede ser resuelto utilizando el concepto del equilibrio de Nash. Demues-
tre que el juego tiene dos equilibrios de Nash: 𝐵, 𝑅 y 𝑇, 𝐶

Jugador 2
L C R
T 2,1 2,2 0,1
Jugador 1
M 1,1 1,1 1,1
B 0,1 0,0 2,2

23
2. Equilibrio de Nash
Hasta ahora hemos visto ejemplos donde hay uno o más Equilibrios de Nash. Es decir, como en el
juego de la Batalla de los Sexos, siempre es posible encontrar juegos con múltiples Equilibrios de
Nash. Si el equilibrio no es único, el modelo tiene una potencia de predicción baja. Por el contra-
rio, la tabla de abajo muestra un juego donde no existe un equilibrio de Nash. Por lo tanto, consi-
dere la variante del juego de la Batalla de los Sexos después de treinta años de matrimonio.
Luis
Opera (𝜔) Futbol (𝜙)
Opera (𝜔) 2,0 0,2
Jeimmy Futbol (𝜙) 0,1 1,0

La intuición detrás del juego es que después de treinta años de matrimonio, el deseo de Luis de
entretenerse junto con Jeimmy se ha desvanecido; Sin embargo, la actitud romántica de Jeimmy
se mantuvo como antes, y ella siempre tendría una mayor utilidad de estar junto con Luis en lu-
gar de sola.

24
2. Equilibrio de Nash
Ahora desarrollamos una herramienta llamada Funciones de Mejor Respuesta que facilita la bús-
queda de los Equilibrios de Nash.
En un juego de dos jugadores, la función de mejor respuesta del jugador 𝑖 es la función 𝑅 𝑖 𝑎 𝑗 ,
donde para cada acción dada 𝑎 𝑗 del jugador 𝑗, el jugador 𝑖 asigna una acción 𝑎𝑖 = 𝑅 𝑖 𝑎 𝑗 que
maximiza su ganancia 𝜋 𝑖 𝑎𝑖 , 𝑎 𝑗 .
Generalizando, en un juego de N-jugadores, la función de mejor respuesta del jugador 𝑖 es la fun-
ción 𝑅 𝑖 𝑎¬𝑖 , donde para las acciones dadas 𝑎¬𝑖 de los jugadores 1, 2, … , 𝑖 − 1, 𝑖 + 1, … , 𝑁, el ju-
gador 𝑖 asigna una acción 𝑎𝑖 = 𝑅 𝑖 𝑎¬𝑖 que maximiza su ganancia 𝜋 𝑖 𝑎𝑖 , 𝑎¬𝑖
Construyamos ahora las funciones de mejor respuesta para Luis y Jeimmy descritas en el juego de
la Batalla de los Sexos. Es fácil concluir que
Luis
𝜔 𝑠𝑖 𝑎 𝐿 = 𝜔 𝜔 𝑠𝑖 𝑎 𝐽 = 𝜔
Opera (𝜔) Futbol (𝜙) 𝑅𝐽 𝑎𝐿 = 𝐿 𝐽
y 𝑅 𝑎 =
𝜙 𝑠𝑖 𝑎 𝐿 = 𝜙 𝜙 𝑠𝑖 𝑎 𝐽 = 𝜙
Opera (𝜔) 2,1 0,0
Es decir, si Jeimmy juega 𝜔, la "mejor respuesta" de Luis es jugar 𝜔,
Jeimmy Futbol (𝜙) 0,0 1,2 y si Jeimmy juega 𝜙, la "mejor respuesta" de Luis es jugar 𝜙, y así
25
sucesivamente.
2. Equilibrio de Nash
Si 𝑎 es un Equilibrio de Nash, entonces 𝑎𝑖 = 𝑅 𝑖 𝑎¬𝑖 para cada jugador 𝑖.
Prueba. Sabemos que en un Equilibrio de Nash cada jugador no se beneficia desviándose de la
estrategia jugada (dado que todos los demás jugadores no se desvían). Por lo tanto, cada jugador
está en su función de mejor respuesta.
Es decir, en un Equilibrio de Nash, cada jugador elige una acción que es la mejor respuesta a las
acciones elegidas por los otros jugadores.
El procedimiento para encontrar un Equilibrio de Nash es ahora muy simple: Primero, calculamos
la función de mejor respuesta de cada jugador. En segundo lugar, verificamos qué resultados se
encuentran en las funciones de mejor respuesta de todos los jugadores. Los resultados que en-
contramos en las funciones de mejor respuesta de todos los jugadores constituyen los resultados
del Equilibrio de Nash. Por ejemplo, en el juego de la Batalla de los Sexos, los resultados 𝜔, 𝜔 y
𝜙, 𝜙 satisfacen las funciones de mejor respuesta de ambos jugadores y, por lo tanto, constitu-
yen Equilibrios de Nash.

26
Comparaciones de Bienestar entre Resultados
Hasta ahora, nuestro análisis se ha concentrado en definir conceptos de equilibrio que nos per-
mitan seleccionar resultados de equilibrio para predecir cómo los jugadores terminarán ac-
tuando cuando enfrenten juegos similares en el mundo real. Sin embargo, no hemos discutido
si los equilibrios propuestos producen resultados eficientes. Es decir, deseamos definir un con-
cepto de eficiencia que nos permita comparar los resultados desde el punto de vista del bienes-
tar. En particular, usando el criterio de eficiencia de Pareto, queremos investigar si hay resulta-
dos que producen mayores niveles de recompensa a algunos jugadores sin reducir los benefi-
cios de todos los otros jugadores. Por ejemplo, en el juego PAZ-GUERRA el resultado
𝑃𝐴𝑍, 𝑃𝐴𝑍 produce mayores ganancias para ambos jugadores en comparación con el resulta-
do 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 . En este caso, decimos que el resultado 𝑃𝐴𝑍, 𝑃𝐴𝑍 domina en el
sentido de Pareto al resultado 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 .
País 2
Guerra Paz
Guerra 1,1 3,0
País 1 Paz 0,3 2,2
27
Comparaciones de Bienestar entre Resultados
El resultado 𝑎 domina en el sentido de Pareto al resultado 𝑎 si
a) Para cada jugador 𝑖, 𝜋 𝑖 𝑎 ≥ 𝜋 𝑖 𝑎 y
b) Existe al menos un jugador 𝑗 para el cual 𝜋 𝑗 𝑎 > 𝜋 𝑗 𝑎 .
Un resultado 𝑎∗ es eficiente en el sentido de Pareto si no existe ningún resultado que domine
en el sentido de Pareto al resultado 𝑎∗ .
Los resultados 𝑎 y 𝑎 son no comparables en el sentido de Pareto si para algún jugador 𝑖,
𝜋 𝑖 𝑎 > 𝜋 𝑖 𝑎 ; pero para algún otro jugador j, 𝜋 𝑗 𝑎 > 𝜋 𝑗 𝑎 .
Por ejemplo, en el juego PAZ-GUERRA, los resultados 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 y 𝑃𝐴𝑍, 𝐺𝑈𝐸𝑅𝑅𝐴 no
son comparables en el sentido de Pareto. En el juego de la Batalla de los Sexos, los resultados
𝑂𝑃𝐸𝑅𝐴, 𝐹𝑈𝑇𝐵𝑂𝐿 y 𝐹𝑈𝑇𝐵𝑂𝐿, 𝑂𝑃𝐸𝑅𝐴 están dominados en el sentido de Pareto por cada
uno de los otros dos resultados. Los resultados 𝑂𝑃𝐸𝑅𝐴, 𝑂𝑃𝐸𝑅𝐴 y 𝐹𝑈𝑇𝐵𝑂𝐿, 𝐹𝑈𝑇𝐵𝑂𝐿 son
eficientes en el sentido de Pareto y también son no comparables en el sentido de Pareto

28
Juegos en Forma Extensiva
Nuestro análisis hasta ahora se ha concentrado en juegos de forma normal, donde los jugado-
res se limitan a elegir una acción al mismo tiempo. En esta sección analizamos juegos en los
que los jugadores pueden moverse en diferentes momentos y más de una vez. Estos juegos se
llaman juegos en forma extensiva. Los juegos en forma extensiva nos permiten introducir la
sincronización en el modelo.
Antes de presentar un tratamiento formal, consideremos el siguiente ejemplo. Un terrorista
aborda un vuelo desde Minneapolis a Nueva York. Después de treinta minutos, después de al-
canzar una altitud de crucero de treinta mil pies, el terrorista se acerca al piloto y susurra al pi-
loto que explotará una bomba si el piloto no vuela a Cuba. La figura de abajo describe el juego
Piloto-Terrorista. Un jugador es el piloto y el otro es el terrorista.

29
Juegos en Forma Extensiva

El juego está representado por un árbol, con un nodo de decisión inicial (punto 𝐼), otros nodos de deci-
sión (𝐼𝐼𝑁 e 𝐼𝐼𝐶 ) y nodos terminales (puntos finales). Las ramas que conectan los nodos de decisión y los
nodos de decisión con los nodos terminales describen las acciones disponibles para el jugador relevante
en un nodo de decisión particular.
En este juego Piloto-Terrorista, después de escuchar la amenaza del terrorista, el piloto se convierte en el
jugador que elige una acción en el nodo de partida. En el nodo de partida, el conjunto de acciones del
piloto está dado por 𝐴𝑃𝑖𝑙𝑜𝑡
𝐼 = 𝑁𝑒𝑤 𝑌𝑜𝑟𝑘, 𝐶𝑢𝑏𝑎 . Dependiendo de qué acción es escogida por el piloto,
el terrorista tiene su turno de moverse en el nodo 𝐼𝐼𝐶 o 𝐼𝐼𝑁 . El conjunto de acciones del terrorista es
𝐴𝑇𝑒𝑟𝑟𝑜𝑟𝑖𝑠𝑡
𝐼𝐼𝐶 = 𝐵, 𝑁𝐵 en el nodo 𝐼𝐼𝐶 y 𝐴𝑇𝑒𝑟𝑟𝑜𝑟𝑖𝑠𝑡
𝐼𝐼𝑁 = 𝐵, 𝑁𝐵 en el nodo 𝐼𝐼𝑁 . En este juego, los conjuntos
de acción del terrorista son los mismos en ambos nodos, pero no siempre es así.
30
Juegos en Forma Extensiva
Un juego en forma extensiva es:
1. Un juego en forma de árbol que contiene un nodo inicial, otros nodos de decisión, nodos terminales
y ramas que enlazan cada nodo de decisión con nodos sucesores.
2. Una lista de 𝑁 ≥ 1 jugadores, indexados por 𝑖, 𝑖 = 1, 2, … , 𝑁.
3. Para cada nodo de decisión, se conoce el nombre del jugador con derecho a elegir una acción.
4. Para cada jugador 𝑖, existe una especificación de la acción de 𝑖 establecida en cada nodo que el
jugador 𝑖 tiene derecho a elegir una acción.
5. Una especificación de los pagos a cada jugador en cada nodo terminal.
Hasta ahora nuestra discusión de los juegos en forma extensiva ha enfatizado que un jugador
puede ser llamado para elegir una acción más de una vez y que cada vez que un jugador elige
una acción, el jugador tiene que elegir una acción del conjunto de acción disponible en ese no-
do particular. Por lo tanto, necesitamos definir el siguiente término.
Una estrategia para el jugador 𝑖 (denotada por 𝑠 𝑖 ) es un plan completo (lista) de acciones, una
acción para cada nodo de decisión que el jugador tiene derecho a elegir una acción.

31
Juegos en Forma Extensiva
Por lo tanto, es importante señalar que una estrategia no es lo que hace un jugador en un solo nodo
específico, sino que es una lista de lo que hace el jugador en cada nodo donde el jugador tiene derecho
a elegir una acción.
¿Cuáles son las estrategias disponibles para el terrorista en el juego Piloto-Terrorista? Puesto que el
terrorista puede terminar en cualquier nodo 𝐼𝐼𝐶 o 𝐼𝐼𝑁 , una estrategia para el terrorista sería una espe-
cificación de la acción precisa que él tomará en cada nodo. Es decir, aunque está claro que el terrorista
llegará al nodo 𝐼𝐼𝐶 o 𝐼𝐼𝑁 pero no a ambos, una estrategia para este jugador debe especificar lo que ha-
rá en cada uno de los dos nodos. Por lo tanto, el terrorista tiene cuatro posibles estrategias dadas por
𝐵, 𝐵 , 𝐵, 𝑁𝐵 , 𝑁𝐵, 𝐵 y (𝑁𝐵, 𝑁𝐵), donde el primer componente se refiere a la acción del terrorista
en el nodo 𝑰𝑰𝑪 , y el segundo componente se refiere a su acción en el nodo 𝑰𝑰𝑵 .
Dado que el piloto está limitado a hacer un movimiento sólo en el nodo 𝐼, y dado que su conjunto de
acciones tiene dos acciones posibles, este juego tiene ocho resultados dados por 𝑁𝑌, 𝐵, 𝐵 ,
𝑁𝑌, 𝐵, 𝑁𝐵 , 𝑁𝑌, 𝑁𝐵, 𝐵 , (𝐶, 𝑁𝐵, 𝑁𝐵 ), 𝑁𝑌, 𝐵, 𝑁𝐵 , 𝐶, 𝐵, 𝐵 , (𝐶, (𝑁𝐵, 𝐵))y (𝐶, (𝑁𝐵, 𝑁𝐵)).

32
Representación en forma normal de los
Juegos en Forma Extensiva
Ahora que el juego está bien definido, buscamos encontrar algunas predicciones. El primer pa-
so sería buscar un Equilibrio de Nash. Recordando nuestra definición de Equilibrio de Nash, en
juegos en forma extensiva buscamos un Equilibrio de Nash en estrategias, donde cada jugador
no puede aumentar la ganancia desviándose unilateralmente de la estrategia jugada en el re-
sultado del Equilibrio de Nash.
En muchos casos la transformación de un juego en forma extensiva en un juego en forma nor-
mal hace más fácil encontrar el Equilibrio de Nash. La siguiente tabla proporciona la represen-
tación el forma normal del juego Piloto-Terrorista descrito previamente.
Terrorista
(B,B) (B,NB) (NB,B) (NB,NB)
New York -1,-1 2,0 -1,-1 2,0
Piloto Cuba -1,-1 -1,-1 1,1 1,1

33
Representación en forma normal de los
Juegos en Forma Extensiva
Terrorista
(B,B) (B,NB) (NB,B) (NB,NB)
New York -1,-1 2,0 -1,-1 2,0
Piloto Cuba -1,-1 -1,-1 1,1 1,1

La tabla muestra que hay tres Equilibrios de Nash para este juego: (𝑁𝑌, (𝑁𝐵, 𝑁𝐵)) ,
(𝑁𝑌, (𝐵, 𝑁𝐵)) y (𝐶𝑈𝐵𝐴, (𝑁𝐵, 𝐵)). Tenga en cuenta que aquí, como en el juego de la Batalla de
los Sexos, los múltiples Equilibrios de Nash reducen considerablemente nuestra capacidad de
generar predicciones de este juego. Por esta razón, pasamos ahora a definir un concepto de
equilibrio que reduciría el conjunto de resultados del Equilibrio de Nash en un conjunto más
pequeño de resultados. En la literatura, un concepto de equilibrio que selecciona un número
menor de Equilibrios de Nash se denomina refinamiento del Equilibrio de Nash.

34
Los Subjuegos
Volvamos al juego Piloto-Terrorista y veamos los tres equilibrios de Nash para este juego. Compa-
rando los tres equilibrios de Nash , ¿considera que alguno de los equilibrios no es racional?
¿Qué sugerirías al piloto si éste te contratara como su consejero estratégico? Bueno, probable-
mente le dirías al piloto que vuele a Nueva York.
¿Por qué? Observando los pagos del terrorista en los nodos terminales de la figura, podemos ver
que si el piloto vuela a Nueva York, el terrorista escogerá 𝑁𝐵 (un pago de 𝜋 𝑡 = 0 en comparación
con 𝜋 𝑡 = −1 si lo hace), y el Piloto obtendrá una recompensa de 𝜋 𝑝 = 2 en comparación con una
recompensa de 𝜋 𝑝 = 1 por volar a Cuba. En otras palabras, después de que el piloto vuela a cual-
quier destino (Nueva York o Cuba), el pago del terrorista se maximiza eligiendo la acción 𝑁𝐵.
De esto concluimos que la limitación del concepto del Equilibrio de Nash es que no puede captar la
capacidad del piloto para predecir que el terrorista no tendrá el incentivo de explotar la bomba una
vez que el avión llegue a Nueva York (o a Cuba). Más precisamente, bajo los Equilibrio de Nash
𝐶𝑈𝐵𝐴, 𝑁𝐵, 𝐵 y (𝑁𝑒𝑤 𝑌𝑜𝑟𝑘, (𝐵, 𝑁𝐵)) el terrorista parece estar haciendo una amenaza no creí-
ble, ya que los pagos del terrorista en los nodos terminales indican que una vez que alcancen el
nodo 𝐼𝐼𝐶 o 𝐼𝐼𝑁 , el terrorista no explotará la bomba.
35
Los Subjuegos
Ahora queremos formalizar un concepto de equilibrio que excluya los equilibrios irracionales de
Nash. En particular, buscamos un concepto de equilibrio que excluya los resultados en los que el te-
rrorista se comprometa con la acción de la Bomba, ya que tal acción es no creíble. Además, busca-
mos definir un concepto de equilibrio donde el jugador que se mueva primero (el piloto en nuestro
caso) calcularía y tomaría en cuenta cómo los jugadores posteriores (el terrorista en el presente ca-
so) responderían a los movimientos de los jugadores que se mueven antes en el juego. Por lo tanto,
habiendo calculado cómo los jugadores subsiguientes responderán, el primer jugador puede optimi-
zar al reducir el conjunto de acciones dándole así mayores ganancias. En el ejemplo Piloto-
Terrorista, deseamos encontrar un concepto de equilibrio que genere un resultado único en el que
el piloto vuela a Nueva York.
Primero definimos lo qué es un subjuego de un juego.
Un subjuego es un nodo de decisión del juego original junto con los nodos de decisión y los nodos
terminales que siguen directamente a este nodo. Un subjuego se llama un subjuego propio si difiere
del juego original.

36
3. Equilibrio Perfecto en Subjuegos
El juego Piloto-Terrorista tiene tres subjuegos: Uno es el juego en sí, mientras que los otros dos son
subjuegos propios con los nodos 𝐼𝐼𝐶 e 𝐼𝐼𝑁 como nodos iniciales. Los dos subjuegos propios se ilus-
tran a continuación:

En 1965, Reinhard Selten propuso un refinamiento del concepto de equilibrio de Nash definido
como sigue:
Se dice que un resultado es un Equilibrio Perfecto en Subjuegos si induce un Equilibrio de Nash en
cada subjuego del juego original.
Un Equilibrio Perfecto en Subjuegos es una lista de estrategias, una para cada jugador, que consiste
en las acciones de los jugadores que constituyen un Equilibrio de Nash en cada subjuego. En particu-
lar, un Equilibrio Perfecto en Subjuegos debe ser un Equilibrio de Nash para el juego original ya que
el juego original es un subjuego de sí mismo. Tenga en cuenta que en cada subjuego, la acción 𝑁𝐵
es una Equilibrio de Nash. 37
3. Equilibrio Perfecto en Subjuegos
El resultado (𝑁𝑌, (𝑁𝐵, 𝑁𝐵)) es el único Equilibrio Perfecto en Subjuegos para el juego Piloto-
Terrorista.
Prueba: Dado que un Equilibrio Perfecto en Subjuegos es también un Equilibrio de Nash para el juego
original, basta con mirar los tres Equilibrios de Nash del juego original dados por (𝑁𝑌, (𝐵, 𝑁𝐵)),
(𝐶𝑢𝑏𝑎, (𝑁𝐵, 𝐵)) y (𝑁𝑌, (𝑁𝐵, 𝑁𝐵)). A continuación, cada subjuego propio tiene sólo un Equilibrio de
Nash , es decir, el terrorista elige 𝑁𝐵. Por lo tanto, dado que un resultado Equilibrio Perfecto en Sub-
juegos debe ser un Equilibrio de Nash para cada subjuego, concluimos que los resultados
𝑁𝑌, 𝐵, 𝑁𝐵 y (𝐶𝑢𝑏𝑎, (𝑁𝐵, 𝐵)) no son Equilibrios Perfectos en Subjuegos.
Finalmente, el resultado (𝑁𝑌, (𝑁𝐵, 𝑁𝐵)) es un Equilibrio Perfecto en Subjuegos ya que es un Equili-
brio de Nash para el juego original, y el resultado (acción) 𝑁𝐵 es el único Equilibrio de Nash para cada
subjuego propio 
Por lo tanto, hemos demostrado que el uso del Equilibrio Perfecto en Subjuegos , refina el Equilibrio
de Nash en el sentido de excluir algunos resultados que podemos considerar no racionales.

38
3. Equilibrio Perfecto en Subjuegos
Concluimos esta discusión de los Equilibrios Perfectos en Subjuegos, describiendo las metodologías
utilizadas comúnmente para encontrar Equilibrios Perfectos en Subjuegos. La metodología general
para encontrar los Equilibrios Perfectos en Subjuegos es utilizar la inducción hacia atrás, lo que signifi-
ca que comenzamos a buscar Equilibrios de Nash en los subjuegos que conducen a los nodos termi-
nales. Entonces, buscamos Equilibrios de Nash para los subjuegos que conducen los subjuegos que
conducen a los nodos terminales, tomando como dado las acciones Equilibrios de Nash que se
jugarán en los últimos subjuegos antes de los nodos terminales. Entonces, continuando resolviendo
hacia atrás, llegamos al nodo inicial y buscamos la acción que maximiza la ganancia del jugador 1,
dado el Equilibrios de Nash de todos los subjuegos propios. Obsérvese que la metodología de indu-
cción hacia atrás es particularmente útil cuando el árbol de juego es largo.
Por último, otra metodología es encontrar primero los resultados del Equilibrios de Nash para el
juego, por ejemplo, transformando la representación en forma extensiva en una representación en
forma normal. Entonces, una vez que tengamos el conjunto de todos los resultados del Equilibrios de
Nash, nos queda seleccionar los resultados que también son Equilibrios de Nash para todos los
subjuegos. Esto puede hacerse por ensayo y error, o descartando los Equilibrios de Nash del juego
original que no son Equilibrios de Nash para algunos subjuegos propios.
39
Juegos Repetidos
Un juego repetido es un juego de solo una jugada que se repite idénticamente más de una vez.
La importancia de analizar los juegos repetidos es que bajo ciertas circunstancias los resultados
cooperativos, que no son resultados de equilibrio bajo un juego de solo una jugada, pueden
emerger como resultados de equilibrio en un juego repetitivo y no cooperativo.
Un juego repetido es un tipo especial de juego en forma extensiva en el cual, en cada período,
todos los jugadores se mueven simultáneamente y el juego de acción de cada jugador no varía
con el tiempo. Más específicamente, un juego repetido es un juego de solo una jugada que se
repite por varios períodos. Cada período, después de que el juego se juega, los jugadores se
mueven al siguiente período. En un período posterior, los jugadores observan las acciones
elegidas por todos los jugadores (incluidos los suyos) en todos los períodos anteriores, y sólo
entonces eligen simultáneamente sus acciones para el nuevo juego. Por lo tanto, lo más impor-
tante para recordar es que los jugadores pueden supervisar perfectamente todas las acciones
elegidas en períodos anteriores antes de elegir una acción en un período posterior. Los datos
recogidos mediante un seguimiento perfecto de las acciones que se llevan a cabo en cada
período se denominan historia en un período.
40
Juegos Repetidos
1. La historia de un juego en el período 𝝉, 𝐻𝜏 , es la lista de resultados jugados en todos los
períodos 𝑡 = 1,2, … , 𝜏 − 1. 𝐻𝜏
2. Una estrategia de un jugador en un juego repetido 𝑇 veces, es una lista de acciones que el
jugador toma en cada período 𝑡, 𝑡 = 1, 2, … , 𝑇; Donde cada acción en el periodo 𝑡, 𝑎𝑡𝑖 ∈ 𝐴𝑖
se basa en la historia de un juego en el período 𝑡 (es decir, 𝑎𝑡𝑖 mapea una historia 𝐻𝑡 a una
acción en el conjunto 𝐴𝑖 ).
Por lo tanto, una estrategia de un jugador en un juego repetido es una lista de acciones que se
jugarán en cada período 𝑡, donde cada acción del jugador 𝑖 se basa en la lista de acciones ob-
servadas por todos los jugadores en todos los períodos 𝑡 = 1,2, … , 𝜏 − 1 resumido por la histo-
ria 𝐻𝜏 . Por lo tanto, el resultado de un juego repetido sería una lista de acciones que cada juga-
dor está tomando en cada período, mientras que el pago del período 𝜏 para cada jugador es
una función de las acciones jugadas por los jugadores en el período 𝜏.

41
País 2

Juegos Repetidos Guerra


Guerra
1,1
Paz
3,0
Considere nuestro juego PAZ-GUERRA: País 1 Paz 0,3 2,2

y supongamos que este juego se repite 𝑇 veces, en los períodos 1, 2, … , 𝑇, donde 𝑇 es un número entero
que satisface 1 ≤ 𝑇 ≤ ∞. Denotamos por 0 < 𝜌 < 1 el parámetro de descuento de tiempo para cada ju-
gador. Es decir, el parámetro 𝜌 es el valor presente de un peso que será recibido por el jugador en el si-
guiente periodo. Otra forma de interpretar 𝜌 es asumir que nuestros jugadores viven en un mundo con
mercados de capitales perfectos donde los jugadores pueden prestar o pedir prestado cualquier cantidad
de dinero a un interés (real) 𝑟, 𝑟 > 0. En este caso, podemos asumir que el interés real 𝑟 de la economía
1 1
se ajusta de modo que 𝑟 = − 1, o 𝜌 = .
𝜌 1+𝑟
Ahora hacemos el siguiente supuesto con respecto a las ganancias de los jugadores en un juego repetido:
Sea 𝑎𝑡𝑖 la acción tomada por el jugador 𝑖 en el periodo 𝑡, 𝑖 = 1, 2, 𝑡 = 1, 2, … , 𝑇. También, sea 𝜋𝑡𝑖 𝑎1𝑡 , 𝑎𝑡2
el pago en el período 𝑡 al jugador 𝑖, 𝑖 = 1, 2. Entonces, el pago al jugador 𝑖 cuando el juego se repite 𝑇
𝑖 𝑇 𝑡−1 𝑖 1 2 𝜋1𝑖 𝑎11 , 𝑎12 + 𝜌𝜋2𝑖 𝑎21 , 𝑎22 + ⋯ + 𝜌𝑇−1 𝜋 𝑇𝑖 𝑎1𝑇 , 𝑎2𝑇 𝑠𝑖 𝑇 < ∞
veces se define por Π ≡ 𝑡=1 𝜌 𝜋𝑡 𝑎𝑡 , 𝑎𝑡 = 𝑖 1 2 𝑖 1 2 2 𝑖 1 2
𝜋1 𝑎1 , 𝑎1 + 𝜌𝜋2 𝑎2 , 𝑎2 + 𝜌 𝜋3 𝑎3 , 𝑎3 + ⋯ 𝑠𝑖 𝑇 = ∞

Si el número de jugadores es mayor que dos, entonces reemplace 𝜋𝑡𝑖 𝑎1𝑡 , 𝑎𝑡2 con 𝑎𝑡 , donde 𝑎𝑡 =
𝑎1𝑡 , 𝑎𝑡2 , 𝑎𝑡3 , … . Asimismo, distinguimos entre dos tipos de juegos repetidos: un juego repetido finitamen-
te 𝑇 < ∞, y un juego repetido infinitamente 𝑇 = ∞
42
Juegos Repetidos Finitamente
Supongamos que el juego PAZ-GUERRA se repite 𝑇 veces, en los períodos 1, 2, … , 𝑇, donde 𝑇 es
un número entero finito que satisface 1 ≤ 𝑇 < ∞.
Anteriormente ya habíamos demostrado que (𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴) es el único Equilibrio de
Nash de este juego a una sola jugada. Supongamos ahora que el juego se juega dos veces en
dos períodos consecutivos (𝑇 = 2). ¿qué estrategias están disponibles para, por ejemplo, el
país 1? Más precisamente, ¿cuántas estrategias hay en la estrategia de país 1?
Existen 32 = 25 estrategias disponibles para el país 1 en este juego con dos acciones y que se
repite dos veces.
Prueba: Veamos primero el segundo período. En el segundo período podría haber cuatro histo-
rias posibles resultantes de las cuatro posibles listas del primer período de las acciones de los
jugadores. Es decir, la historia del período 2 satisface
𝐻2 ∈ 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 , 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 , (𝑃𝐴𝑍, 𝐺𝑈𝐸𝑅𝑅𝐴), (𝑃𝐴𝑍, 𝑃𝐴𝑍)

43
Juegos Repetidos Finitamente
En el segundo período, hay dos acciones posibles que el país 1 puede tomar: 𝐺𝑈𝐸𝑅𝑅𝐴 y 𝑃𝐴𝑍. Aho-
ra, para especificar completamente una estrategia, el país 1 tiene que especificar qué acción se to-
mará para cada historia posible. Por lo tanto; el número de acciones del segundo período es 24 .
Además, hay dos posibles acciones disponibles para el país 1 en el período 1. Por lo tanto, el núme-
ro de estrategias disponibles para el país 1 en un juego repetido de dos acciones y dos períodos es
2 × 2 4 = 25 .
Del mismo modo, si el juego se repite tres veces (𝑇 = 3), el conjunto de estrategias del país 1 con-
tiene 2,097,152 = 221 = 2 × 24 × 216 estrategias, ya que en el tercer período hay 16 = 4 × 4
historias posibles (resultantes de cuatro posibles listas de acciones de los jugadores en cada
período).

44
Juegos Repetidos Finitamente
Para cualquier entero finito 𝑇, 1 ≤ 𝑇 < ∞, el juego PAZ-GUERRA repetido 𝑇 veces tiene un único Equili-
brio Perfecto en Subjuegos donde cada país juega GUERRA en cada período.
(es decir, no importa cuántas veces se repita el juego de la PAZ-GUERRA, podría ser una, o podría ser un
billón de veces, el único Equilibrio Perfecto en Subjuegos es que todos los jugadores jueguen GUERRA
en cada período)
Prueba: Usando la inducción hacia atrás, suponga que los países ya han jugado en 𝑇 − 1 períodos, y que
ahora están listos para jugar el juego del período 𝑇, dado que el período 𝑇 es el último período en que
se juega el juego, el juego del período 𝑇 es idéntico al juego PAZ-GUERRA de una sola jugada. Por lo tan-
to, el único Equilibrio de Nash para el juego del período de 𝑇 es que todos los países jueguen GUERRA.
Ahora, considere el juego jugado en el período 𝑇 − 1. Ambos jugadores saben que después de que este
juego se complete, tendrán un último juego en el que ambos no cooperarán y jugarán GUERRA. Por lo
tanto, en 𝑇 − 1 todos los jugadores jugaran la estrategia dominante GUERRA. Trabajando hacia atrás, en
cada uno de los períodos precedentes 𝑇 − 2, 𝑇 − 3 hasta el período 1, podemos establecer que GUE-
RRA será jugada por todos los jugadores en cada período.
45
Juegos Repetidos Infinitamente
Ahora, supongamos que el juego se repite infinitamente muchas veces (es decir, 𝑇 = ∞). La di-
ferencia entre el juego repetido infinitamente y el juego pequeño o grande pero repetido finita-
mente es que en un juego repetido infinitamente, la inducción hacia atrás no puede utilizarse
para llegar a resultados de equilibrio, ya que no hay un período final para "iniciar" el proceso
de inducción hacia atrás.

46
Juegos Repetidos Infinitamente
La estrategia gatillo
Restringimos la discusión de la estrategia en juegos infinitamente repetidos a un tipo, llamados
estrategias gatillo. En la clase de estrategias gatillo, cada jugador coopera en el período 𝜏 (jugan-
do 𝑎𝜏𝑖 = 𝑃𝐴𝑍) mientras todos los jugadores cooperen en el período 𝜏 − 1. Sin embargo, si algún
jugador no cooperó y jugó GUERRA en el período 𝜏 − 1, el jugador 𝑖 "tira del gatillo" y juega la
acción no cooperativa para siempre! Es decir, 𝑎𝑡𝑖 = 𝐺𝑈𝐸𝑅𝑅𝐴 para cada 𝑡 = 𝜏, 𝜏 + 1, 𝜏 + 2, … .
Formalmente, se dice que el jugador 𝑖 está jugando una de gatillo si para cada período 𝜏, 𝜏 =
𝑗
1, 2, … , 𝑎𝜏𝑖 = 𝑃𝐴𝑍 𝑚𝑖𝑒𝑛𝑡𝑟𝑎𝑠 𝑎𝑡𝑖 = 𝑎𝑡 = 𝑃𝐴𝑍 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑡 = 1, … , 𝜏 − 1
𝐺𝑈𝐸𝑅𝑅𝐴 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜

Es decir, el país 𝑖 coopera jugando PAZ mientras ningún país (incluido él mismo) se desvíe del re-
sultado cooperativo. Sin embargo, en el caso de que un país se desvíe incluso una vez, el país 𝑖
castiga al país que se desvía al involucrarse en una GUERRA para siempre.

47
País 2
Guerra Paz
Juegos Repetidos Infinitamente Guerra 1,1 3,0
País 1 Paz 0,3 2,2

Equilibrio en estrategias gatillo


Ahora buscamos investigar en qué condiciones el resultado en el que ambos países juegan sus estrate-
gias gatillo constituye una Equilibrio Perfecto en Subjuegos.
Proposición: Si el factor de descuento es suficientemente grande, entonces el resultado en el que los
jugadores juegan sus estrategias gatillo es un Equilibrio Perfecto en Subjuegos. Formalmente, las estra-
1
tegias gatillo constituyen una Equilibrio Perfecto en Subjuegos si 𝜌 > .
2
Prueba: Veamos un período representativo, llamémoslo período 𝜏, y supongamos que el país 2 no se
ha desviado en los períodos 1, … , 𝜏. Entonces, si el país 1 se desvía y juega 𝑎1𝜏 = 𝐺𝑈𝐸𝑅𝑅𝐴, entonces
𝜋𝜏1 = 3. Sin embargo, dado que el país 1 se desvía, el país 2 se desviaría en todos los períodos subsi-
guientes y jugará 𝑎𝑡2 = 𝐺𝑈𝐸𝑅𝑅𝐴 por cada 𝑡 ≥ 𝜏 + 1, ya que el país 2 juega una estrategia gatillo. Por lo
tanto, desde el período 𝜏 + 1 y sucesivamente, el país 1 gana un beneficio de 1 cada período. Por lo
tanto, la suma en el período 𝜏 + 1 de los pagos descontados al país 1 para todos los períodos 𝑡 ≥ 𝜏 + 1
1
es 1 + 𝜌 + 𝜌2 + 𝜌3 + ⋯ = ∞ 𝑡=0 𝜌 𝑡
= . Por lo tanto, si el país 1 se desvía en el período 𝜏, su suma
1−𝜌
de pagos descontados es el pago de la suma del período 𝜏 de jugar GUERRA (mientras que el país 2 jue-
ga PAZ) igual a 𝜋𝜏1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 = 3, más la suma infinita descontada de pagos cuando ambos paí-
ses juegan GUERRA (suma de pagos descontados de 1 cada uno período). Así, si el país 1 se desvía de 48 …
País 2
Guerra Paz

Juegos Repetidos Infinitamente País 1


Guerra
Paz
1,1
0,3
3,0
2,2
∞ 𝜌
… PAZ en el período 𝜏, entonces Π𝜏1 = 𝜋𝜏1 𝐺𝑈𝐸𝑅𝑅𝐴, 𝑃𝐴𝑍 + 𝑡=𝜏+1 𝜌
𝑡−𝜏 1
𝜋𝜏 𝐺𝑈𝐸𝑅𝑅𝐴, 𝐺𝑈𝐸𝑅𝑅𝐴 = 3 + 1−𝜌

Sin embargo, si el país 1 no se desvía, ambos países juegan PAZ indefinidamente, ya que el país 2 juega
una estrategia gatillo. Por lo tanto, ambos países obtienen un beneficio de 2 cada período. Así,
∞ 2
Π𝜏1 = 𝑡=𝜏 𝜌
𝑡−𝜏 𝜋 1
𝜏 𝑃𝐴𝑍, 𝑃𝐴𝑍 =
1−𝜌
Al los dos resultados anteriores se obtiene la conclusión de que la desviación no es beneficiosa para el
2 𝜌 1
país 1 si >3+ → 2 > 3 1 − 𝜌 + 𝜌 → 2 > 3 − 2𝜌 → 2𝜌 > 1 → 𝜌 > .
1−𝜌 1−𝜌 2
Dado que ninguna desviación unilateral es beneficiosa para ningún país en cualquier subjuego que co-
mience en un período arbitrario 𝜏, concluimos que ninguna desviación unilateral es beneficiosa para
ningún país en cualquier período 𝑡.
Hasta ahora, hemos demostrado que cuando ambos países juegan la estrategia gatillo, ningún país tie-
ne el incentivo de desviarse unilateralmente de jugar PAZ. Sin embargo, para demostrar que las estrate-
gias gatillo constituyen un Equilibrio Perfecto en Subjuegos necesitamos demostrar que si un país se
desvía y juega a GUERRA, el otro país se adheriría a su estrategia gatillo y jugará GUERRA para siempre…
49
País 2
Guerra Paz

Juegos Repetidos Infinitamente País 1


Guerra
Paz
1,1
0,3
3,0
2,2

… Para demostrarlo, tenga en cuenta que si el país 1 se desvía de PAZ en el período 𝜏, entonces la estra-
tegia gatillo implica que el país 1 jugará GUERRA para siempre. Por lo tanto, el país 2 castigaría al país 1
jugando a GUERRA para siempre ya que GUERRA da un pago al país 2 de 1 cada período (comparado
con la recompensa de 0 si el país 2 continúa jugando PAZ). En conjunto, las estrategias gatillo constitu-
yen un Equilibrio Perfecto en Subjuegos para el juego PAZ-GUERRA repetido infinitamente. 
Por lo tanto, cuando los jugadores tienen un factor de descuento bajo (digamos, 𝜌 es cercano a cero), a
los jugadores no les importa mucho los pagos futuros. Por lo tanto, la cooperación no puede ser un
Equilibrio Perfecto en Subjuegos, ya que los jugadores desean maximizar sólo su beneficio del primer
1
período. Sin embargo, cuando 𝜌 es grande (𝜌 > en nuestro caso) los jugadores no descuentan mucho
2
los pagos futuros, por lo que la cooperación se vuelve más beneficiosa para los jugadores, ya que la pe-
nalización por la desviación se vuelve significativa porque los flujos descontado de pagos bajo coopera-
ción (2 por período) son mayores que la ganancia de corto plazo de la desviación (un beneficio de 3 pa-
ra un período y 1 de ahí en adelante).
Conclusión: En un juego repetido infinitamente, la cooperación es más fácil de sostener cuando los juga-
dores tienen un factor de descuento de tiempo más alto.
50
Comentario Final Acerca de los Juegos
Repetidos y la Cooperación
Hemos demostrado que un juego de una sola jugada con un único Equilibrio de Nash no coo-
perativo puede tener un Equilibrio Perfecto en Subjuegos cooperativo cuando se repite infini-
tamente. Sin embargo, tenga en cuenta que en el juego repetido, este Equilibrio Perfecto en
Subjuegos no es único.
Por ejemplo, es fácil demostrar que el resultado no cooperativo en el que cada país juega GUE-
RRA en cada período constituye también una Equilibrio Perfecto en Subjuegos. Por otra parte,
el Teorema Folk (Folk, porque era bien conocido por los teóricos del juego mucho antes de que
fuera formalizado) afirma que para un factor de descuento de tiempo suficientemente alto, un
gran número de resultados en el juego repetido puede ser apoyado como Equilibrio Perfecto
en Subjuegos. Por lo tanto, el hecho de simplemente demostrar que la cooperación es un Equi-
librio Perfecto en Subjuegos es insuficiente para concluir que un juego de este tipo siempre
terminará con la cooperación. Todo lo que conseguimos demostrar es que la cooperación es
una posible Equilibrio Perfecto en Subjuegos en un juego infinitamente repetido.

51

También podría gustarte