COMPORTAMIENTO Tema 2 MRH PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 51

Tema 2.

Juegos de dos jugadores


Las máquinas y los animales pueden ser jugadores.

Cuantos más jugadores, más complicado es el juego.

Juegos de suma cero o de suma constante: los intereses de los jugadores son totalmente
contrapuestos.

Juegos de suma variable: los intereses de los jugadores no están totalmente contrapuestos
(no todas las soluciones de estos juegos coinciden).

2.1.- Juegos de suma cero y juegos de suma constante

Supongamos que en cada resultado posible del juego, la suma de las utilidades de los
jugadores 1 y 2 es cero:
u1 + u2 = 0K=0

Juegos de suma cero (juego tipo Ajedrez, Póquer):

- Hay tres resultados posibles:

o 1 gana: vector de ganancias (+1, -1), suma = 0.


o Empate: vector de ganancias ( 0, 0) , suma = 0.
o 2 gana: vector de ganancias (-1, +2), suma = 0.

- En cada caso, la suma de las utilidades es cero. Esta es la condición de suma cero 
no se crea nada de valor  los jugadores se devoran mutuamente.

- El libro de Lester Thurow lo mal que irían las empresas con el principio “si yo
gano, tú tienes que perder”imposible el cambio económico (o se da a un coste muy
elevado).
- Son un caso particular de juegos de suma constante. Sea cual sea el resultado, la
suma de las utilidades es una constante k.

o Si k=0  juego de suma cero

o Si k=1  juego típico de negocios  las empresas compiten por cuotas de


mercado cuya suma es 100%

La batalla de las cadenas de TV:

- Dos cadenas, 1 y 2, luchan por cuotas de audiencia (cuanto más altas sean, mayores
ingresos por venta de publicidad).
- Cada una puede elegir entre emitir una serie o acontecimiento deportivo.
- Sus decisiones se tomarán de forma simultánea e independiente de las otras.
- La cadena 1 tiene ventaja programando series
- La cadena 2 tiene ventaja programando acontecimientos deportivos.
- Si ambas emiten series, la primera se queda con el 55% de la audiencia.
- Si ambas emiten deportes, la segunda se lleva el 55% de la audiencia.
- En la “forma normal”, resolvemos el juego mediante uso de flechas: la dirección de
las flechas representa las preferencias de los jugadores.

o Flecha Izda.: la cadena 1 prefiere emitir serie obteniendo audiencia del 55% a emitir
deportes con audiencia del 50%, cuando la 2 emite una serie.
o Flecha Inferior: la cadena 2 prefiere emitir deportes con una audiencia del 55% en vez
de series con un 50%, cuando la 1 emite deportes.
o Flecha Superior: la 2 prefiere emitir deportes con audiencia del 48% a emitir series con
45% de audiencia si la 1 emite series.
o Flecha Dcha.: la cadena 1 prefiere emitir series al 52% de audiencia en vez de deportes
al 45% cuando la dos emite deportes.
- Existe una única situación tal que las flechas apuntan hacia un “equilibrio” desde
ambas direcciones (*) donde la 1 emite series con el 52% de audiencia y la 2 emite
deportes con un 48% de audiencia. Esta es la Solución del juego.
- En el equilibrio (equilibrio de Nash), sería un error por parte de cualquiera de las
dos cadenas adoptar una estrategia diferente; cada jugador elige la mejor opción
dada la competencia. Cada cadena obtiene su mejor cuota dado el competidor contra
el que está luchando.

- En un juego de suma constante, sea cual sea el resultado, la suma de las utilidades de los
jugadores es una constante k. A menudo k = 1 (=100%). Si k=0 => juego de suma cero.

- Existe una forma “sencilla” de relacionar juegos de suma constante y juegos de suma
cero con dos jugadores:

- Sean u1 y u2 las ganancias en un juego de suma k:

u1 + u2 = k

- Si estamos con juego de suma cero debería de ser:

u1 + u2 = 0.

- Consideramos unas nuevas ganancias de la forma:

v1 = u1 - u2

v2 = u2 - u1

- Su suma también deberá ser cero:

v1 + v2 = 0

- Si sustituimos la condición de suma constante, tendremos:

u1 + u2 = k

- Por lo tanto, formando ecuación tenemos:

v1= 2u1-k

v2= 2u2-k
Estas funciones:

 Son transformaciones lineales positivas de las utilidades de acuerdo con el


teorema de la utilidad esperada, no influyen en las decisiones.

 Miden la utilidad en términos de la ventaja en cuotas de mercado.

- si v1 es positiva, la cadena 1 tiene una cuota de audiencia mayor que la


cadena 2  v1 mide cuanto mayor es la ventaja de la cadena 1.

- si v2 es positiva, la cadena 2 tiene una cuota de audiencia mayor que la


cadena 1 v2 medirá cuanto mayor es la ventaja de la 2.


Para ver como se obtienen ganancias de la figura 2.2 a partir de 2.1: calculamos la batalla
de las cadenas como juego de suma cero  Si consideramos que ambas cadenas emiten
una serie:

 La cadena 1 obtiene 55% de la audiencia y k=1 aplicando la transformación:

v1 = 2*0,50 – 1 = 0,1  10%

v2 = 2*0,45 – 1 = - 0,1  -10%

En este caso, la utilidad de cadena 1, en la casilla (serie, serie) demuestra que tiene una
ventaja competitiva frente a cadena 2.

Ambas entradas suman cero : 10% + (-10%)= 0

 La cadena 2 obtiene 52% y k = 1: ………así para cada casilla se obtienen el resto de las
ganancias.
Esto muestra que el razonamiento estratégico no varía a causa de transformaciones
lineales positivas de las utilidades de dos jugadores.

Tanto razonando en términos de cuota de audiencia total, juego de suma 1, como en


términos de ventaja de audiencia, juego de suma 0, la solución es la misma la cadena 1
emite series y la 2 emite deportes  la ganancia real será la misma en ambos casos:

 Mayor audiencia significará mayores ganancias por publicidad

2.2.- Ventaja competitiva

Ventaja competitiva: cuando una empresa adopta la nueva tecnología, consigue una
ventaja sobre sus competidores.

Si todas las empresas adoptan la nueva tecnología, la ventaja desaparece.

El juego en el que estas empresas se encuentran se llama Ventaja competitiva.

En la forma normal, el parámetro de ganancias a mide la magnitud de ventaja competitiva


que concede la nueva tecnología:
 Cada empresa tiene dos estrategias: quedarse igual o adoptar la nueva tecnología.

 La empresa 1 tiene incentivo por adoptar la nueva tecnología.

o En caso de que la 2 se quede tal cual, la 1 obtendrá la ventaja competitiva “a”


adoptando la nueva tecnología flecha derecha apunta hacia arriba.

o Si la 2 sí adoptase esa tecnología, la empresa 1 eliminaría su ventaja


competitiva “–a” adoptando la nueva tecnología flecha izda. hacia arriba.

o Las fechas superior e inferior apuntando a la izda. reflejan incentivos


similares para la empresa 2.

El equilibrio de la Ventaja competitiva, las flechas apuntan hacia ella desde las dos
direcciones, se da cuando cada empresa adopta la nueva tecnología.

En situaciones de equilibrio desaparece la ventaja competitiva, ninguna de las dos


empresas tiene ventaja sobre la otra, pero ninguna puede permitirse de no innovar.

Las empresas en este juego se ven abocadas a adoptar cada nueva tecnología que vaya
apareciendo. La fuerza subyacente de esta necesidad es la solución al juego de Ventaja
competitiva.

En la batalla de las cadenas de tv (de suma constante) y en Ventaja competitiva , la


estrategia es todo lo que importa y el azar no juega ningún papel.

En un juego de suma cero, como el Póquer, la estrategia es importante pero también lo es el


azar.

2.3.- Póquer de una carta

Es la versión más simple del póquer; también consideraremos sólo dos jugadores
(podría ser jugado por varios jugadores con varias cartas).

Sean:
 Dos jugadores: 1 y 2
 Un mazo de cartas: 50% Ases y 50% Reyes
 Cada jugador con una apuesta inicial, a, en el centro de la mesa.
 El bote será la suma de las apuestas iniciales.
 Se reparte boca abajo a cada jugador una carta que ninguno ve (en el real cada uno
ve sus propias cartas).
 Un jugador podrá hacer una nueva apuesta, b, que deposita en el bote, o podrá
pasar.
 Los jugadores tomarán la decisión de forma simultánea (en el real se hace de forma
sucesiva, a modo de señalización)
 Concluida la fase de apuestas se acaba el juego:

o El bote se lo lleva el jugador que apuesta.


o Si los dos apostaron, se lo lleva el que tenga la carta más alta.
o En caso de empate, se reparte el bote.

En el Póquer de una carta en forma extensiva:

 El juego empieza con jugada de azar, el reparto


 Una mano es un par: (carta jugador 1, carta jugador 2)

 Hay cuatro manos posibles, cada una con probabilidad ¼:


(A, A)
(A, R)
(R, A)
(R, R)
 Jugarán con las cartas repartidas (en el normal se desprenden y cambian las no
válidas)
 El jugador 1 juega a continuación sin saber cuál es la mano  su info son cuatro
nodos (las cuatro posibles manos). Deberá apostar o pasar.
 El jugador 2 es el último en jugar, sin saber su mano ni lo que ha hecho el jugador
1 su info son ocho nodos (cuatro manos posibles * las dos jugadas posibles del
jugador 1). Podrá apostar o pasar.
 Se acaba el juego.

 Existen en la forma extensiva 4 nodos con 2 posibilidades cada uno  8 nodos


intermedios 8 nodos con 2 posibilidades cada uno 16 nodos terminales o finales.

o Si ambos apuestan y su mano es (A, A) o (R, R)se repartirán el bote, que


contiene 2*(a + b) y el resultado será (0, 0)

 Si el jugador 1 apuesta y el 2 pasa, da igual las cartas que tuviera pues ha


pasado, el jugador 1 se llevará la apuesta inicial del jugador 2  el resultado
será (a, -a)

 Si el 1 pasa y el 2 apuesta, tenemos cuatro nodos terminales de la forma (-a, a)


 el segundo se lleva la apuesta inicial del primero.

o Si ambos apuestan y su mano es (A, R), el bote contiene de nuevo 2*(a+b)


dólares  al descubrir las cartas, el 1 gana al 2 y se lleva el bote  sus
ganancias serán lo que había apostado el 2: (a + b) El resultado será (a+b, -a-
b)
La forma extensiva es más complicada de ver; pero su figura 2.4. se puede reducir a forma
normal, mucho más sencilla:
 Cada jugador tiene un único conjunto de información en el que dispone de dos
posibles acciones: apostar o pasar  el conjunto de estrategias de cada jugador es
(apostar, pasar). Éstas son las filas y columnas de 2.5.

 Rellenamos las casillas:

Para el Jugador 1.

Estrategia Apostar, Apostar: las probabilidades de los puntos terminales del juego
serán:

Mano (A,A), P (0, 0) = ¼ = 0,25

Mano (A,R), P (a+b, -a-b) = ¼= 0,25

Mano (R,A), P (-a-b, a+b) = ¼= 0,25

Mano (R,R), P (0, 0) = ¼= 0,25

El resultado, tomando Valores Esperados, para el jugador 1 en la estrategia


(Apostar, Apostar), de la forma normal, será el vector de ganancias para cada
casilla:

EV1= 0 * 0,25 + 0,25 (a + b) + 0,25 (-a - b) + 0,25 * 0 = 0

Haríamos igual para el jugador dos y para las demás casillas/estrategias


(pasar, pasar).

Para el vector de estrategias (apostar, pasar), el jugador 1 gana y el 2 pierde,


da igual sus cartas, y el vector de ganancias será (a, -a)

Entonces se obtiene operando con cada una de las estrategias para cada uno
de los jugadores la forma normal.

Siguiendo las flechas, la solución al Póquer de una carga es que cada jugador apueste 
Con esta solución ambos jugadores se quedan como al principio.

Un jugador que no apuesta es derrotado por un jugador que lo hace.

Este resultado, que los jugadores se queden sin ganar ni perder, refleja el hecho de que el
reparto de las cartas es equilibrado: cada jugador tiene las mismas probabilidades de
obtener una buena carta.

Si hay trampas en el reparto reparto desequilibrado que favorece a uno.


Con reparto equilibrado, si ambos adoptan igual estrategia, las cartas se reparten
equitativamente y el resultado es el vector de ganancias (0, 0). Aunque (pasar, pasar) no
es una solución, si ambos usan esta estrategia, ambos consiguen ni ganar ni perder.

Un perdedor no sigue los principios estratégicos que podrían mejorar su juego. Un


perdedor que no aprende de sus errores se queda en eso, en un perdedor.

Las figuras 2.3 y 2.5 son iguales; las estrategias son iguales: El póquer de una carta y
Ventaja competitiva tienen el mismo contenido estratégico apostar en el póquer da una
ventaja sobre el jugador que pasa. Si no se arriesga nada, no se gana nada.

Una estrategia es estrictamente dominante si es mejor que cualquier otra estrategia ante
cualquier contingencia. Es aquella que proporciona pagos estrictamente
mayores que los de sus alternativas.

Una estrategia es dominante si es al menos tan buena como cualquier otra estrategia ante
cualquier contingencia y mejor ante alguna contingencia. Es aquella que proporciona
pagos mayores o iguales a los de sus alternativas (unos mayores, otros
iguales, pero ninguno menor).Si tengo estrategia dominante, no importa lo que haga
mi adversario; lo mejor para mí es jugar esta estrategia dominante.

En Ventaja Competitiva, la estrategia que adopta la nueva tecnología domina


estrictamente a la contraria; igual que Apostar domina estrictamente a Quedarse tal cual,
en el Póquer:

a > 0, cuando el oponente se queda tal cual

0 > -a, cuando el oponente adopta la nueva tecnología

Es un error serio y caro jugar una estrategia que está estrictamente dominada.
Ninguna estrategia dominada debe jugarse como parte de un equilibrioLas flechas
apuntarían en una dirección que nos alejaría de tal estrategia y nos llevaría a una
estrategia estrictamente dominante.

En ventaja Competitiva y Póquer de una carta, el parámetro a mide el precio que se paga
por jugar una estrategia estrictamente dominada.

Una estrategia no dominada es aquella para la que no existe una alternativa que
proporcione pagos siempre iguales o superiores.

Si una estrategia está dominada por otra estrategia es que es peor que esa otra,
y podemos "tacharla".

Esto es importante porque se puede usar, en juegos "grandes", para recudir la


matriz original a otra más pequeña. Esa reducción se hace eliminando las filas y
columnas que corresponden a las estrategias dominadas.

Si tenemos dos estrategias, A y B, y una proporciona pagos mayores que la otra


para una respuesta del oponente, y pagos menores para otra respuesta del
oponente, entonces ni A ni B son dominantes o dominadas, y no se pueden
"tachar".

2.4.- Soluciones a juegos de suma cero con dos jugadores

Los juegos con dos jugadores fueron los primeros en resolverse.

Si un juego tiene un único equilibrio, ésa es la solución.

Un juego de suma cero con dos jugadores puede tener múltiples equilibrios.

En esta figura 2.6. juego de suma cero con dos jugadores y dos soluciones, ambos
jugadores pueden elegir izquierda o derecha de forma simultánea.
 Si el 2 elige izquierda, pierde inmediatamenteelige derecha.

 Si el 1 elige izquierda, se produce empate y si elige derecha, también estos dos


equilibrios (izda, dcha) y (dcha, dcha) conducen a las mismas ganancias, utilidad cero
para cada jugador. Cualquiera de los dos equilibrios será una solución.

En la 2.7. tenemos un juego de suma cero con dos jugadores y cuatro equilibrios; más
complicado:
 Ambos pueden elegir izda, centro o dcha simultáneamente.
 La única forma de que 2 pierda es eligiendo centro cuando el 1 no lo hace.
 El resto de combinaciones de estrategias conducen a un empate.
 Los cuatro equilibrios: (izda, izda), (izda, dcha), (dcha, izda) y (dcha, dcha) tienen las
mismas gananciasempate.

Desarrollo:

El jugador 1 tiene que elegir estrategia (fila). Va señalando su mejor opción en cada caso:

1) si el jugador columna elige izquierda, él preferirá izquierda o derecha. Marcamos


con círculo rojo;

2) si el jugador columna elige centro, él preferirá izquierda o derecha. Marcamos con


círculo rojo;

3) si el jugador columna elige derecha, él preferirá izquierda o derecha. Marcamos


con círculo rojo.

El jugador 2 tiene que elegir estrategia (columna). Va señalando su mejor opción en cada
caso:
1) si el jugador fila elige izquierda, él preferirá izquierda o derecha. Marcamos con
círculo azul;

2) si el jugador fila elige centro, él preferirá izquierda o derecha. Marcamos con


círculo azul;

3) si el jugador fila elige derecha, él preferirá izquierda o derecha. Marcamos con


círculo azul.
Solo hay equilibrios de Nash allí donde la casilla tiene los dos números rodeados con un
círculo (centro, centro) no es un equilibrio porque no es la mejor
situación posible para los jugadores.

En todos los juegos de equilibrio múltiple las ganancias de cada jugador son las mismas
en cada equilibrio  matemáticamente es necesario que cada equilibrio de un juego de
suma cero con dos jugadores tengan las mismas ganancias.

Teorema de solución para juegos de suma cero con dos jugadores: Todo equilibrio de un
juego de suma cero con dos jugadores tiene el mismo valor.

Consideremos un juego 2x2:

Demostración del teorema por contradicción: por hipótesis, los vectores de ganancias (a, -a)
y (b, -b) son equilibrios y, a no es igual a bestas dos soluciones diferentes no pueden
estar en la misma fila o columna (pues sería una contradicción inmediata)

Colocamos estos equilibrios en las esquinas.

Según el diagrama de flechas, tenemos el siguiente sistema de desigualdades:

a>d

b>c

-a > -c

-b > -d
Resolviendo este sistema de desigualdades: a > d > b > c > a  contradicción.

Se construye un caso hipotético:

Se supone que:

(a, -a) y (b, -b) son equilibrios de Nash.

(a, -a) y (b, -b) no son iguales Esto último no puede ser verdad.

Debe cumplirse que:

a > d, y que

b > c, y que

-a > -c, y que

-b > -d

 Todo eso se deduce del hecho (un supuesto) de que las dos casillas con el
asterisco son equilibrios.

Se puede deducir que:

si -a > -c, entonces a < c, y que

si -b > -d, entonces b < d.

Con todas las desigualdades ante nosotros podemos construir las relaciones
a > d > b > c > a Es una contracción puesto que a > a no puede ser.

Por tanto, las dos condiciones a partir de las cuales hemos construido las
desigualdades (que (a, -a) y (b, -b) son equilibrios de Nash y que (a, -a) y (b, -
b) no son iguales) no pueden darse a la vez, puesto que si las imponemos -
ambas- vamos a una contradicción.

Si además hacemos que una o todas las flechas vayan en las dos direcciones,
reemplazando la desigualdad con una igualdad, también se obtiene contradicción.

Como todos los equilibrios de un juego de suma cero con dos jugadores tienen el mismo
valor, podemos identificar las ganancias de solución con cualquiera de ellos.  Esto no es
cierto en juegos generales de suma variable (que pueden tener equilibrios con ganancias
muy diferentes).
2.5.- Juegos de suma variable con dos jugadores

La mayoría de los juegos en el mundo empresarial no son de suma constante. Son más
complejos y su solución teórica mucho más complicada.

Si la suma de las utilidades de los jugadores en un juego es diferente según los


resultados, ese juego es un juego de suma variable.

Juego de la figura 2.9. Hagamos un trato:

Dos jugadores, el jugador 1, estrella de cine, y el 2, director, tratan de llegar a un acuerdo.

Calculan que con la película pueden obtener un beneficio de 30.000.000 $.

Se pueden poner de acuerdo de repartir al 50%.

Si uno rechaza el acuerdo se acaba el juego y no se realiza la película.

Tiene dos equilibrios:

(si, si) que implican 30 millones, 15 para cada uno, y

(no, no) que implica no acuerdo y por tanto obtener cero dólaresdebemos
distinguir entre equilibrio y solución.
Equilibrio

Cualquier par de estrategias tal que las flechas apuntan hacia ellas desde cualquier
dirección.

En equilibrio cada jugador maximiza la utilidad y

Ningún jugador tienen incentivos para cambiar de estrategia.

No todos los equilibrios tienen las mismas ganancias si el juego es de suma


variable.

Solucionar un juego es como resolver un problema de cálculo diferencial.

Si queremos minimizar la función :

 la condición necesaria (debe ser satisfecha por todos los candidatos para que sea solución)
para minimizar es que su primera derivada sea cero:  como x=0, será
un candidato para resolver el problema de minimización.
 la condición suficiente es que la segunda derivada sea mayor que cero: ;
como se cumple porque

Si se cumplen ambas condiciones, necesaria y suficiente, se obtiene una solución, x=0


resuelve el problema de minimización, y el valor mínimo de la función es f(0)=0.

Si quisiéramos maximizar la función :

 la condición necesaria para maximizar sería que su primera derivada sea mayor que
cero: >0
 la condición suficiente, que la segunda derivada sea negativa: =2<0

Un resultado ha de ser un equilibrio o punto de reposo (condición necesaria) antes de


poder ser un candidato a la solución.

Si un resultado no es equilibrio, algún jugador podrá mejorar si cambia su estrategia


su comportamiento puede no estar en un punto de reposo.

Que un resultado sea un equilibrio no significa que sea una soluciónPara ser una
solución el resultado debe satisfacer también las condiciones suficientes de estrategias
no dominadas.
¿Por qué el equilibrio de Nash se encuentra en el punto no-no? El resultado es el mismo si
uno de los dos dice que no, es decir, (0, 0).

En realidad hay dos equilibrios de Nash en ese juego, que se descubren al


aplicar la regla -o el método- para detectarlos.

Si el director elige "Sí", a la estrella le interesa "Sí".

Si el director elige "No", a la estrella le da igual "Sí" o "No".

Si la estrella elige "Sí", al director le interesa "Sí".

Si la estrella elige "No", al director le da igual "Sí" o "No".

Hay dos casillas con ambos valores marcados, que son la superior izquierda
y la inferior derecha.

Si los jugadores "caen" en Sí-Sí, estarán satisfechos de lo que eligieron a


la vista de lo que ha elegido el otro. Pero eso mismo se da si "caen" en No-
No.

En las matemáticas se distingue siempre entre condiciones necesarias y


condiciones suficientes para que algo sea verdad, o una afirmación se
cumpla.

La condición necesaria tiene que darse si lo que aseguramos es verdad o se


cumple. Pero esa condición por sí sola no asegura el complimiento de lo
que aseguramos.

La condición suficiente asegura que lo que aseguramos es verdad o se


cumple. Pero esa condición puede no ser necesaria, es decir, lo que
aseguramos puede ser verdad o cumplirse aunque la condición
suficiente no se de.

Por ejemplo, para que pueda usted comprar un coche es suficiente con tener
ahorrado el dinero para comprarlo, pero no es necesario, pues puede pedir un
crédito o recibir un préstamo de un familiar. Sin embargo, para comprar un
coche tiene que tener el carnet de conducir, si bien no es suficiente, ya que
además del carnet deberá tener el dinero.

Hay condiciones que son necesarias y suficientes, a la vez, para que algo
se cumpla o sea verdad.

El libro habla de las condiciones necesarias y suficientes para que un


determinado punto sea un máximo o un mínimo de una función. Es
optimización matemática sin restricciones.
Usted parte de una función como y = f(x), y quiere encontrar el valor de (x)
que hace que “y” sea máximo.

Una condición que debe cumplir necesariamente el valor (x*) para generar
un máximo en y es que la derivada parcial de esa función sea cero, es
decir, df/dx = 0, pero eso no es condición suficiente. No lo es porque,
cumpliéndose, podría ocurrir que (x*) nos diera un mínimo para y, no un
máximo.

Hace falta algún otro requisito, otra condición.

Cuando la segunda derivada es negativa para el valor de x*, entonces el


valor de y asociado a x* será un máximo. Si es positiva será un mínimo.

Toda solución de un juego tiene que ser un equilibrio Por tanto, ser
equilibrio es condición necesaria, pero no suficiente, para ser solución. Un
motivo es que puede haber más de un equilibrio.

La condición suficiente de solución, depende de una casuística muy variada que


el libro analiza en los capítulos siguientes.

Cuando el juego es simétrico en ganancias (los dos jugadores ganan lo


mismo si hacen lo mismo) la solución tiene que ser simétrica en ganancias.
Por eso buscamos estrategias mixtas si el juego es simétrico y no hay
equilibrios simétricos en ganancias en estrategias puras. Los equilibrios
en estrategias mixtas son simétricos.

En el caso del juego de la figura 2.9 los dos equilibrios son simétricos en
ganancias (el juego es simétrico). Hace falta un criterio para elegir, y ese
criterio es el de estrategias no dominadas. A la solución se llega aplicando
estrategias no dominadas, siempre.

Si hay estrategias dominantes que señalen uno de los dos equilibrios ya


tenemos la respuesta: ese equilibrio es la solución. Pero si no hay
estrategias dominantes que señalen uno, basta con que podamos llegar a
uno de los dos equilibrios mediante estrategias no dominadas.

Veamos el caso de la figura 2.9:

Figura 2.9
Estrella Sí No
\
Director
Sí 15, 15 0, 0
No 0, 0 0, 0

La estrella (fila) tiene una estrategia dominante que es decir sí, y el


director tiene otra que es decir sí. Son dos estrategias débilmente
dominantes, pero dado que los jugadores tienen solo dos alternativas, cuando
hay una dominante (débil o estricta) la otra alternativa es dominada
(débil o estrictamente).

La condición dice que a la solución llegamos mediante estrategias no


dominadas (débil o estrictamente). Pues muy bien, sólo (sí, sí) cumple
esa condición suficiente, por lo que es la solución el equilibrio (no, no)
es resultado de seguir dos estrategias débilmente dominadas, por lo
que no puede ser solución.

2.6.- Una condición suficiente para resolver juegos de suma variable:

Si (s, t) es un equilibrio pero desde el punto de vista del jugador 1 hay otra estrategia s*
que domina a s, y desde el punto de vista del jugador 2 la estrategia t* domina a la t
dicho equilibrio (s, t) no será solución.

Las condiciones suficientes en teoría de juegos nos dicen que algo no puede ser una
solución, aunque sea un equilibrio. La idea de estas condiciones es eliminar ciertos
equilibrios como posibles soluciones.

En el juego Hagamos un trato la solución no dominada será que ambos, estrella y director,
digan sí al acuerdo.

Problema de coordinación de sistemas de video:

 el problema es conseguir que todo el mundo se coordine en una única estrategia.

 Este juego de coordinación tiene dos equilibrios pero no importa si las empresas
escogen Beta o VHS mientras escojan el mismo sistema.

Como ninguno de los dos sistemas domina al otro, ambos satisfacen la condición
suficiente de estrategias dominadas

 satisfacer condiciones suficientes no garantiza la unicidad de la solución.


Este juego, igual que Hagamos un trato, es como una alegoríaestos juegos reducen a lo
esencial los aspectos estratégicos de una situación.

Las alegorías son útiles pues enseñan cómo aplicar a situaciones complicadas lo que hemos
aprendido en una situación simple.

2.7.- Publicidad de cigarrillos en televisión

USA 1964: se emite primera advertencia de que fumar puede perjudicar la saludlas
compañías se mostraron reacias a incluir el mensaje de advertencia en sus productos.

1970: el sector tabaquero y el gobierno llegaron a un acuerdo: las empresas incluirán la


advertencia y dejarán la publicidad en TV a cambio de inmunidad federal (pero siguen
siendo responsables potenciales en cada Estado).

Considerando dos compañías, compañía 1 y compañía 2, cuando ambas adoptan


estrategias comparables, disfrutan de beneficios y cuotas de mercado comparables.

Sus estrategias son hacer o no publicidad en TV.

Las entradas en la matriz de ganancias son los beneficios de cada compañía en $ de 1970.

Se trata de un juego de suma variable con dos empresas: Aquí vemos que la publicidad en
tv es una poderosa herramienta de mk.
Si C1 hace publicidad y C2 noBº de C1 crece 20%; lo mismo que si intercambian los
papeles  cada una de las compañías tiene incentivos para anunciar sus cigarrillos en TV.
Ésta es la estrategia dominante para ambas compañías Existe un único equilibrio y por
tanto solución, en el que las dos compañías hacen publicidad.

Cuando ambas hacen la publicidad al tiempo los beneficios son solo de 27 millones $
para cada una (23 millones menos que si no hicieran publicidad)la publicidad de una
anula a la otra (juego ineficiente) quedan las ventas casi igual pero a un coste más
alto.

Un resultado es eficiente si no existe ningún otro resultado que proporcione a todos los
jugadores una ganancia mayor.

Los desequilibrios no son lugares en que los jugadores deban quedarse, pues aparecería
la paradoja.

Todo juego en el que cada jugador tiene una estrategia dominante tiene una única
solución que consiste en jugar esta estrategia dominante.

Cuando esta situación es mala para los jugadores, el fenómeno recibe el nombre de dilema
de los presos. Los jugadores están presos de sus propias estrategias, a no ser que algo
cambie el juego (en el caso del tabaco USA ese algo fue el gobierno; el acuerdo con éste
llevó a las compañías a renunciar a la publicidad en tv).

Pero curiosamente gastaron 63 millones menos en publicidad pero sus beneficios


aumentaron en 91 millones  a veces la solución no es eficiente.

Una de las grandes diferencias entre juegos de suma cero y de suma variable es que las
soluciones de los juegos de suma cero son siempre eficientes, mientras las de los juegos
de suma variable raramente lo son un cambio en las reglas del juego pueden convertir
una solución ineficiente en eficiente, significando un aumento de Bº.

Las cantidades de esa tabla son millones de dólares de beneficio, no de


ingresos; no son porcentajes.

La empresa 1 pasa de ganar 50 (caso de no-no) a 60 millones (caso sí-no)


cuando pasamos de la casilla superior izquierda a la inferior izquierda.

La empresa 2 pasa de ganar 50 millones a solo 20 millones con ese mismo


cambio. Pierde ventas porque la publicidad que hace la empresa 1 hace que la 2
pierda parte de su cuota de mercado. La suma de los beneficios cae (de 100 =
50+50, a 80 = 60+20) porque en el segundo caso una de las dos empresas está
incurriendo en gastos de publicidad, que antes no había.

Podríamos diseñar el caso con otros supuestos. Por ejemplo, podríamos


considerar la posibilidad de que la publicidad aumenta las ventas conjuntas, de
forma que en la casilla inferior izquierda la suma de las dos cantidades fuera
mayor que la suma de las cantidades de la casilla superior izquierda (tendríamos
120 en vez de 80, por poner un caso). En ese caso el jugador 2 podría perder
ventas, pero menos, porque en parte perdería cuota (% de beneficios totales)
de mercado, pero también operaría en un mercado mayor. En el mundo real
pueden pasar muchas cosas.

En principio el juego debe reflejar las circunstancias reales del caso que se
estudia, o bien, si es un caso meramente ilustrativo, debe estar diseñado -con
supuestos razonables- para ilustrar lo que pretendemos.

Hay un caso real, histórico, de dos empresas (duopolio) que compiten, y donde
una campaña de publicidad de una cambia las cuotas de mercado. Fue el caso
de Coca-Cola y Pepsi.

El director de marketing que diseñó la famosa campaña de Pepsi (el anuncio


mostraba a gente que probaba a ciegas los dos refrescos, y elegían Pepsi) fue
John Sculley, que alcanzó después la presidencia de Pepsi. Esta compañía
consiguió un vuelco en las cuotas de mercado en USA.

Steve Jobs, fundador de Apple, convenció a Sculley de abandonar la presidencia


de Pepsi para dirigir Apple a principios de los 80. Sculley consiguió quitar a Jobs
todo control sobre la compañía en 1985 (Jobs fundó NeXT Computer y compró
Pixar a Lucas Inc). Apple disfrutó de una posición de monopolio que fue
degradándose por la competencia de Microsoft con Windows, y Sculley tuvo que
abandonar Apple a principios de los 90. En 1998 Jobs volvió (para desgracia del
entonces CEO de Apple, Gilbert Amelio), y la historia posterior ya la conoce.
2.8 Juegos de dos jugadores con muchas estrategias

Un jugador puede tener miles de millones de estrategias, y aún podríamos analizar el


juego.

Llamemos:

x1= estrategia escogida de j1


x2= estrategia de j2
u1(x1, x2) = función utilidad de j1 depende de las dos estrategias
u2(x1, x2) = función utilidad de j2 también depende de las dos estrategias

Por tanto existe interrelación estratégica.

Suponiendo que x1 y x2 pudieran tener 100 valores diferentes, para describir el juego
precisaríamos una matriz 100x100; y, si los valores que pudieran adoptar estuvieran entre 0 y 1…
por tanto el juego se podrá resolver de otras formas.

La clave para tratar con juegos con muchas estrategias es el cálculo diferencial.

Mientras las funciones de utilidad sean diferenciables, podemos encontrar equilibrios


del juego utilizando técnicas de cálculo:

1) Maximizamos la función de utilidad de cada jugador


2) Resolvemos el sistema de dos ecuaciones con dos incógnitas, x1 y x2

3) La solución x* = (x1*, x2*) es un equilibrio

4) Si hay más de una solución recurriremos a condiciones suficientes para con las
soluciones.

Ejemplo: Supongamos que x1 y x2 son los presupuestos (cualquier número entre 0 y 1.000$)
para publicidad de dos empresas 1 y 2.

 Los beneficios de e1, u1(x1, x2), representados en la función:


son crecientes hasta un punto máximo y
a partir de ahí decrecen. Pero además son decrecientes con respecto al presupuesto de
publicidad de la empresa 2  maximizando los beneficios de 1 respecto a su
presupuesto de publicidad:

donde la empresa 1 considera el presupuesto de la 2 como si fuera constante (algo solo


cierto en equilibrio).

 Los beneficios de e 2, u2(x1, x2), son representados por

y maximizando sus beneficios respecto a su presupuesto, obtenemos:

Ahora tendremos que resolver un sistema de ecuaciones:

0=1.000-2x1

0=1.000-x1-2x2

x1=1.000/2= 500
x2=(1.000-500)/2=250

cuyos resultados son: x1*= 500 y x2*= 250


Luego, el vector equilibrio de este juego será x* = (x1*, x2*) = (500, 250)

Los beneficios correspondientes serán:

u1 (x*) = 187.500 $
u2(x*) = 62.500 $

En este equilibrio hay mucha publicidad; ambas empresas aún podrían ganar más haciendo
menos publicidad.

Resolvemos la maximización u1+u2:

Resolviendo,
x1= 428,6
y
x2= 142,9

Sustituimos en la función de beneficios de la empresa 2, , y nos dan:

u1= 224,482 $
y
u2= 61.232,65 $

de donde podemos concluir que las empresas que compiten en publicidad tienden a anunciarse
demasiado.

Se describe un simple proceso de maximización de dos funciones de beneficio


arbitrarias:

La primera: u1 = 1000x1 - x12 - x22

La variable x1 está dos veces, una sumando y otra restando, elevada al


cuadrado. Eso quiere decir que el beneficio u1, de la empresa 1, crece
cuando crece x1, pero llega un punto en que el "lado malo" de x1 (la parte
que resta) tiene más peso que el "lado bueno" (la parte que suma), y x1
empieza a afectar negativamente al beneficio.
La otra variable, x2, tiene un efecto negativo desde el principio.

Para hallar el máximo o el mínimo de una función derivamos e


igualamos a cero. Lo hacemos solo con respecto a x1, dado que la empresa
1 controla x1 pero no tiene forma de cambiar x2 (que decide la otra empresa),
por lo que para ella es una constante.

du1/dx1 = 1000 - 2x1 = 0, de donde x1 = 500

Hacemos lo mismo para la empresa 2, que tiene otra función de beneficios:

u2 = 1000x2 - x1x2 - x22

Derivamos con respecto a x2, dado que la empresa 2 controla x2 pero no


tiene forma de cambiar x1 (que decide la otra empresa), por lo que para ella
es una constante.

du2/dx2 = 1000 - x1 - 2x2 = 0

Dado que ya sabemos que x1 = 500, sustituyendo eso en esta segunda


ecuación, tenemos:

1000 - 500 - 2x2 = 0, de donde x2 = 250.

Lo que se propone al final de la página es que las empresas, en vez de


maximizar cada una por su cuenta, su beneficio, manipulando el gasto en
publicidad, lo hagan de forma conjunta, como si fueran una sola
empresa. Para ello hay que formar una función de beneficio única:

u1 + u2 = 1000x1 - x12- x22+ 1000x2 - x1x2 - x22

u1 + u2 = 1000x1 - x12- 2x22+ 1000x2 - x1x2

Ahora sí derivamos con respecto a x1 primero, y con respecto a x2


después, porque ambas empresas actúan como una sola, y controlan x1 y x2.

Al derivar parcialmente con respecto a x1, x2 se considera constante, y


viceversa:

d(u1+u2)/dx1 = 1000 - 2x1 - x2 = 0

d(u1+u2)/dx1 = 1000 - x1 - 4x2 = 0

Ambas ecuaciones forman un sistema con dos incógnitas. Para resolverlo


podemos, por ejemplo, despejar x1 en la segunda y sustituir en la primera: x1
= 4x2 - 1000, que iría a la primera ecuación, de donde obtendríamos x2.
2.9.- Existencia de equilibrio

Ser un equilibrio es una condición necesaria para que una combinación de estrategias sea
la solución del juego. Si una combinación de estrategias no es un equilibrio, entonces al
menos uno de los jugadores tiene incentivos para cambiar su juego.

El que sean estrategias no dominadas es una condición suficiente para una solución de un
juego. Un equilibrio en estrategias dominadas no puede ser una solución según esta
condición suficiente.

El teorema que garantiza la existencia de equilibrio:

Tengamos un intervalo acotado, un espacio de estrategias para cada jugador, por ejemplo [0, 1].

El j1 escoge la estrategia x1 de su intervalo, y el j2 escoge la x2.

Sus respectivas funciones de utilidad son u1(x1, x2) y u2(x1, x2). Estas funciones de utilidad son
dos veces continuamente diferenciables y además cada una es estrictamente cóncava en la
estrategia del propio jugador.

La función de mejor respuesta de 1 (su función de reacción), f1(x2), es el valor de x1 que


maximiza u1(x1, x2), para cualquier x2 dado. Luego f1(x2) será una función continua en x2
y una solución de la ecuación:

En el caso de una solución de esquina tomaremos el valor apropiado de x1, 0 o 1, en vez del
valor de mejor respuesta. Las esquinas deberemos inspeccionarlas cuando la solución a esta
condición de primer orden no esté dentro de los límites del intervalo.

La función de mejor respuesta de 2, f2(x1) es el valor de x2 que maximiza u2(x1, x2) para
cualquier x1 dado; es decir, f2(x1) es una función continua en x1 y una solución de la
ecuación:
Sea la función en forma de vector de estas funciones de mejor
respuesta, es decir, la función de mejor respuesta del juego en su conjunto. Como los
componentes de f son funciones continuas, f es continua.

Si tenemos un par de estrategias (x1, x2), el jugador 1 elige su mejor respuesta a x2, f1(x2).
Al mismo tiempo, el jugador 2 elige su mejor respuesta a x1, f2(x1) la función de mejor
respuesta del juego registra estas respuestas el juego ha pasado

de (x1, x2) a [f1(x2), f2 (x1)].

En nuestro ejemplo, de juego de publicidad, las funciones de mejor respuesta son:

Un vector x* que cumpla las dos condiciones de mejor respuesta es un equilibrio  las dos
funciones de mejor respuesta se cortan en x*.

En nuestro ejemplo, se cortan en (500, 250), que es el equilibrio.

Hay más formas de describir la solución de este par de ecuaciones:


Sea el sistema:

x1*=f1 (x2*)
y
x2*=f2 (x1*)

en forma compacta estas ecuaciones se pueden escribir como:

Un punto en el que la función f se aplica sobre sí misma se llama punto fijo.

Un equilibrio del juego es un punto fijo de la función de mejor respuesta.

En equilibrio, ninguno de los jugadores tiene incentivos a responder de forma diferente a


como ya está haciendo para asegurarnos de que el juego tiene equilibrio, debemos ver si
la ecuación que contiene la función de mejor respuesta del juego tiene un punto fijo x*
existe una respuesta matemática:

Teorema del punto fijo: Si f es función continua que va del cuadrado unitario al cuadrado
unitario, entonces f tiene un punto fijo, x, donde

x = f (x)

En nuestro juego de publicidad, como la función de mejor respuesta del juego es


continua, debe tener un punto fijo, y cualquiera de estos puntos fijos es un equilibrio:
Existencia de equilibrio: Supongamos que para cada jugador i, ui es dos veces
continuamente diferenciable y estrictamente cóncava en xi existe un vector de
equilibrio de juego x*.

Este argumento garantiza que existirá un equilibrio cuando los conjuntos de estrategias
tengan propiedades deseables (intervalos acotados) y también las posean las funciones de
utilidad (dos veces continuamente diferenciables y estrictamente cóncavas en la estrategia
del jugador que corresponda).

Pero nada dice de conjuntos de estrategias o de funciones de utilidad no adecuados,


donde el juego puede no tener equilibrio alguno.
Problemas tema 2:

El resto de la Matriz pertenece igual. Es decir :

Fila 1: Casilla Serie, Serie sería( 66%,34% ) y casilla Serie, Deportes (52%,48%)
Fila 2: Casilla Deportes Serie (50%,50%) y casilla Deportes, Deportes (45%,55%) o
(34%,66%).?

En efecto, solo la casilla superior izquierda experimenta cambios. Todo lo demás queda como
estaba en la figura 2.1
El juego de suma cero del problema 2 tiene que basarse en el de suma
constante del problema 1.

La diferencia entre la figura 2.1 y el juego de suma constante del problema 1


afecta solo a una casilla, la superior izquierda, y sus dos pagos son (u1, u2)
= (66, 34).

Todo lo demás no cambia. Así que podemos tomar la figura 2.2 tal cual, pero
hacer cambios en la casilla superior izquierda.

Usamos la fórmula:

v1=u1–u2=66–34=+32
v2=u2–u1=34–66=--32

En el juego de suma cero pasamos de (u1, u2) a (v1, v2), por ese
procedimiento.
La técnica de flechas es totalmente equivalente. Allí donde un jugador es
indiferente entre dos estrategias, hay una flecha de doble punta. Cuando
prefiere una estrategia sobre otra, hay una flecha de una sola punta
señalando en dirección a la estrategia preferida. Es lo mismo.
No entiendo por qué en este problema seguirían existiendo 2 equilibrios, cuando
(2,2) es mayor que (1,1).

¿No sería el equilibrio (2,2) dominante a (1,1)?

En efecto, es así. Pero los equilibrios de Nash son situaciones estables que
se muestran como tales una vez hemos caído en ellas. Y puede haber
varios equilibrios, unos más beneficiosos que otros. Podemos caer en un
equilibrio más beneficioso, y sería estable, o en otro menos beneficioso, y sería
estable también. Cosa distinta es cuál sería la solución previsible del juego. Si
tuviéramos estrategias dominantes podríamos predecir qué ocurrirá,
pero como no las tenemos, ninguno de los dos equilibrios son soluciones
seguras.

La eficiencia (magnitud de las ganancias) es un criterio para elegir solución,


pero antes de aplicarlo deben cumplirse otras condiciones, que en este caso no
se dan.

Son muy importantes las "orientaciones" que hay en el módulo de Documentos,


pues sintetizan cada tema.

¿Pero la estrategia (2,2) no sería dominante a la estrategia superior


izquierda (1,1)? ¿no habría solución porque no hay estrategias
dominantes?

El valor (2,2) no es una "estrategia dominante", es un resultado, una casilla.

Las estrategias son filas o columnas.

El juego no tiene una solución identificable a priori porque ningún equilibrio de


Nash reúne las condiciones para serlo. Lea con atención las orientaciones del
tema 2.
Ganar en el Black Jack: LEER Y ENTENDER SOLO

En todo juego de casino excepto el Black Jack los casinos tienen un valor esperado
positivo.

Un juego subyacente más sencillo ayuda a entender el motivo que convierte el BJ en


un juego no controlable por los crupiers. Sus reglas:

 Dos jugadores: 1 yo y 2 Crupier


 Baraja: 11 cartas (4 dieces y 7 cincos)
 Reparto cartas: 2 mezcla la baraja y 1 corta
 2 extrae dos cartas y se las muestra a 1cartas quemadas
 2 reparte 1 carta boca abajo para 1 y otra boca arriba para él.
 Apuestas (entre 1$ y 5$): 1 apuesta antes de que se le reparta su carta pero
después del quemado.
 Valor cartas: 10 y 5
 Si un jugador roba una segunda carta, su valor se añade al de la
primeravalor total de la mano
 Objetivo de 1: obtener valor mayor que el de 2 pero no excediendo el valor 10.
 Robo: 1 mira su carta si es 5 puede plantarse o volver a robar si roba y es
10, pierde por pasarse. Si es otro 5, ya tiene un valor de 10 y se planta.
 El crupier juega después de plantarse 1 con la primera carta o después de
robar la segunda si tiene 10, se planta; si tiene 5, debe robar otra vez. Si le
sale 10 el crupier pierde, pero si le sale 5, su valor será 10 y se plantará.
 Resultado:
o Si 1 no se ha pasado y 2 sí, el 1 gana una cantidad igual a lo apostado.
o Si ninguno se ha pasado, el que tenga un total más alto gana una
cantidad igual a la apuesta del jugador.
o Si ambos tienen el mismo total, no superior a 10, el dinero no cambia de
manos.

Diez tiene 11 cartas y dos valores diferentes (5 y 10) y BJ tiene 52 cartas y once valores
diferentes.

Si el jugador apuesta 1$ en cada mano, puede esperar una pérdida de 2 centavos por dólar
apostado (pérdida promedio en un juego de casino).

Estrategia para vencer al crupier: Empezamos quemando dos cartas (figura 2.15):
 La baraja original consta de 4 dieces y 7 cincos (número de dieces, número de
cincos)=(4, 7)
 Tras quemar dos cartas, las posibles barajas que quedan: (4, 5), (3, 6) y (2, 7) y sus
probabilidades salen en la figura.
 La quema más probable es la de una carta de cada tipo, que ocurre un poco más del
50% de las veces (56/110).
 La situaciónn (4, 5) favorece al jugador y las otras dos, ricas en cincos, al crupieren
el BJ, cuantos más cincos, más desfavorable para el jugador.
 Para llegar a (4,5) desde (4,7), sacando dos cincos, tenemos que calcular
la probabilidad de sacar precisamente esas dos cartas y no otras. Sacar
primero un cinco: pcinco=(7/11), y (4,7)->(4,6). Sacar luego otro cinco, y
nos quedamos con (4,6)->(4,5): pcinco=(6/10). Sacar los dos cincos:
pcinco,cinco= (7/11) (6/10) = 42/110.
 Para llegar a (2,7) desde (4,7), sacando dos dieces, tenemos que calcular
la probabilidad de sacar precisamente esas dos cartas y no otras. Sacar
primero un diez: pdiez= 4/11, y (4,7)->(3,7). Sacar luego otro diez, y nos
quedamos con (3,7)->(2,7): pdiez= 3/10. Sacar los dos dices: pdiez,diez =
(4/11) (3/10) = 12/110.
 Para llegar a (3,6) desde (4,7), sacando un diez y un cinco, tenemos que
calcular la probabilidad de sacar precisamente esas dos cartas y no otras.
Sacar primero un cinco: pcinco=(7/11), y (4,7)->(3,7). Sacar luego un diez,
y nos quedamos con (3,7)->(3,6): pdiez=(4/10). El total es pcinco,diez =
(7/11) (4/10) = 28/110. Pero podría haber sido al revés. Sacar primero un
diez, y pasar a (4,7)->(3,7) con probabilidad pdiez = 4/11, y después sacar
un cinco y pasar a (3,7)->(3,6) con probabilidad pcinco = 7/10. La
probabilidad de ese resultado final es pdiez,cinco = (4/11)(7/10) = 28/110.
Ahora bien, nos interesa la probabilidad de que ocurra una cosa u otra, y
eso implica sumar probabilidades p = pcinco,diez + pdiez,cinco= 56/110.

Estoy intentando lograr las proporciones del caso 1 pero no llego a 52/72, algo
no hago bien

sigo su procedimiento pero en algo me equivoco

Para llegar a (3,4) desde (4,5), sacando dos dieces, tenemos que calcular la
probabilidad de sacar precisamente esas dos cartas y no otras. Sacar primero un
diez: pdiez= 4/11, y (4,5)->(3,5).

Sacar luego otro diez, y nos quedamos con (3,5)->(2,5): pdiez= 2/10.

Sacar los dos dices: pdiez,diez = (4/11) (2/10) = 8/110.

¿Podría aclararme donde me equivoco?

Espero que la de 20/72 pueda sacarla sola

Si salen las cartas (diez, diez), según las reglas del juego, todo acaba en un
empate de resultado [0,0]. La probabilidad de sacar un diez y pasar de (4,5)-
>(3,5) es pdiez = 4/9. Después, la de sacar otro diez y pasar de (3,5)->(2,5) es
pdiez = 3/8. La probabilidad de ambos eventos es pdiez,diez = (4/9)(3/8) = 12/72.

Si salen las cartas (cinco, diez) o bien (diez, cinco) el juego no se decide,
porque quien ha sacado un 5 tiene que (crupier) o puede (jugador) pedir una
nueva carta. Quien la pida se enfrenta a un mazo con (4,5)->(3,4). Si saca
un cinco empata, y si saca un diez pierde. La situación es simétrica, para uno y
para otro, jugador y crupier, de manera que en promedio si se llega a esta
situación los jugadores acabarán empatando (unas veces en un empate, otras
veces perdiendo uno y ganando el otro y otras veces al revés, pero en promedio
es como si empataran siempre). La probabilidad de obtener las cartas
(cinco,diez) y pasar de (4,5)->(4,4)->(3,4) es pcinco,diez = (5/9)(4/8) = 20/72.
Pero la de obtener (diez, cinco) y pasar de (4,5)->(3,5)->(3,4) es pdiez,cinco =
(4/9)(5/8) = 20/72. La suma es p = pcinco,diez + pdiez,cinco = 40/72.

Si sumamos esa probabilidad a la que calculamos antes y que nos llevaba


también a un empate, tendremos p = 52/72 para un resultado de [0,0].

Hay otra forma de verlo: si sale al menos un diez acabamos en empate, da igual
que sea (diez, diez), (cinco, diez) o (diez,cinco). Podemos calcular la
probabilidad de que salga al menos un diez. Primero calculamos la probabilidad
de que no salga un diez, y después restamos a 1 esa probabilidad. La
probabilidad de que saquemos dos cartas del mazo (4,5) y no saquemos
un diez es que saquemos dos cincos. El proceso en el mazo es (4,5)->(4,4)-
>(4,3), y la probabilidad es pcinco,cinco = (5/9)(4/8) = 20/72. Ahora, si hacemos
pno = 1 – pcinco,cinco = 1 – 20/72 = 52/72.

a) Caso 1: Baraja (4, 5):

Su forma extensiva es la figura 2.16:

2/3

1/3
 Existen cuatro posibles resultados de repartir una carta: (jugador, crupier)=(10, 10),
(10, 5), (5, 10), (5, 5)

(10, 10): Es una mano fácil, un empate automático con ganancias (0, 0).

(10, 5) y (5, 10): Son manos en que en la primera tiene que robar el crupier y en la
segunda el jugador la baraja es la misma en este momento (3, 4) y por ello tienen
las mismas probabilidades. El promedio es un nuevo empate, ganancia (0, 0) con una
probabilidad 52/72 de que al menos se reparta un diez.

(5, 5): Con esta mano, el jugador puede robar o plantarse. Si roba, recibirá un 10 con
probabilidad 4/7, pasándose, con ganancia (-1, 1) y recibirá un 5 con probabilidad 3/7,
llegándole el turno al crupier Si el crupier roba, la probabilidad de que sea un 10 es
2/3, el crupier se pasará y la ganancia del jugador será (1, -1); pero tiene una
probabilidad de 1/3 de sacar un 5, empatando ambos a 10 puntos y con ganancia para
ambos de (0, 0).

El valor esperado del jugador si roba una carta es:

1: con probabilidad 4/14


0: con probabilidad 2/14
-1: con probabilidad 8/14, VE=-4/14

Esto no es prometedor.

Pero si el jugador se planta, el crupier deberá robar una carta y con probabilidad 4/7
será 10, pasándose, por lo que la ganancia del jugador será (1, -1) y con probabilidad
de 3/7 será un 5, ganando el crupier diez a cinco, una ganancia de (-1. 1)

Por tanto, el valor esperado si se planta será:

1: con probabilidad 4/7


-1: con probabilidad 3/7, VE= 1/7

Esto es mejor, no es alto pero sí positivo. El jugador se planta con un cinco cuando el
crupier tiene un cinco, y le gana.

El valor esperado del jugador cuando la baraja es (4, 5) es:

0: con probabilidad 52/72


1/7: con probabilidad 20/72, VE= 20/504
b) Caso 2: Baraja (3, 6):

Su forma es la de la figura 2.17

(0,0)

Aquí también está igualado el juego, excepto cuando se reparten dos cincos, suceso de
probabilidad 30/72. En este caso, si el jugador roba una carta, tiene el siguiente valor
esperado:
1: con probabilidad 4/14
0: con probabilidad 4/14
-1: con probabilidad 6/14, VE=-1/7

Esto no es prometedor.

Pero si el jugador se planta, el crupier deberá robar una carta y el valor esperado del
jugador, si se planta será:

1: con probabilidad 3/7


-1: con probabilidad 4/7, VE= -1/7

Que tampoco es muy bueno. Es un caso en el que el jugador pierde, con un valor esperado
total:

El valor esperado del jugador cuando la baraja es (3, 6) es:

0: con probabilidad 42/72


-1/7: con probabilidad 30/72, VE= -30/504
c) Caso 3: Baraja (2, 7):

Su forma es la de la figura 2.18

Aquí el jugador también pierde, y el valor esperado del jugador cuando la baraja es (2, 7) es:

0: con probabilidad 30/72


-1/21: con probabilidad 42/72, VE= -14/504

Vistos los tres casos, ahora podemos calcular el valor esperado de apostar lo mínimo, un
dólar, cada una de las veces, sea cual sea la baraja. Tenemos:

20/504 con probabilidad 42/110, la baraja (4, 5)


-30/504 con probabilidad 56/110, la baraja (3, 6)
-14/504 con probabilidad 12/110, la baraja (2, 7)

por lo tanto, el valor esperado es:

VE=- 1.008/55.440

El jugador puede esperar una pérdida de unos dos centavos por dólar apostado.

Principio 1 de Diez: unas situaciones son favorables para el jugador, otras noreconociendo
su diferencia podrá variar sus apuestas para sacar partido de las situaciones a su favor.

Principio 2 de Diez: apostar lo mínimo en situaciones desfavorables y lo máximo en las


favorables

Con ellos podemos efectuar la siguiente estrategia: Apostar 5$ cuando la quema conduce a
la situación (4, 5) y en el resto de casos, lo mínimo, 1$.
El valor esperado de esta estrategia será:

Utilizando estos dos principios, el jugador puede esperar ganar unos cuatro centavos por
dólar apostado convierten al jugador perdedor en ganador. El crupier no puede hacer
nada, salvo trampa descarada. El único problema es poder determinar en un casino las
situaciones favorables.

También podría gustarte