COMPORTAMIENTO Tema 2 MRH PDF
COMPORTAMIENTO Tema 2 MRH PDF
COMPORTAMIENTO Tema 2 MRH PDF
Juegos de suma cero o de suma constante: los intereses de los jugadores son totalmente
contrapuestos.
Juegos de suma variable: los intereses de los jugadores no están totalmente contrapuestos
(no todas las soluciones de estos juegos coinciden).
Supongamos que en cada resultado posible del juego, la suma de las utilidades de los
jugadores 1 y 2 es cero:
u1 + u2 = 0K=0
- En cada caso, la suma de las utilidades es cero. Esta es la condición de suma cero
no se crea nada de valor los jugadores se devoran mutuamente.
- El libro de Lester Thurow lo mal que irían las empresas con el principio “si yo
gano, tú tienes que perder”imposible el cambio económico (o se da a un coste muy
elevado).
- Son un caso particular de juegos de suma constante. Sea cual sea el resultado, la
suma de las utilidades es una constante k.
- Dos cadenas, 1 y 2, luchan por cuotas de audiencia (cuanto más altas sean, mayores
ingresos por venta de publicidad).
- Cada una puede elegir entre emitir una serie o acontecimiento deportivo.
- Sus decisiones se tomarán de forma simultánea e independiente de las otras.
- La cadena 1 tiene ventaja programando series
- La cadena 2 tiene ventaja programando acontecimientos deportivos.
- Si ambas emiten series, la primera se queda con el 55% de la audiencia.
- Si ambas emiten deportes, la segunda se lleva el 55% de la audiencia.
- En la “forma normal”, resolvemos el juego mediante uso de flechas: la dirección de
las flechas representa las preferencias de los jugadores.
o Flecha Izda.: la cadena 1 prefiere emitir serie obteniendo audiencia del 55% a emitir
deportes con audiencia del 50%, cuando la 2 emite una serie.
o Flecha Inferior: la cadena 2 prefiere emitir deportes con una audiencia del 55% en vez
de series con un 50%, cuando la 1 emite deportes.
o Flecha Superior: la 2 prefiere emitir deportes con audiencia del 48% a emitir series con
45% de audiencia si la 1 emite series.
o Flecha Dcha.: la cadena 1 prefiere emitir series al 52% de audiencia en vez de deportes
al 45% cuando la dos emite deportes.
- Existe una única situación tal que las flechas apuntan hacia un “equilibrio” desde
ambas direcciones (*) donde la 1 emite series con el 52% de audiencia y la 2 emite
deportes con un 48% de audiencia. Esta es la Solución del juego.
- En el equilibrio (equilibrio de Nash), sería un error por parte de cualquiera de las
dos cadenas adoptar una estrategia diferente; cada jugador elige la mejor opción
dada la competencia. Cada cadena obtiene su mejor cuota dado el competidor contra
el que está luchando.
- En un juego de suma constante, sea cual sea el resultado, la suma de las utilidades de los
jugadores es una constante k. A menudo k = 1 (=100%). Si k=0 => juego de suma cero.
- Existe una forma “sencilla” de relacionar juegos de suma constante y juegos de suma
cero con dos jugadores:
u1 + u2 = k
u1 + u2 = 0.
v1 = u1 - u2
v2 = u2 - u1
v1 + v2 = 0
u1 + u2 = k
v1= 2u1-k
v2= 2u2-k
Estas funciones:
Para ver como se obtienen ganancias de la figura 2.2 a partir de 2.1: calculamos la batalla
de las cadenas como juego de suma cero Si consideramos que ambas cadenas emiten
una serie:
En este caso, la utilidad de cadena 1, en la casilla (serie, serie) demuestra que tiene una
ventaja competitiva frente a cadena 2.
La cadena 2 obtiene 52% y k = 1: ………así para cada casilla se obtienen el resto de las
ganancias.
Esto muestra que el razonamiento estratégico no varía a causa de transformaciones
lineales positivas de las utilidades de dos jugadores.
Ventaja competitiva: cuando una empresa adopta la nueva tecnología, consigue una
ventaja sobre sus competidores.
El equilibrio de la Ventaja competitiva, las flechas apuntan hacia ella desde las dos
direcciones, se da cuando cada empresa adopta la nueva tecnología.
Las empresas en este juego se ven abocadas a adoptar cada nueva tecnología que vaya
apareciendo. La fuerza subyacente de esta necesidad es la solución al juego de Ventaja
competitiva.
Es la versión más simple del póquer; también consideraremos sólo dos jugadores
(podría ser jugado por varios jugadores con varias cartas).
Sean:
Dos jugadores: 1 y 2
Un mazo de cartas: 50% Ases y 50% Reyes
Cada jugador con una apuesta inicial, a, en el centro de la mesa.
El bote será la suma de las apuestas iniciales.
Se reparte boca abajo a cada jugador una carta que ninguno ve (en el real cada uno
ve sus propias cartas).
Un jugador podrá hacer una nueva apuesta, b, que deposita en el bote, o podrá
pasar.
Los jugadores tomarán la decisión de forma simultánea (en el real se hace de forma
sucesiva, a modo de señalización)
Concluida la fase de apuestas se acaba el juego:
Para el Jugador 1.
Estrategia Apostar, Apostar: las probabilidades de los puntos terminales del juego
serán:
Entonces se obtiene operando con cada una de las estrategias para cada uno
de los jugadores la forma normal.
Siguiendo las flechas, la solución al Póquer de una carga es que cada jugador apueste
Con esta solución ambos jugadores se quedan como al principio.
Este resultado, que los jugadores se queden sin ganar ni perder, refleja el hecho de que el
reparto de las cartas es equilibrado: cada jugador tiene las mismas probabilidades de
obtener una buena carta.
Las figuras 2.3 y 2.5 son iguales; las estrategias son iguales: El póquer de una carta y
Ventaja competitiva tienen el mismo contenido estratégico apostar en el póquer da una
ventaja sobre el jugador que pasa. Si no se arriesga nada, no se gana nada.
Una estrategia es estrictamente dominante si es mejor que cualquier otra estrategia ante
cualquier contingencia. Es aquella que proporciona pagos estrictamente
mayores que los de sus alternativas.
Una estrategia es dominante si es al menos tan buena como cualquier otra estrategia ante
cualquier contingencia y mejor ante alguna contingencia. Es aquella que proporciona
pagos mayores o iguales a los de sus alternativas (unos mayores, otros
iguales, pero ninguno menor).Si tengo estrategia dominante, no importa lo que haga
mi adversario; lo mejor para mí es jugar esta estrategia dominante.
Es un error serio y caro jugar una estrategia que está estrictamente dominada.
Ninguna estrategia dominada debe jugarse como parte de un equilibrioLas flechas
apuntarían en una dirección que nos alejaría de tal estrategia y nos llevaría a una
estrategia estrictamente dominante.
En ventaja Competitiva y Póquer de una carta, el parámetro a mide el precio que se paga
por jugar una estrategia estrictamente dominada.
Una estrategia no dominada es aquella para la que no existe una alternativa que
proporcione pagos siempre iguales o superiores.
Si una estrategia está dominada por otra estrategia es que es peor que esa otra,
y podemos "tacharla".
Un juego de suma cero con dos jugadores puede tener múltiples equilibrios.
En esta figura 2.6. juego de suma cero con dos jugadores y dos soluciones, ambos
jugadores pueden elegir izquierda o derecha de forma simultánea.
Si el 2 elige izquierda, pierde inmediatamenteelige derecha.
En la 2.7. tenemos un juego de suma cero con dos jugadores y cuatro equilibrios; más
complicado:
Ambos pueden elegir izda, centro o dcha simultáneamente.
La única forma de que 2 pierda es eligiendo centro cuando el 1 no lo hace.
El resto de combinaciones de estrategias conducen a un empate.
Los cuatro equilibrios: (izda, izda), (izda, dcha), (dcha, izda) y (dcha, dcha) tienen las
mismas gananciasempate.
Desarrollo:
El jugador 1 tiene que elegir estrategia (fila). Va señalando su mejor opción en cada caso:
El jugador 2 tiene que elegir estrategia (columna). Va señalando su mejor opción en cada
caso:
1) si el jugador fila elige izquierda, él preferirá izquierda o derecha. Marcamos con
círculo azul;
En todos los juegos de equilibrio múltiple las ganancias de cada jugador son las mismas
en cada equilibrio matemáticamente es necesario que cada equilibrio de un juego de
suma cero con dos jugadores tengan las mismas ganancias.
Teorema de solución para juegos de suma cero con dos jugadores: Todo equilibrio de un
juego de suma cero con dos jugadores tiene el mismo valor.
Demostración del teorema por contradicción: por hipótesis, los vectores de ganancias (a, -a)
y (b, -b) son equilibrios y, a no es igual a bestas dos soluciones diferentes no pueden
estar en la misma fila o columna (pues sería una contradicción inmediata)
a>d
b>c
-a > -c
-b > -d
Resolviendo este sistema de desigualdades: a > d > b > c > a contradicción.
Se supone que:
(a, -a) y (b, -b) no son iguales Esto último no puede ser verdad.
a > d, y que
b > c, y que
-b > -d
Todo eso se deduce del hecho (un supuesto) de que las dos casillas con el
asterisco son equilibrios.
Con todas las desigualdades ante nosotros podemos construir las relaciones
a > d > b > c > a Es una contracción puesto que a > a no puede ser.
Por tanto, las dos condiciones a partir de las cuales hemos construido las
desigualdades (que (a, -a) y (b, -b) son equilibrios de Nash y que (a, -a) y (b, -
b) no son iguales) no pueden darse a la vez, puesto que si las imponemos -
ambas- vamos a una contradicción.
Si además hacemos que una o todas las flechas vayan en las dos direcciones,
reemplazando la desigualdad con una igualdad, también se obtiene contradicción.
Como todos los equilibrios de un juego de suma cero con dos jugadores tienen el mismo
valor, podemos identificar las ganancias de solución con cualquiera de ellos. Esto no es
cierto en juegos generales de suma variable (que pueden tener equilibrios con ganancias
muy diferentes).
2.5.- Juegos de suma variable con dos jugadores
La mayoría de los juegos en el mundo empresarial no son de suma constante. Son más
complejos y su solución teórica mucho más complicada.
(no, no) que implica no acuerdo y por tanto obtener cero dólaresdebemos
distinguir entre equilibrio y solución.
Equilibrio
Cualquier par de estrategias tal que las flechas apuntan hacia ellas desde cualquier
dirección.
la condición necesaria (debe ser satisfecha por todos los candidatos para que sea solución)
para minimizar es que su primera derivada sea cero: como x=0, será
un candidato para resolver el problema de minimización.
la condición suficiente es que la segunda derivada sea mayor que cero: ;
como se cumple porque
la condición necesaria para maximizar sería que su primera derivada sea mayor que
cero: >0
la condición suficiente, que la segunda derivada sea negativa: =2<0
Que un resultado sea un equilibrio no significa que sea una soluciónPara ser una
solución el resultado debe satisfacer también las condiciones suficientes de estrategias
no dominadas.
¿Por qué el equilibrio de Nash se encuentra en el punto no-no? El resultado es el mismo si
uno de los dos dice que no, es decir, (0, 0).
Hay dos casillas con ambos valores marcados, que son la superior izquierda
y la inferior derecha.
Por ejemplo, para que pueda usted comprar un coche es suficiente con tener
ahorrado el dinero para comprarlo, pero no es necesario, pues puede pedir un
crédito o recibir un préstamo de un familiar. Sin embargo, para comprar un
coche tiene que tener el carnet de conducir, si bien no es suficiente, ya que
además del carnet deberá tener el dinero.
Hay condiciones que son necesarias y suficientes, a la vez, para que algo
se cumpla o sea verdad.
Una condición que debe cumplir necesariamente el valor (x*) para generar
un máximo en y es que la derivada parcial de esa función sea cero, es
decir, df/dx = 0, pero eso no es condición suficiente. No lo es porque,
cumpliéndose, podría ocurrir que (x*) nos diera un mínimo para y, no un
máximo.
Toda solución de un juego tiene que ser un equilibrio Por tanto, ser
equilibrio es condición necesaria, pero no suficiente, para ser solución. Un
motivo es que puede haber más de un equilibrio.
En el caso del juego de la figura 2.9 los dos equilibrios son simétricos en
ganancias (el juego es simétrico). Hace falta un criterio para elegir, y ese
criterio es el de estrategias no dominadas. A la solución se llega aplicando
estrategias no dominadas, siempre.
Figura 2.9
Estrella Sí No
\
Director
Sí 15, 15 0, 0
No 0, 0 0, 0
Si (s, t) es un equilibrio pero desde el punto de vista del jugador 1 hay otra estrategia s*
que domina a s, y desde el punto de vista del jugador 2 la estrategia t* domina a la t
dicho equilibrio (s, t) no será solución.
Las condiciones suficientes en teoría de juegos nos dicen que algo no puede ser una
solución, aunque sea un equilibrio. La idea de estas condiciones es eliminar ciertos
equilibrios como posibles soluciones.
En el juego Hagamos un trato la solución no dominada será que ambos, estrella y director,
digan sí al acuerdo.
Este juego de coordinación tiene dos equilibrios pero no importa si las empresas
escogen Beta o VHS mientras escojan el mismo sistema.
Como ninguno de los dos sistemas domina al otro, ambos satisfacen la condición
suficiente de estrategias dominadas
Las alegorías son útiles pues enseñan cómo aplicar a situaciones complicadas lo que hemos
aprendido en una situación simple.
USA 1964: se emite primera advertencia de que fumar puede perjudicar la saludlas
compañías se mostraron reacias a incluir el mensaje de advertencia en sus productos.
Las entradas en la matriz de ganancias son los beneficios de cada compañía en $ de 1970.
Se trata de un juego de suma variable con dos empresas: Aquí vemos que la publicidad en
tv es una poderosa herramienta de mk.
Si C1 hace publicidad y C2 noBº de C1 crece 20%; lo mismo que si intercambian los
papeles cada una de las compañías tiene incentivos para anunciar sus cigarrillos en TV.
Ésta es la estrategia dominante para ambas compañías Existe un único equilibrio y por
tanto solución, en el que las dos compañías hacen publicidad.
Cuando ambas hacen la publicidad al tiempo los beneficios son solo de 27 millones $
para cada una (23 millones menos que si no hicieran publicidad)la publicidad de una
anula a la otra (juego ineficiente) quedan las ventas casi igual pero a un coste más
alto.
Un resultado es eficiente si no existe ningún otro resultado que proporcione a todos los
jugadores una ganancia mayor.
Los desequilibrios no son lugares en que los jugadores deban quedarse, pues aparecería
la paradoja.
Todo juego en el que cada jugador tiene una estrategia dominante tiene una única
solución que consiste en jugar esta estrategia dominante.
Cuando esta situación es mala para los jugadores, el fenómeno recibe el nombre de dilema
de los presos. Los jugadores están presos de sus propias estrategias, a no ser que algo
cambie el juego (en el caso del tabaco USA ese algo fue el gobierno; el acuerdo con éste
llevó a las compañías a renunciar a la publicidad en tv).
Una de las grandes diferencias entre juegos de suma cero y de suma variable es que las
soluciones de los juegos de suma cero son siempre eficientes, mientras las de los juegos
de suma variable raramente lo son un cambio en las reglas del juego pueden convertir
una solución ineficiente en eficiente, significando un aumento de Bº.
En principio el juego debe reflejar las circunstancias reales del caso que se
estudia, o bien, si es un caso meramente ilustrativo, debe estar diseñado -con
supuestos razonables- para ilustrar lo que pretendemos.
Hay un caso real, histórico, de dos empresas (duopolio) que compiten, y donde
una campaña de publicidad de una cambia las cuotas de mercado. Fue el caso
de Coca-Cola y Pepsi.
Llamemos:
Suponiendo que x1 y x2 pudieran tener 100 valores diferentes, para describir el juego
precisaríamos una matriz 100x100; y, si los valores que pudieran adoptar estuvieran entre 0 y 1…
por tanto el juego se podrá resolver de otras formas.
La clave para tratar con juegos con muchas estrategias es el cálculo diferencial.
4) Si hay más de una solución recurriremos a condiciones suficientes para con las
soluciones.
Ejemplo: Supongamos que x1 y x2 son los presupuestos (cualquier número entre 0 y 1.000$)
para publicidad de dos empresas 1 y 2.
0=1.000-2x1
0=1.000-x1-2x2
x1=1.000/2= 500
x2=(1.000-500)/2=250
u1 (x*) = 187.500 $
u2(x*) = 62.500 $
En este equilibrio hay mucha publicidad; ambas empresas aún podrían ganar más haciendo
menos publicidad.
Resolviendo,
x1= 428,6
y
x2= 142,9
u1= 224,482 $
y
u2= 61.232,65 $
de donde podemos concluir que las empresas que compiten en publicidad tienden a anunciarse
demasiado.
Ser un equilibrio es una condición necesaria para que una combinación de estrategias sea
la solución del juego. Si una combinación de estrategias no es un equilibrio, entonces al
menos uno de los jugadores tiene incentivos para cambiar su juego.
El que sean estrategias no dominadas es una condición suficiente para una solución de un
juego. Un equilibrio en estrategias dominadas no puede ser una solución según esta
condición suficiente.
Tengamos un intervalo acotado, un espacio de estrategias para cada jugador, por ejemplo [0, 1].
Sus respectivas funciones de utilidad son u1(x1, x2) y u2(x1, x2). Estas funciones de utilidad son
dos veces continuamente diferenciables y además cada una es estrictamente cóncava en la
estrategia del propio jugador.
En el caso de una solución de esquina tomaremos el valor apropiado de x1, 0 o 1, en vez del
valor de mejor respuesta. Las esquinas deberemos inspeccionarlas cuando la solución a esta
condición de primer orden no esté dentro de los límites del intervalo.
La función de mejor respuesta de 2, f2(x1) es el valor de x2 que maximiza u2(x1, x2) para
cualquier x1 dado; es decir, f2(x1) es una función continua en x1 y una solución de la
ecuación:
Sea la función en forma de vector de estas funciones de mejor
respuesta, es decir, la función de mejor respuesta del juego en su conjunto. Como los
componentes de f son funciones continuas, f es continua.
Si tenemos un par de estrategias (x1, x2), el jugador 1 elige su mejor respuesta a x2, f1(x2).
Al mismo tiempo, el jugador 2 elige su mejor respuesta a x1, f2(x1) la función de mejor
respuesta del juego registra estas respuestas el juego ha pasado
Un vector x* que cumpla las dos condiciones de mejor respuesta es un equilibrio las dos
funciones de mejor respuesta se cortan en x*.
x1*=f1 (x2*)
y
x2*=f2 (x1*)
Teorema del punto fijo: Si f es función continua que va del cuadrado unitario al cuadrado
unitario, entonces f tiene un punto fijo, x, donde
x = f (x)
Este argumento garantiza que existirá un equilibrio cuando los conjuntos de estrategias
tengan propiedades deseables (intervalos acotados) y también las posean las funciones de
utilidad (dos veces continuamente diferenciables y estrictamente cóncavas en la estrategia
del jugador que corresponda).
Fila 1: Casilla Serie, Serie sería( 66%,34% ) y casilla Serie, Deportes (52%,48%)
Fila 2: Casilla Deportes Serie (50%,50%) y casilla Deportes, Deportes (45%,55%) o
(34%,66%).?
En efecto, solo la casilla superior izquierda experimenta cambios. Todo lo demás queda como
estaba en la figura 2.1
El juego de suma cero del problema 2 tiene que basarse en el de suma
constante del problema 1.
Todo lo demás no cambia. Así que podemos tomar la figura 2.2 tal cual, pero
hacer cambios en la casilla superior izquierda.
Usamos la fórmula:
v1=u1–u2=66–34=+32
v2=u2–u1=34–66=--32
En el juego de suma cero pasamos de (u1, u2) a (v1, v2), por ese
procedimiento.
La técnica de flechas es totalmente equivalente. Allí donde un jugador es
indiferente entre dos estrategias, hay una flecha de doble punta. Cuando
prefiere una estrategia sobre otra, hay una flecha de una sola punta
señalando en dirección a la estrategia preferida. Es lo mismo.
No entiendo por qué en este problema seguirían existiendo 2 equilibrios, cuando
(2,2) es mayor que (1,1).
En efecto, es así. Pero los equilibrios de Nash son situaciones estables que
se muestran como tales una vez hemos caído en ellas. Y puede haber
varios equilibrios, unos más beneficiosos que otros. Podemos caer en un
equilibrio más beneficioso, y sería estable, o en otro menos beneficioso, y sería
estable también. Cosa distinta es cuál sería la solución previsible del juego. Si
tuviéramos estrategias dominantes podríamos predecir qué ocurrirá,
pero como no las tenemos, ninguno de los dos equilibrios son soluciones
seguras.
En todo juego de casino excepto el Black Jack los casinos tienen un valor esperado
positivo.
Diez tiene 11 cartas y dos valores diferentes (5 y 10) y BJ tiene 52 cartas y once valores
diferentes.
Si el jugador apuesta 1$ en cada mano, puede esperar una pérdida de 2 centavos por dólar
apostado (pérdida promedio en un juego de casino).
Estrategia para vencer al crupier: Empezamos quemando dos cartas (figura 2.15):
La baraja original consta de 4 dieces y 7 cincos (número de dieces, número de
cincos)=(4, 7)
Tras quemar dos cartas, las posibles barajas que quedan: (4, 5), (3, 6) y (2, 7) y sus
probabilidades salen en la figura.
La quema más probable es la de una carta de cada tipo, que ocurre un poco más del
50% de las veces (56/110).
La situaciónn (4, 5) favorece al jugador y las otras dos, ricas en cincos, al crupieren
el BJ, cuantos más cincos, más desfavorable para el jugador.
Para llegar a (4,5) desde (4,7), sacando dos cincos, tenemos que calcular
la probabilidad de sacar precisamente esas dos cartas y no otras. Sacar
primero un cinco: pcinco=(7/11), y (4,7)->(4,6). Sacar luego otro cinco, y
nos quedamos con (4,6)->(4,5): pcinco=(6/10). Sacar los dos cincos:
pcinco,cinco= (7/11) (6/10) = 42/110.
Para llegar a (2,7) desde (4,7), sacando dos dieces, tenemos que calcular
la probabilidad de sacar precisamente esas dos cartas y no otras. Sacar
primero un diez: pdiez= 4/11, y (4,7)->(3,7). Sacar luego otro diez, y nos
quedamos con (3,7)->(2,7): pdiez= 3/10. Sacar los dos dices: pdiez,diez =
(4/11) (3/10) = 12/110.
Para llegar a (3,6) desde (4,7), sacando un diez y un cinco, tenemos que
calcular la probabilidad de sacar precisamente esas dos cartas y no otras.
Sacar primero un cinco: pcinco=(7/11), y (4,7)->(3,7). Sacar luego un diez,
y nos quedamos con (3,7)->(3,6): pdiez=(4/10). El total es pcinco,diez =
(7/11) (4/10) = 28/110. Pero podría haber sido al revés. Sacar primero un
diez, y pasar a (4,7)->(3,7) con probabilidad pdiez = 4/11, y después sacar
un cinco y pasar a (3,7)->(3,6) con probabilidad pcinco = 7/10. La
probabilidad de ese resultado final es pdiez,cinco = (4/11)(7/10) = 28/110.
Ahora bien, nos interesa la probabilidad de que ocurra una cosa u otra, y
eso implica sumar probabilidades p = pcinco,diez + pdiez,cinco= 56/110.
Estoy intentando lograr las proporciones del caso 1 pero no llego a 52/72, algo
no hago bien
Para llegar a (3,4) desde (4,5), sacando dos dieces, tenemos que calcular la
probabilidad de sacar precisamente esas dos cartas y no otras. Sacar primero un
diez: pdiez= 4/11, y (4,5)->(3,5).
Sacar luego otro diez, y nos quedamos con (3,5)->(2,5): pdiez= 2/10.
Si salen las cartas (diez, diez), según las reglas del juego, todo acaba en un
empate de resultado [0,0]. La probabilidad de sacar un diez y pasar de (4,5)-
>(3,5) es pdiez = 4/9. Después, la de sacar otro diez y pasar de (3,5)->(2,5) es
pdiez = 3/8. La probabilidad de ambos eventos es pdiez,diez = (4/9)(3/8) = 12/72.
Si salen las cartas (cinco, diez) o bien (diez, cinco) el juego no se decide,
porque quien ha sacado un 5 tiene que (crupier) o puede (jugador) pedir una
nueva carta. Quien la pida se enfrenta a un mazo con (4,5)->(3,4). Si saca
un cinco empata, y si saca un diez pierde. La situación es simétrica, para uno y
para otro, jugador y crupier, de manera que en promedio si se llega a esta
situación los jugadores acabarán empatando (unas veces en un empate, otras
veces perdiendo uno y ganando el otro y otras veces al revés, pero en promedio
es como si empataran siempre). La probabilidad de obtener las cartas
(cinco,diez) y pasar de (4,5)->(4,4)->(3,4) es pcinco,diez = (5/9)(4/8) = 20/72.
Pero la de obtener (diez, cinco) y pasar de (4,5)->(3,5)->(3,4) es pdiez,cinco =
(4/9)(5/8) = 20/72. La suma es p = pcinco,diez + pdiez,cinco = 40/72.
Hay otra forma de verlo: si sale al menos un diez acabamos en empate, da igual
que sea (diez, diez), (cinco, diez) o (diez,cinco). Podemos calcular la
probabilidad de que salga al menos un diez. Primero calculamos la probabilidad
de que no salga un diez, y después restamos a 1 esa probabilidad. La
probabilidad de que saquemos dos cartas del mazo (4,5) y no saquemos
un diez es que saquemos dos cincos. El proceso en el mazo es (4,5)->(4,4)-
>(4,3), y la probabilidad es pcinco,cinco = (5/9)(4/8) = 20/72. Ahora, si hacemos
pno = 1 – pcinco,cinco = 1 – 20/72 = 52/72.
2/3
1/3
Existen cuatro posibles resultados de repartir una carta: (jugador, crupier)=(10, 10),
(10, 5), (5, 10), (5, 5)
(10, 10): Es una mano fácil, un empate automático con ganancias (0, 0).
(10, 5) y (5, 10): Son manos en que en la primera tiene que robar el crupier y en la
segunda el jugador la baraja es la misma en este momento (3, 4) y por ello tienen
las mismas probabilidades. El promedio es un nuevo empate, ganancia (0, 0) con una
probabilidad 52/72 de que al menos se reparta un diez.
(5, 5): Con esta mano, el jugador puede robar o plantarse. Si roba, recibirá un 10 con
probabilidad 4/7, pasándose, con ganancia (-1, 1) y recibirá un 5 con probabilidad 3/7,
llegándole el turno al crupier Si el crupier roba, la probabilidad de que sea un 10 es
2/3, el crupier se pasará y la ganancia del jugador será (1, -1); pero tiene una
probabilidad de 1/3 de sacar un 5, empatando ambos a 10 puntos y con ganancia para
ambos de (0, 0).
Esto no es prometedor.
Pero si el jugador se planta, el crupier deberá robar una carta y con probabilidad 4/7
será 10, pasándose, por lo que la ganancia del jugador será (1, -1) y con probabilidad
de 3/7 será un 5, ganando el crupier diez a cinco, una ganancia de (-1. 1)
Esto es mejor, no es alto pero sí positivo. El jugador se planta con un cinco cuando el
crupier tiene un cinco, y le gana.
(0,0)
Aquí también está igualado el juego, excepto cuando se reparten dos cincos, suceso de
probabilidad 30/72. En este caso, si el jugador roba una carta, tiene el siguiente valor
esperado:
1: con probabilidad 4/14
0: con probabilidad 4/14
-1: con probabilidad 6/14, VE=-1/7
Esto no es prometedor.
Pero si el jugador se planta, el crupier deberá robar una carta y el valor esperado del
jugador, si se planta será:
Que tampoco es muy bueno. Es un caso en el que el jugador pierde, con un valor esperado
total:
Aquí el jugador también pierde, y el valor esperado del jugador cuando la baraja es (2, 7) es:
Vistos los tres casos, ahora podemos calcular el valor esperado de apostar lo mínimo, un
dólar, cada una de las veces, sea cual sea la baraja. Tenemos:
VE=- 1.008/55.440
El jugador puede esperar una pérdida de unos dos centavos por dólar apostado.
Principio 1 de Diez: unas situaciones son favorables para el jugador, otras noreconociendo
su diferencia podrá variar sus apuestas para sacar partido de las situaciones a su favor.
Con ellos podemos efectuar la siguiente estrategia: Apostar 5$ cuando la quema conduce a
la situación (4, 5) y en el resto de casos, lo mínimo, 1$.
El valor esperado de esta estrategia será:
Utilizando estos dos principios, el jugador puede esperar ganar unos cuatro centavos por
dólar apostado convierten al jugador perdedor en ganador. El crupier no puede hacer
nada, salvo trampa descarada. El único problema es poder determinar en un casino las
situaciones favorables.