Teoria Dos Jogos Apostila 1
Teoria Dos Jogos Apostila 1
Teoria Dos Jogos Apostila 1
1. Introdução
1.1. Definição
1.2. Histórico
Em geral aceita-se que a Teoria dos Jogos como disciplina propriamente dita
começou com a publicação de The Theory of Games and Economic Behaviour, de
von Neumann and Morgenstern 1 , in 1944, que estendeu o trabalho original de von
Neumann sobre o assunto 2 . No entanto, as idéias básicas de jogos que podem ser
encontradas naquele livro já estavam presentes em um trabalho mais antigo de Borel 3 .
Por exemplo, Borel desenvolveu o conceito fundamental de estratégia, tanto pura
quanto mista, o que foi inclusive reconhecido por von Neumann, embora não tenha
ido além do caso de jogos simétricos com dois agentes. Ele foi também o primeiro a
1
Von Neumann, John and Oskar Morgenstern (1944). The Theory of Games and Economic
Behavior, Princeton University Press, Princeton, NJ.
2 Von Neumann, J. 1928. "Zur Theories der Gesellschaftsspiele." Mathematische Annalen 100:295-
320. English translation by S. Bergmann in R. D. Luce and A. W. Tucker, eds., Contributions to the
Theory of Games IV (1959), Princeton University Press, pp. 13-42.
3 Borel, E. 1921. "La théorie du jeu et les equation intégrales à noyau symétrique gauche," Comptes
Rendus de l'Académie des Sciences 173:1304-1308. English translation by L. J. Savage in
Econometrica 21:97-100.
1
reconhecer a importância potencial de saber se o teorema do minimax era verdadeiro
para um número arbitrário n de jogadores, mas foi somente capaz de prová-lo para
n = 3 e n = 5 . Deve-se conferir a von Neumann o crédito de ter demonstrado a
validade do teorema do minimax para um n arbitrário.
Embora preocupado primordialmente com jogos de soma zero, um conceito
relativamente restritivo onde o que um jogador ganha outro deve perder, The Theory
of Games and Economic Behaviour é aclamado por ter sido o primeiro a introduzir
a idéia de que conflito é um fenômeno tratável matematicamente. Nas suas duas
primeiras edições (1944 e 1947), von Neumann e Morgenstern desenvolveram muitos
dos elementos fundamentais da teoria dos jogos: as formas extensiva e normal
conectadas pelo conceito de estratégia; o uso de teoremas do ponto fixo para provar a
existência de soluções para jogos com escolhas aleatórias; e uma derivação geral do
critério de utilidade esperada usado no estudo de decisões individuais.
A formulação do “Dilema dos Prisioneiros” por Tucker (1950) 4 e os artigos de
Nash em que foi definido e provada a existência do seu conceito de equilíbrio 5 foram
as contribuições fundamentais subseqüentes à moderna teoria dos jogos não-
cooperativos. O trabalho de Nash, em particular, pode ser considerado como uma
reformulação da teoria dos jogos como ela era conhecida até então. Tão importante
quanto a sua definição e prova da existência de equilíbrio não-cooperativo foi sua
argumentação de que esse conceito, juntamente com a forma normal introduzida por
von Neumann, fornece uma metodologia geral e completa para a análise de qualquer
jogo.
Concomitantemente, a teoria dos jogos cooperativos estava sendo desenvolvida
nos artigos seminais de Nash (1950) e Shapley (1953) sobre jogos de barganha e
Gillies (1953) e Shapley (1953) sobre o núcleo. 6
4
Tucker, Albert (1950). “A two-person dilemma,” Stanford University mimeo, May. Reprinted in
Rasmusen, Eric, ed. (2001), Readings in Games and Information, Oxford: Blackwell Publishing.
5 Nash, Jr., John F. (1950). "Equilibrium points in n-person games." Proceedings of the National
Academy of Sciences, U.S.A. 36:48-49 and Nash, Jr., John F. (1951). "Noncooperative games." Annals
of Mathematics 54:289-295.
6
Nash, Jr., John F. (1950). "The bargaining problem." Econometrica 18(2):155-162. Shapley, Lloyd
(1953) “Open questions,” in Report of an informal conference on the theory of n-person games, p.
15, Princeton Mathematics mimeo. Shapley, Lloyd (1953). “A value for n-person games,” in Kuhn,
Harold and Albert Tucker, eds. (1953), Contributions to the theory of games, volume II, Annals of
Mathematics Studies, no. 28, Princeton: Princeton University Press. Gillies, Donald (1953).
“Locations of solutions,” in Report of an informal conference on the theory of n-person games, pp.
11-12, Princeton Mathematics mimeo.
2
1.3. Jogos não-cooperativos versus jogos cooperativos
A análise teórica dos jogos incorpora a idéia de que os agentes procuram obter
informações sobre o comportamento dos outros agentes, enquanto que no equilíbrio
competitivo os agentes só estão interessados no valor de determinado parâmetro (por
ex., preço), embora esse parâmetro seja afetado pelas ações dos demais agentes.
2.1. Definição
3
Definição: A forma normal (ou estratégica) Γ N de um jogo como I jogadores
especifica, para cada jogador I, um conjunto de estratégias Si e uma função payoff
2
E NE
1 E 2,2 -1,3
NE 3,-1 0,0
para todo s− i ∈ S − i .
4
Não é muito comum encontrar jogos onde os jogadores têm estratégias
dominantes. Outra possibilidade então é exigir que os jogadores não joguem
estratégias dominadas. Uma estratégia é dominada quando existe uma estratégia
alternativa que gera um payoff maior não importam quais sejam as estratégias jogadas
pelos demais jogadores.
Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ se existe outra estratégia si′ ∈ Si tal que, para todo s− i ∈ S − i ,
Nesse caso, dizemos que si′ domina si estritamente. Também podemos dizer
que uma estratégia é dominante se ela domina estritamente todas as outras estratégias.
Exemplo:
2
L R
U 1, -1 -1, 1
1 M -1, 1 1, -1
D -2, 5 -3, 2
com desigualdade estrita para pelo menos um s− i . Nesse caso, dizemos que a
estratégia si′ domina fracamente a estratégia si . Uma estratégia é fracamente
dominante se ela domina fracamente todas as demais estratégias.
Exemplo:
5
L R
U 5, 1 4, 0
M 6, 0 3, 1
D 6, 4 4, 4
O participante que submete a proposta de maior valor vence o leilão, ficando com o
objeto, e paga por ele o valor da segunda maior proposta. Os demais participantes não
pagam nem recebem nada. Ou seja, se bi > max b j , o payoff do participante i é
j ≠i
ui = vi − max b j e os dos demais são iguais a zero. Se houver empate entre vários
j ≠i
participantes, ou seja, mais de uma proposta com o valor mais alto, o bem é alocado a
algum deles de maneira aleatória.
Queremos mostrar que a proposta vi do jogador i domina fracamente todas as
suas demais estratégias. Temos dois casos a considerar:
ui ( vi , b−i ) = 0 e ui ( bi , b−i ) = 0.
6
ui ( vi , b−i ) = ui ( bi , b−i ) = vi − bk . Se bk ≥ vi , então ui ( vi , b−i ) = 0 e
ui ( bi , b−i ) = vi − bk ≤ 0 .
então cada um desses n jogadores recebe o bem com probabilidade 1 n . Nesse caso,
1
ui ( vi , b−i ) = 0 e ui ( bi , b− i ) = ( vi − bi ) < 0 .
n
maior proposta.
Se ∃ n − 1 jogadores com b j = bi , então
1
ui ( bi , b− i ) = ( vi − bi ) < vi − bi = ui ( vi , b−i )
n
ui ( vi , b−i ) = vi − bk > 0 .
dominada por vi . A do caso (ii) mostra que qualquer estratégia bi < vi é fracamente
dominada por vi .
NC C
NC 0,-2 -10,-1
C -1,-10 -5,-5
7
A eliminação iterativa se dá da seguinte maneira:
Definição: Suponha que Si1 seja o conjunto de todas as estratégias do jogador i que
não são dominadas, Si2 , o conjunto das estratégias em Si1 que não são dominadas
estratégias Si1 ⊃ Si2 ⊃ Si3 ... , então uma estratégia é iterativamente dominante para o
8
previsto é então ( D, R ) . No entanto, se M for eliminada primeiro, depois R e depois
L R
U 5, 1 4, 0
M 6, 0 3, 1
D 6, 4 4, 4
ui (σ i′, σ −i ) ≥ ui (σ i′, σ −i )
b g
para todo σ i′ ∈ Δ Si . A estratégia σ i nunca é uma melhor resposta se não há σ − i
É bastante razoável supor que um jogador nunca queira jogar uma estratégia
que nunca é uma melhor resposta. Além disso, dada a hipótese de conhecimento
comum, podemos eliminar iterativamente aquelas estratégias que nunca são uma
melhor resposta, o que nos conduz à seguinte definição:
b g
Definição: No jogo Γ Ν = ⎡⎣Ι, {Δ ( Si )} , {ui ( ⋅)}⎤⎦ , as estratégias em Δ Si que
sobrevivem à remoção iterativa de estratégias que nunca são uma melhor resposta
são conhecidas como estratégias racionalizáveis do jogador i.
Exemplo:
9
b1 b2 b3 b4
a1 0,7 2,5 7,0 0,1
a2 5,2 3,3 5,2 0,1
a3 7,0 2,5 0,7 0,1
a4 0,0 0,-2 0,0 10,-1
a1 é a melhor resposta a b3
a2 é a melhor resposta a b2
a3 é a melhor resposta a b1
b1 é a melhor resposta a a1
b2 é a melhor resposta a a2
b3 é a melhor resposta a a3
l q
Sendo assim, a1 , a2 , a3 é o conjunto de estratégias racionalizáveis puras para
l q
o jogador 1, e b1 , b2 , b3 , o do jogador 2.
10
estratégia de equilíbrio de cada jogador é uma melhor resposta às estratégias jogadas
pelos demais, o que dá origem à seguinte definição alternativa do equilíbrio de Nash:
b g
Defina, para qualquer s− i ∈ S − i , Βi s− i = ⎨ si ∈ Si : ui ( si , s−i ) ≥ ui ( si′, s− i ) para
Futebol Shopping
Futebol 2, 1 0, 0
Shopping 0, 0 1, 2
2
Ca Co
1 Ca -1,1 1,-1
Co 1,-1 -1,1
11
Discussão do Conceito de Equilíbrio de Nash
3) Pontos focais:
Considere o jogo chamado de encontro em Nova York:
12
ES GC
ES 100, 100 0, 0
GC 0, 0 1000, 1000
B M A
B 100,75 120,70 140,60
M 95,90 130,95 150,100
A 90,110 120,120 160,110
Em primeiro lugar, é fácil ver que não há estratégias dominadas para nenhum
dos jogadores. O resultado do jogo depende do que cada jogador acredita que o outro
13
irá fazer, do que cada jogador acredita que o outro acredite que ele irá fazer e assim
por diante.
Se o jogador 1 acredita que o 2 acredite que ele jogará A, então 1 deduz que 2
jogará M. Mas nesse caso, 1 deveria jogar M, o que significa que a sua expectativa
não é consistente. O mesmo vale para o caso onde 1 acredita que 2 acredite que ele
jogará M. A única crença consistente para o jogador 1 é a de que o jogador 2 acredite
que ele jogará B. O mesmo raciocínio nos leva a concluir que a única crença
consistente para o jogador 2 é a de que o jogador 1 acredite que ele jogará B.
Portanto, o par de estratégias (B,B) é o único que é a melhor resposta para
cada jogador dadas as suas “expectativas racionais” quanto ao comportamento do
outro jogador. Esse par de estratégias é mutuamente consistente.
Basicamente, a conclusão a que chegamos a partir da discussão do conceito de
equilíbrio de Nash é de que ele é uma condição necessária para uma forma óbvia de
jogar o jogo, se essa forma óbvia existir.
Exemplos:
Considere os jogos
t1 t2
s1 10,10 0,0
s2 0,0 1,1
(a)
t1 t2 t3 t4
s1 0,0 0,0 100,100 0,0
s2 0,0 0,0 0,0 99,99
s3 100,100 0,0 0,0 0,0
s4 0,0 100,100 0,0 0,0
(b)
Podemos dizer que no jogo (a) há uma maneira óbvia de jogar, qual seja
( s1 , t1 ) , enquanto que no jogo (b) talvez exista esta maneira óbvia. No jogo (b), se os
jogadores não podem comunicar-se entre si, então ( s2 , t4 ) é uma combinação de
14
estratégias provável, embora não tão provável assim. Isso ocorre porque, embora esta
não seja a melhor combinação para os dois jogadores, ela é a mais segura ou clara
onde os dois cooperam. Se os jogadores podem comunicar-se entre si antes do jogo,
então parece claro que um dos resultados ( s1 , t3 ) , ( s3 , t1 ) ou ( s4 , t2 ) deverá ocorrer.
É também importante enfatizar que nem todo jogo apresenta uma maneira
óbvia de jogar, como é o caso do jogo abaixo se os dois jogadores não têm como
comunicar-se entre si.
t1 t2
s1 0,0 90,91
s2 90,91 0,0
(c)
t1 t2 t3 t4
s1 200,6 3,5 4,3 0,-1000
s2 0,-10000 5,-1000 6,3 3,20
(d)
por causa dos payoffs altamente negativos possíveis para outras estratégias, o jogador
2 só jogaria algo diferente de t3 se tivesse bastante certeza do comportamento do
experimentais, embora não possa ser considerada uma maneira óbvia de jogar. No
entanto, em nenhum dos equilíbrios de Nash ( ( s1 , t1 ) e ( s2 , t4 ) e um equilíbrio em
15
Portanto, o equilíbrio de Nash não deveria influenciar a escolha do resultado
provável do jogo quando não há uma maneira óbvia de jogá-lo.
é a porcentagem dos votos que ele recebe, dadas as estratégias escolhidas por ele e
pelo seu oponente. Portanto:
⎧ a1 + a2
⎪ 2 , se a1 < a2
⎪
u1 ( a1 , a2 ) = ⎨0.5, se a1 = a2
⎪ a +a
⎪1 − 1 2 , se a1 > a2
⎩ 2
e
⎧ a1 + a2
⎪1 − 2 , se a1 < a2
⎪
u2 ( a1 , a2 ) = ⎨0.5, se a1 = a2
⎪a + a
⎪ 1 2 , se a1 > a2
⎩ 2
figura abaixo:
7
Este exemplo pode ser encontrado em Aliprantis and Chakrabarti, pp. 56-58.
16
a
0 a1 a1 + a2 a2 1
2
⎡ a1 + a2 ⎤
⎢⎣ 0, 2 ⎦⎥ , o que significa que a porcentagem dos eleitores que votam no candidato
a1 + a2 a +a
1é . Analogamente, u2 ( a1 , a2 ) = 1 − 1 2 .
2 2
Mostraremos agora, em três etapas, que o único equilíbrio de Nash desse jogo
⎛1 1⎞
é ⎜ , ⎟ . Seja ( s1 , s2 ) um equilíbrio de Nash. Na primeira etapa, mostraremos que
⎝2 2⎠
1
s1 = s2 . Na segunda etapa, mostraremos que s1 = s2 = . Finalmente, na terceira etapa
2
⎛1 1⎞
mostraremos que ⎜ , ⎟ é um equilíbrio de Nash.
⎝2 2⎠
Etapa 1: Suponha, por via de contradição, que s1 ≠ s2 . Suponha também, sem perda
s1 + s2
entre e s2 satisfaz u2 ( s1 , a ) > u2 ( s1 , s2 ) , como pode ser visto na figura abaixo.
2
Mas isso significa que ( s1 , s2 ) não é um equilíbrio de Nash, uma contradição.
u1 ( s1 , a ) u2 ( s1 , a )
u1 ( s1 , s2 ) u2 ( s1 , s2 )
0 s1 s1 + a s1 + s2 a s2 1
2 2
1
Etapa 2: Suponha agora, por via de contradição, que s1 = s2 ≠ . Suponha também,
2
1
sem perda de generalidade, que s1 = s2 < . Se a estratégia a do candidato 2 é tal que
2
17
s1 < a < 0.5 , então u2 ( s1 , a ) > u2 ( s1 , s2 ) = 0.5 , como pode ser visto na figura abaixo.
u2 ( s1 , a ) > 0.5 = u2 ( s1 , s2 )
0 s1 = s2 s1 + a a 0.5 1
2
⎛1 1⎞
Portanto, concluímos que o único candidato a equilíbrio de Nash é ⎜ , ⎟ . Só
⎝2 2⎠
⎛1 1⎞
falta agora mostrar que ⎜ , ⎟ é de fato um equilíbrio de Nash.
⎝2 2⎠
Etapa 3: Como pode ser visto na figura abaixo, se o candidato 2 escolher a estratégia
1 2 , então a melhor resposta do candidato 1 é escolher 1 2 , e vice-versa.
u1 ( a, 0.5 ) u1 ( a, 0.5 )
18