Teoria Dos Jogos Apostila 1

Teoria dos Jogos 1
1. Introdução
1.1. Definição
Teoria dos Jogos é o estudo de decisões interativas, no sentido de que os

possíveis resultados da interação entre os agentes dependem das escolhas de todos os
agentes envolvidos. Isso contrasta com a Teoria da Decisão, onde cada tomador de
decisão pode influenciar inequivocamente o resultado final e, consequentemente, a
sua própria utilidade ou satisfação.
Há dois princípios fundamentais em teoria dos jogos: (i) as escolhas dos agentes
são baseadas em preferências bem definidas e estáveis sobre o conjunto de possíveis
resultados das decisões individuais; e (ii) os agentes se comportam estrategicamente,
isto é, eles levam em conta a interdependência entre suas próprias escolhas e as
escolhas dos demais. Em síntese, um modelo de jogos descreve o comportamento
estratégico dos agentes, que tomam decisões baseados em objetivos bem definidos e
no seu conhecimento ou nas suas expectativas sobre o comportamento dos outros
agentes.
1.2. Histórico
Em geral aceita-se que a Teoria dos Jogos como disciplina propriamente dita
começou com a publicação de The Theory of Games and Economic Behaviour, de
von Neumann and Morgenstern 1 , in 1944, que estendeu o trabalho original de von
Neumann sobre o assunto 2 . No entanto, as idéias básicas de jogos que podem ser
encontradas naquele livro já estavam presentes em um trabalho mais antigo de Borel 3 .
Por exemplo, Borel desenvolveu o conceito fundamental de estratégia, tanto pura
quanto mista, o que foi inclusive reconhecido por von Neumann, embora não tenha
ido além do caso de jogos simétricos com dois agentes. Ele foi também o primeiro a
1
Von Neumann, John and Oskar Morgenstern (1944). The Theory of Games and Economic
Behavior, Princeton University Press, Princeton, NJ.
2 Von Neumann, J. 1928. "Zur Theories der Gesellschaftsspiele." Mathematische Annalen 100:295-
320. English translation by S. Bergmann in R. D. Luce and A. W. Tucker, eds., Contributions to the
Theory of Games IV (1959), Princeton University Press, pp. 13-42.
3 Borel, E. 1921. "La théorie du jeu et les equation intégrales à noyau symétrique gauche," Comptes
Rendus de l'Académie des Sciences 173:1304-1308. English translation by L. J. Savage in
Econometrica 21:97-100.
1
reconhecer a importância potencial de saber se o teorema do minimax era verdadeiro
para um número arbitrário n de jogadores, mas foi somente capaz de prová-lo para
n = 3 e n = 5 . Deve-se conferir a von Neumann o crédito de ter demonstrado a
validade do teorema do minimax para um n arbitrário.
Embora preocupado primordialmente com jogos de soma zero, um conceito
relativamente restritivo onde o que um jogador ganha outro deve perder, The Theory
of Games and Economic Behaviour é aclamado por ter sido o primeiro a introduzir
a idéia de que conflito é um fenômeno tratável matematicamente. Nas suas duas
primeiras edições (1944 e 1947), von Neumann e Morgenstern desenvolveram muitos
dos elementos fundamentais da teoria dos jogos: as formas extensiva e normal
conectadas pelo conceito de estratégia; o uso de teoremas do ponto fixo para provar a
existência de soluções para jogos com escolhas aleatórias; e uma derivação geral do
critério de utilidade esperada usado no estudo de decisões individuais.
A formulação do “Dilema dos Prisioneiros” por Tucker (1950) 4 e os artigos de
Nash em que foi definido e provada a existência do seu conceito de equilíbrio 5 foram
as contribuições fundamentais subseqüentes à moderna teoria dos jogos não-
cooperativos. O trabalho de Nash, em particular, pode ser considerado como uma
reformulação da teoria dos jogos como ela era conhecida até então. Tão importante
quanto a sua definição e prova da existência de equilíbrio não-cooperativo foi sua
argumentação de que esse conceito, juntamente com a forma normal introduzida por
von Neumann, fornece uma metodologia geral e completa para a análise de qualquer
jogo.
Concomitantemente, a teoria dos jogos cooperativos estava sendo desenvolvida
nos artigos seminais de Nash (1950) e Shapley (1953) sobre jogos de barganha e
Gillies (1953) e Shapley (1953) sobre o núcleo. 6
4
Tucker, Albert (1950). “A two-person dilemma,” Stanford University mimeo, May. Reprinted in
Rasmusen, Eric, ed. (2001), Readings in Games and Information, Oxford: Blackwell Publishing.
5 Nash, Jr., John F. (1950). "Equilibrium points in n-person games." Proceedings of the National
Academy of Sciences, U.S.A. 36:48-49 and Nash, Jr., John F. (1951). "Noncooperative games." Annals
of Mathematics 54:289-295.
6
Nash, Jr., John F. (1950). "The bargaining problem." Econometrica 18(2):155-162. Shapley, Lloyd
(1953) “Open questions,” in Report of an informal conference on the theory of n-person games, p.
15, Princeton Mathematics mimeo. Shapley, Lloyd (1953). “A value for n-person games,” in Kuhn,
Harold and Albert Tucker, eds. (1953), Contributions to the theory of games, volume II, Annals of
Mathematics Studies, no. 28, Princeton: Princeton University Press. Gillies, Donald (1953).
“Locations of solutions,” in Report of an informal conference on the theory of n-person games, pp.
11-12, Princeton Mathematics mimeo.
2
1.3. Jogos não-cooperativos versus jogos cooperativos
Contrariamente ao que comumente se pensa, a distinção entre jogos cooperativos

e não-cooperativos não se relaciona à presença ou ausência de conflito. Um jogo
cooperativo é aquele em que os jogadores podem fazer acordos que serão
obrigatoriamente executados, enquanto em um jogo não-cooperativo isso não ocorre.
A diferença concreta entre as duas vertentes de jogos está no enfoque da
modelagem, em particular nos conceitos de solução empregados. A teoria de jogos
cooperativos é axiomática e usa frequentemente conceitos como os de eficiência de
Pareto, justiça e equidade. A teoria não-cooperativa, por outro lado, tem um sabor
mais econômico, e usa conceitos baseados na maximização de funções de utilidade
sujeitas a restrições por parte dos jogadores. Dito de outra maneira, a teoria de jogos
cooperativos focaliza as propriedades dos resultados do jogo enquanto a de jogos não-
cooperativos focaliza as estratégias que levam a esses resultados.
1.4. Teoria dos jogos e equilíbrio competitivo
A análise teórica dos jogos incorpora a idéia de que os agentes procuram obter
informações sobre o comportamento dos outros agentes, enquanto que no equilíbrio
competitivo os agentes só estão interessados no valor de determinado parâmetro (por
ex., preço), embora esse parâmetro seja afetado pelas ações dos demais agentes.
Exemplo: Considere a situação na qual um estudante procura decidir por quanto

tempo ficará estudando em uma área da biblioteca. Isso depende do barulho dentro da
biblioteca. Em um modelo de jogos, a ação do estudante será ótima dadas as suas
expectativas quanto ao barulho gerado pelo seu comportamento e pelo de outros
estudantes. Em um modelo competitivo, os estudantes consideram o nível de barulho
como dado.
2. O jogo na forma normal
2.1. Definição
Começamos com a definição de um jogo na forma normal, que consiste em

representar um jogo diretamente em termos de estratégias e dos payoffs associados.
3
Definição: A forma normal (ou estratégica) Γ N de um jogo como I jogadores
especifica, para cada jogador I, um conjunto de estratégias Si e uma função payoff
ui ( s1 ,..., sI ) , si ∈ Si , que fornece os níveis de utilidade de von Neumann-Morgenstern
associados com o resultado (possivelmente aleatório) das estratégias bs ,..., s g .

1 I
Formalmente, Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ .
2.2. Estratégias Dominantes e Dominadas
Uma boa maneira de iniciar a discussão de estratégias dominantes e

dominadas é estudar o jogo mais famoso em Teoria dos Jogos, o “Dilema dos
Prisioneiros” (Tucker (1950)).
Exemplo: Dilema dos Prisioneiros
2
E NE
1 E 2,2 -1,3
NE 3,-1 0,0
Não se esforçar (NE) é uma estratégia estritamente dominante para cada um

dos dois prisioneiros.
Definição: Uma estratégia si ∈ Si é estritamente dominante para o jogador i no jogo

Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ se, para todo si′ ≠ si ,
ui ( si , s−i ) > ui ( si′, s−i )
para todo s− i ∈ S − i .
No caso do dilema dos prisioneiros, o resultado de ambos jogarem as suas

estratégias dominantes não é o melhor resultado que eles poderiam obter em conjunto.
Para ambos, o resultado da combinação de estratégias (E,E) é melhor do que o de
(NE,NE). O dilema dos prisioneiros é um exemplo de uma situação onde o
comportamento racional de acordo com interesses individuais não conduz a um
resultado socialmente ótimo.
4
Não é muito comum encontrar jogos onde os jogadores têm estratégias
dominantes. Outra possibilidade então é exigir que os jogadores não joguem
estratégias dominadas. Uma estratégia é dominada quando existe uma estratégia
alternativa que gera um payoff maior não importam quais sejam as estratégias jogadas
pelos demais jogadores.
Definição: Uma estratégia si ∈ Si é estritamente dominada para o jogador i no jogo
Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ se existe outra estratégia si′ ∈ Si tal que, para todo s− i ∈ S − i ,
ui ( si′, s−i ) > ui ( si , s−i )
Nesse caso, dizemos que si′ domina si estritamente. Também podemos dizer
que uma estratégia é dominante se ela domina estritamente todas as outras estratégias.
Exemplo:
2
L R
U 1, -1 -1, 1
1 M -1, 1 1, -1
D -2, 5 -3, 2
A estratégia D é estritamente dominada. Não existe estratégia dominante.
Definição: Uma estratégia si ∈ Si é fracamente dominada no jogo
Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ , se existe outra estratégia si′ ∈ Si tal que
ui ( si′, s−i ) ≥ ui ( si , s−i ) ∀s−i ∈ S−i ,
com desigualdade estrita para pelo menos um s− i . Nesse caso, dizemos que a
estratégia si′ domina fracamente a estratégia si . Uma estratégia é fracamente
dominante se ela domina fracamente todas as demais estratégias.
Exemplo:
5
L R
U 5, 1 4, 0
M 6, 0 3, 1
D 6, 4 4, 4
Observe que U e M são fracamente dominadas.
Estratégias fracamente dominadas podem ser eliminadas se o jogador

considera que há uma probabilidade positiva de que qualquer estratégia dos seus
rivais seja escolhida.
Outro exemplo, com estratégias contínuas, é apresentado a seguir.
Exemplo: Considere um leilão com I compradores em potencial em que o vendedor ou

leiloeiro tem uma unidade indivisível de um bem para vender. Os valores dados pelos
compradores ao objeto, 0 ≤ v1 ≤ v2 ≤ " ≤ vI , são de conhecimento comum. Os
compradores submetem simultaneamente propostas de preço bi ∈ [ 0, +∞ ) ao leiloeiro.
O participante que submete a proposta de maior valor vence o leilão, ficando com o
objeto, e paga por ele o valor da segunda maior proposta. Os demais participantes não
pagam nem recebem nada. Ou seja, se bi > max b j , o payoff do participante i é
j ≠i
ui = vi − max b j e os dos demais são iguais a zero. Se houver empate entre vários
j ≠i
participantes, ou seja, mais de uma proposta com o valor mais alto, o bem é alocado a
algum deles de maneira aleatória.
Queremos mostrar que a proposta vi do jogador i domina fracamente todas as
suas demais estratégias. Temos dois casos a considerar:
Caso (i): A proposta do jogador i é bi > vi .
Nesse caso, se ∃ j ≠ i tal que b j > bi , então
ui ( vi , b−i ) = 0 e ui ( bi , b−i ) = 0.
Já quando b j < bi ∀j ≠ i , o jogador i recebe o objeto e paga um valor igual à
segunda maior proposta. Se esta proposta é bk < vi , então
6
ui ( vi , b−i ) = ui ( bi , b−i ) = vi − bk . Se bk ≥ vi , então ui ( vi , b−i ) = 0 e
ui ( bi , b−i ) = vi − bk ≤ 0 .
Por fim, se b j ≤ bi ∀j ≠ i e existem n-1 jogadores com propostas iguais a bi ,
então cada um desses n jogadores recebe o bem com probabilidade 1 n . Nesse caso,
1
ui ( vi , b−i ) = 0 e ui ( bi , b− i ) = ( vi − bi ) < 0 .
n
Caso (ii): A proposta do jogador i é bi < vi .
Se b j < bi ∀j ≠ i , então ui ( vi , b−i ) = ui ( bi , b−i ) = vi − bk , onde bk é a segunda
maior proposta.
Se ∃ n − 1 jogadores com b j = bi , então
1
ui ( bi , b− i ) = ( vi − bi ) < vi − bi = ui ( vi , b−i )
n
Se ∃ k ≠ i tal que bk > vi , então ui ( vi , b−i ) = ui ( bi , b−i ) = 0 .
Finalmente, se b j ≤ vi ∀j e max b j = bk , bi < bk < vi , então ui ( bi , b−i ) = 0 e

j ≠i
ui ( vi , b−i ) = vi − bk > 0 .
A análise do caso (i) mostra que qualquer estratégia bi > vi é fracamente
dominada por vi . A do caso (ii) mostra que qualquer estratégia bi < vi é fracamente
dominada por vi .
2.3. Eliminação iterativa de estratégias dominadas
Exemplo: Dilema dos prisioneiros onde um dos prisioneiros é amigo do promotor.
NC C
NC 0,-2 -10,-1
C -1,-10 -5,-5
No jogo acima, o prisioneiro 1 é amigo do promotor.
7
A eliminação iterativa se dá da seguinte maneira:
(1) Não confessar é estritamente dominada para o jogador 2;

(2) Elimine não confessar para o jogador 2;
(3) Confessar torna-se estratégia dominante para o jogador 1.
O resultado é o mesmo do Dilema dos Prisioneiros normal.
Definição: Suponha que Si1 seja o conjunto de todas as estratégias do jogador i que
não são dominadas, Si2 , o conjunto das estratégias em Si1 que não são dominadas
quando as estratégias dos demais jogadores estão restritas aos conjuntos S 1j , e
assim por diante. Se Si∞ é a interseção dessa seqüência infinita de conjuntos de
estratégias Si1 ⊃ Si2 ⊃ Si3 ... , então uma estratégia é iterativamente dominante para o
jogador i se ela é o único elemento de Si∞ .
Definição: A coleção de estratégias iterativamente dominantes, quando elas existem,

é chamada de equilíbrio com estratégias iterativamente dominantes.
É importante observar que, para eliminar uma estratégia estritamente

dominada basta supor que cada jogador seja racional. Para fazer uma eliminação
iterativa, no entanto, é preciso supor conhecimento comum dessa racionalidade.
A eliminação iterativa de estratégias estritamente dominadas resulta no mesmo
conjunto de estratégias, independentemente da ordem de eliminação. No entanto, isso
não é verdade para a eliminação iterativa de estratégias fracamente dominadas. Isso
ocorre porque o argumento para a eliminação desse tipo de estratégia, qual seja o de
que cada jogador acredita que haja uma probabilidade positiva de que qualquer
estratégia de seus rivais possa ser escolhida, é inconsistente com a lógica de
eliminação iterativa, que assume que estratégias eliminadas são aquelas que não se
espera que ocorram.
Exemplo: No jogo abaixo, já usado em um exemplo anterior, se a primeira estratégia

eliminada for U, então a próxima será L e então M pode ser eliminada. O resultado
8
previsto é então ( D, R ) . No entanto, se M for eliminada primeiro, depois R e depois
U, o resultado previsto será ( D, L ) .
L R
U 5, 1 4, 0
M 6, 0 3, 1
D 6, 4 4, 4
2.4. Estratégias Racionalizáveis
Suponha que a estrutura do jogo e a racionalidade dos jogadores seja de

conhecimento comum (common knowledge). Temos então a seguinte definição:
Definição: Em um jogo Γ Ν = ⎡⎣Ι, {Δ ( Si )} , {ui ( ⋅)}⎤⎦ , a estratégia σ i é uma melhor
resposta, para o jogador i, às estratégias σ − i dos demais jogadores se
ui (σ i′, σ −i ) ≥ ui (σ i′, σ −i )
b g
para todo σ i′ ∈ Δ Si . A estratégia σ i nunca é uma melhor resposta se não há σ − i
que justifique a escolha de σ i .
É bastante razoável supor que um jogador nunca queira jogar uma estratégia
que nunca é uma melhor resposta. Além disso, dada a hipótese de conhecimento
comum, podemos eliminar iterativamente aquelas estratégias que nunca são uma
melhor resposta, o que nos conduz à seguinte definição:
b g
Definição: No jogo Γ Ν = ⎡⎣Ι, {Δ ( Si )} , {ui ( ⋅)}⎤⎦ , as estratégias em Δ Si que
sobrevivem à remoção iterativa de estratégias que nunca são uma melhor resposta
são conhecidas como estratégias racionalizáveis do jogador i.
O conjunto que resulta da eliminação iterativa de estratégias estritamente

dominadas contém o conjunto de estratégias racionalizáveis. A ordem de eliminação
de estratégias que nunca são uma melhor resposta não importa.
Exemplo:
9
b1 b2 b3 b4
a1 0,7 2,5 7,0 0,1
a2 5,2 3,3 5,2 0,1
a3 7,0 2,5 0,7 0,1
a4 0,0 0,-2 0,0 10,-1
Numa primeira fase, podemos eliminar b4 , que é estritamente dominada pela

1
estratégia mista que joga b1 e b3 com probabilidade cada. Depois podemos
2
eliminar a4 , que é estritamente dominada por a2 uma vez que b4 tenha sido eliminada.
Nenhuma outra estratégia pode ser eliminada:
a1 é a melhor resposta a b3
b1 é a melhor resposta a a1
l q
Sendo assim, a1 , a2 , a3 é o conjunto de estratégias racionalizáveis puras para
l q
o jogador 1, e b1 , b2 , b3 , o do jogador 2.
2.5. Equilíbrio de Nash
Definição: Um equilíbrio de Nash em estratégias puras do jogo

Γ Ν = ⎡⎣ Ι, {Δ ( Si )} , {ui ( ⋅)}⎤⎦ é uma lista s = ( s1 ,..., sI ) com a propriedade de que, para
todo i = 1,…,I, ui ( si , s−i ) ≥ ui ( si′, s−i ) para todo si′ ∈ Si .
A interpretação é que nenhum jogador pode desviar-se da estratégia de

equilíbrio, dadas as estratégias dos demais jogadores, e com isso obter um ganho. A
10
estratégia de equilíbrio de cada jogador é uma melhor resposta às estratégias jogadas
pelos demais, o que dá origem à seguinte definição alternativa do equilíbrio de Nash:
b g
Defina, para qualquer s− i ∈ S − i , Βi s− i = ⎨ si ∈ Si : ui ( si , s−i ) ≥ ui ( si′, s− i ) para
todo si′ ∈ Si ⎬. Essa é uma correspondência chamada de melhor resposta do jogador i.
Então um equilíbrio de Nash é uma lista s ∈ S tal que si ∈ Βi ( s−i ) ∀i = 1,..., I .
Exemplos: 1) Batalha dos Sexos
Futebol Shopping
Futebol 2, 1 0, 0
Shopping 0, 0 1, 2
Os jogadores querem coordenar as suas ações, mas têm interesses conflitantes.

Há dois equilíbrios de Nash, ( F , F ) e ( S , S ) .
2) Matching pennies com movimentos simultâneos
2
Ca Co
1 Ca -1,1 1,-1
Co 1,-1 -1,1
Os interesses dos jogadores são diametralmente opostos; não há equilíbrio de

Nash.
3) No exemplo usado na seção de estratégias racionalizáveis ( a2 , b2 ) é um equilíbrio
de Nash. Além disso, essa é a única combinação de estratégias puras que é um

equilíbrio de Nash, pois nas outras pelo menos um dos jogadores tem incentivos para
desviar-se.
Esse exemplo ilustra o fato de toda estratégia que faz parte de um equilíbrio de
Nash é racionalizável, pois pode ser justificada pelas estratégias de equilíbrio (de
Nash) dos demais jogadores.
11
Discussão do Conceito de Equilíbrio de Nash
Antes de adotarmos o conceito de equilíbrio de Nash, precisamos perguntar se

de fato é razoável supor que os jogadores fazem conjecturas corretas sobre como os
demais jogadores irão jogar.
Alguns argumentos para justificar essa adoção são os seguintes:
1) O equilíbrio de Nash é uma conseqüência da inferência racional dos jogadores.

Esse argumento sugere que a racionalidade dos agentes implica que eles serão
capazes de prever corretamente as ações dos outros jogadores. No entanto, a hipótese
de conhecimento comum da racionalidade dos jogadores só permite concluir que cada
jogador deve jogar uma estratégia racionalizável.
2) Se há um único resultado previsto para o jogo, esse resultado é um equilíbrio de

Nash. Isso ocorre porque os jogadores, sendo racionais, percebem que aquele é o
resultado previsto e, portanto, não querem desviar-se dele, o que caracteriza o
equilíbrio de Nash.
3) Pontos focais:
Considere o jogo chamado de encontro em Nova York:
Empire State Grand Central

Empire State 100, 100 0, 0
Grand Central 0, 0 100, 100
Há dois equilíbrios de Nash nesse jogo. No entanto, fatores culturais podem

tornar um desses equilíbrios um ponto focal. Por exemplo, dois visitantes podem
preferir encontrar-se no Empire State, enquanto que dois moradores da cidade podem
preferir a estação central de trem Grand Central.
Outra possibilidade é que pelo fato de que os restaurantes na área do Grand
Central serem muito melhores do que aqueles próximos ao Empire State, os payoffs
do jogo sejam:
12
ES GC
ES 100, 100 0, 0
GC 0, 0 1000, 1000
Nesse caso, (GC; GC) é o ponto focal.

Esse argumento de ponto focal procura explicar porque pode existir uma
maneira óbvia (ou prevista) de jogar o jogo, em cujo caso o item 2 acima se aplica.
4) O Equilíbrio de Nash como um contrato auto sustentável.

Essa justificativa supõe que os jogadores podem comunicar-se entre si antes
do jogo e concordar em jogar uma determinada combinação de estratégias. Para que
esse acordo tenha sucesso, é necessário que ele seja auto sustentável, ou seja,
represente um equilíbrio de Nash. No entanto, mesmo que os jogadores tenham a
priori concordado em seguir as estratégias de um equilíbrio de Nash, isso não garante
que eles o cumprirão se esperarem que outros não o cumpram. Portanto, essa
explicação sustenta que o contrato torna-se um ponto focal.
5) O Equilíbrio de Nash como uma convenção social estável

Quando o jogo é jogado repetidamente e uma determinada convenção social se
impõe, uma determinada forma de jogar o jogo pode surgir, tornando-se o seu ponto
focal.
Exemplo: Andar do lado direito da rua.
Exemplo: Considere o jogo na forma normal
B M A
B 100,75 120,70 140,60
M 95,90 130,95 150,100
A 90,110 120,120 160,110
Em primeiro lugar, é fácil ver que não há estratégias dominadas para nenhum
dos jogadores. O resultado do jogo depende do que cada jogador acredita que o outro
13
irá fazer, do que cada jogador acredita que o outro acredite que ele irá fazer e assim
por diante.
Se o jogador 1 acredita que o 2 acredite que ele jogará A, então 1 deduz que 2
jogará M. Mas nesse caso, 1 deveria jogar M, o que significa que a sua expectativa
não é consistente. O mesmo vale para o caso onde 1 acredita que 2 acredite que ele
jogará M. A única crença consistente para o jogador 1 é a de que o jogador 2 acredite
que ele jogará B. O mesmo raciocínio nos leva a concluir que a única crença
consistente para o jogador 2 é a de que o jogador 1 acredite que ele jogará B.
Portanto, o par de estratégias (B,B) é o único que é a melhor resposta para
cada jogador dadas as suas “expectativas racionais” quanto ao comportamento do
outro jogador. Esse par de estratégias é mutuamente consistente.
Basicamente, a conclusão a que chegamos a partir da discussão do conceito de
equilíbrio de Nash é de que ele é uma condição necessária para uma forma óbvia de
jogar o jogo, se essa forma óbvia existir.
Exemplos:
Considere os jogos
t1 t2
s1 10,10 0,0
s2 0,0 1,1
(a)
t1 t2 t3 t4
s1 0,0 0,0 100,100 0,0
s2 0,0 0,0 0,0 99,99
s3 100,100 0,0 0,0 0,0
s4 0,0 100,100 0,0 0,0
(b)
Podemos dizer que no jogo (a) há uma maneira óbvia de jogar, qual seja
( s1 , t1 ) , enquanto que no jogo (b) talvez exista esta maneira óbvia. No jogo (b), se os
jogadores não podem comunicar-se entre si, então ( s2 , t4 ) é uma combinação de
14
estratégias provável, embora não tão provável assim. Isso ocorre porque, embora esta
não seja a melhor combinação para os dois jogadores, ela é a mais segura ou clara
onde os dois cooperam. Se os jogadores podem comunicar-se entre si antes do jogo,
então parece claro que um dos resultados ( s1 , t3 ) , ( s3 , t1 ) ou ( s4 , t2 ) deverá ocorrer.
Nesses dois exemplos, as maneiras óbvias de jogar o jogo são de fato

equilíbrios de Nash. No entanto, é importante perceber que ser um equilíbrio de Nash
não é suficiente para que uma combinação de estratégias seja uma maneira óbvia de
jogar o jogo. Por exemplo, no jogo (a), ( s2 , t2 ) é outro equilíbrio de Nash.
É também importante enfatizar que nem todo jogo apresenta uma maneira
óbvia de jogar, como é o caso do jogo abaixo se os dois jogadores não têm como
comunicar-se entre si.
t1 t2
s1 0,0 90,91
s2 90,91 0,0
(c)
No jogo acima, no entanto, ( s2 , t1 ) e ( s1 , t2 ) são equilíbrios de Nash.
Finalmente, é importante observar que, quando o jogo não admite uma

maneira óbvia de jogar, o equilíbrio de Nash pode não ser o resultado mais razoável,
isto é, aquele que os indivíduos de fato jogariam. No jogo abaixo,
t1 t2 t3 t4
s1 200,6 3,5 4,3 0,-1000
s2 0,-10000 5,-1000 6,3 3,20
(d)
por causa dos payoffs altamente negativos possíveis para outras estratégias, o jogador
2 só jogaria algo diferente de t3 se tivesse bastante certeza do comportamento do
jogador 1. Dado isso, ( s2 , t3 ) é um resultado bastante freqüente em jogos
experimentais, embora não possa ser considerada uma maneira óbvia de jogar. No
entanto, em nenhum dos equilíbrios de Nash ( ( s1 , t1 ) e ( s2 , t4 ) e um equilíbrio em
estratégias mistas), o jogador 2 joga t3 .
15
Portanto, o equilíbrio de Nash não deveria influenciar a escolha do resultado
provável do jogo quando não há uma maneira óbvia de jogá-lo.
2.6. Aplicação do conceito de equilíbrio de Nash à Ciência Política
O exemplo aqui apresentado analisa a natureza das plataformas eleitorais e é

conhecido como o “Modelo do Eleitor Mediano. 7 ”
Considere um eleitorado distribuído uniformemente sobre o espectro
ideológico da esquerda, a = 0 , para a direita, a = 1 . Há dois candidatos, 1 e 2, e o
candidato com o maior número de votos vence. Cada eleitor vota no candidato mais
próximo da sua posição ideológica. Os candidatos sabem disso e têm como único
objetivo vencer a eleição. No caso de empate, o vencedor sai de uma loteria em que
cada candidato tem uma chance de 50% de vencer.
Esse problema pode ser modelado como um jogo com dois jogadores, os dois
candidatos, cujas estratégias são suas escolhas de posições no espectro ideológico. Ou
seja, as estratégias do jogador i são dadas por ai ∈ [ 0,1] . A função payoff do jogador i
é a porcentagem dos votos que ele recebe, dadas as estratégias escolhidas por ele e
pelo seu oponente. Portanto:
⎧ a1 + a2
⎪ 2 , se a1 < a2
⎪
u1 ( a1 , a2 ) = ⎨0.5, se a1 = a2
⎪ a +a
⎪1 − 1 2 , se a1 > a2
⎩ 2
e
⎧ a1 + a2
⎪1 − 2 , se a1 < a2
⎪
u2 ( a1 , a2 ) = ⎨0.5, se a1 = a2
⎪a + a
⎪ 1 2 , se a1 > a2
⎩ 2
Para entender melhor essas funções, considere o caso a1 < a2 , apresentado na
figura abaixo:
7
Este exemplo pode ser encontrado em Aliprantis and Chakrabarti, pp. 56-58.
16
a
0 a1 a1 + a2 a2 1
2
As ideologias mais próximas de a1 do que de a2 estão no intervalo
⎡ a1 + a2 ⎤
⎢⎣ 0, 2 ⎦⎥ , o que significa que a porcentagem dos eleitores que votam no candidato
a1 + a2 a +a
1é . Analogamente, u2 ( a1 , a2 ) = 1 − 1 2 .
2 2
Mostraremos agora, em três etapas, que o único equilíbrio de Nash desse jogo
⎛1 1⎞
é ⎜ , ⎟ . Seja ( s1 , s2 ) um equilíbrio de Nash. Na primeira etapa, mostraremos que
⎝2 2⎠
1
s1 = s2 . Na segunda etapa, mostraremos que s1 = s2 = . Finalmente, na terceira etapa
2
⎛1 1⎞
mostraremos que ⎜ , ⎟ é um equilíbrio de Nash.
⎝2 2⎠
Etapa 1: Suponha, por via de contradição, que s1 ≠ s2 . Suponha também, sem perda
de generalidade, que s1 < s2 . Nesse caso, qualquer estratégia a para o candidato 2
s1 + s2
entre e s2 satisfaz u2 ( s1 , a ) > u2 ( s1 , s2 ) , como pode ser visto na figura abaixo.
2
Mas isso significa que ( s1 , s2 ) não é um equilíbrio de Nash, uma contradição.
u1 ( s1 , a ) u2 ( s1 , a )
u1 ( s1 , s2 ) u2 ( s1 , s2 )
0 s1 s1 + a s1 + s2 a s2 1
2 2
1
Etapa 2: Suponha agora, por via de contradição, que s1 = s2 ≠ . Suponha também,
2
1
sem perda de generalidade, que s1 = s2 < . Se a estratégia a do candidato 2 é tal que
2
17
s1 < a < 0.5 , então u2 ( s1 , a ) > u2 ( s1 , s2 ) = 0.5 , como pode ser visto na figura abaixo.
Isso contradiz o fato de que ( s1 , s2 ) é um equilíbrio de Nash.
u2 ( s1 , a ) > 0.5 = u2 ( s1 , s2 )
0 s1 = s2 s1 + a a 0.5 1
2
⎛1 1⎞
Portanto, concluímos que o único candidato a equilíbrio de Nash é ⎜ , ⎟ . Só
⎝2 2⎠
⎛1 1⎞
falta agora mostrar que ⎜ , ⎟ é de fato um equilíbrio de Nash.
⎝2 2⎠
Etapa 3: Como pode ser visto na figura abaixo, se o candidato 2 escolher a estratégia
1 2 , então a melhor resposta do candidato 1 é escolher 1 2 , e vice-versa.
u1 ( a, 0.5 ) u1 ( a, 0.5 )
0 a a + 0.5 0.5 a + 0.5 a 1

2 2
Nossa conclusão é de que cada candidato procura atrair o eleitor mediano,

aquele que localiza-se exatamente no centro da distribuição do espectro ideológico.
18

Teoria Dos Jogos Apostila 1

Enviado por

Direitos autorais:

Formatos disponíveis

Teoria Dos Jogos Apostila 1

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Dos Jogos Apostila 1

Enviado por

Direitos autorais:

Formatos disponíveis

Teoria dos Jogos 1

Teoria dos Jogos é o estudo de decisões interativas, no sentido de que os

Contrariamente ao que comumente se pensa, a distinção entre jogos cooperativos

1.4. Teoria dos jogos e equilíbrio competitivo

Exemplo: Considere a situação na qual um estudante procura decidir por quanto

2. O jogo na forma normal

Começamos com a definição de um jogo na forma normal, que consiste em

ui ( s1 ,..., sI ) , si ∈ Si , que fornece os níveis de utilidade de von Neumann-Morgenstern

associados com o resultado (possivelmente aleatório) das estratégias bs ,..., s g .

Formalmente, Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ .

2.2. Estratégias Dominantes e Dominadas

Uma boa maneira de iniciar a discussão de estratégias dominantes e

Exemplo: Dilema dos Prisioneiros

Não se esforçar (NE) é uma estratégia estritamente dominante para cada um

Definição: Uma estratégia si ∈ Si é estritamente dominante para o jogador i no jogo

No caso do dilema dos prisioneiros, o resultado de ambos jogarem as suas

Definição: Uma estratégia si ∈ Si é estritamente dominada para o jogador i no jogo

ui ( si′, s−i ) > ui ( si , s−i )

A estratégia D é estritamente dominada. Não existe estratégia dominante.

Definição: Uma estratégia si ∈ Si é fracamente dominada no jogo

Γ N = ⎡⎣ I , {Si } , {ui ( ⋅)}⎤⎦ , se existe outra estratégia si′ ∈ Si tal que

ui ( si′, s−i ) ≥ ui ( si , s−i ) ∀s−i ∈ S−i ,

Observe que U e M são fracamente dominadas.

Estratégias fracamente dominadas podem ser eliminadas se o jogador

Exemplo: Considere um leilão com I compradores em potencial em que o vendedor ou

compradores submetem simultaneamente propostas de preço bi ∈ [ 0, +∞ ) ao leiloeiro.

Caso (i): A proposta do jogador i é bi > vi .

Nesse caso, se ∃ j ≠ i tal que b j > bi , então

Já quando b j < bi ∀j ≠ i , o jogador i recebe o objeto e paga um valor igual à

segunda maior proposta. Se esta proposta é bk < vi , então

Por fim, se b j ≤ bi ∀j ≠ i e existem n-1 jogadores com propostas iguais a bi ,

Caso (ii): A proposta do jogador i é bi < vi .

Se b j < bi ∀j ≠ i , então ui ( vi , b−i ) = ui ( bi , b−i ) = vi − bk , onde bk é a segunda

Se ∃ k ≠ i tal que bk > vi , então ui ( vi , b−i ) = ui ( bi , b−i ) = 0 .

Finalmente, se b j ≤ vi ∀j e max b j = bk , bi < bk < vi , então ui ( bi , b−i ) = 0 e

A análise do caso (i) mostra que qualquer estratégia bi > vi é fracamente

2.3. Eliminação iterativa de estratégias dominadas

Exemplo: Dilema dos prisioneiros onde um dos prisioneiros é amigo do promotor.

No jogo acima, o prisioneiro 1 é amigo do promotor.

(1) Não confessar é estritamente dominada para o jogador 2;

O resultado é o mesmo do Dilema dos Prisioneiros normal.

quando as estratégias dos demais jogadores estão restritas aos conjuntos S 1j , e

assim por diante. Se Si∞ é a interseção dessa seqüência infinita de conjuntos de

jogador i se ela é o único elemento de Si∞ .

Definição: A coleção de estratégias iterativamente dominantes, quando elas existem,

É importante observar que, para eliminar uma estratégia estritamente

Exemplo: No jogo abaixo, já usado em um exemplo anterior, se a primeira estratégia

U, o resultado previsto será ( D, L ) .

2.4. Estratégias Racionalizáveis

Suponha que a estrutura do jogo e a racionalidade dos jogadores seja de

Definição: Em um jogo Γ Ν = ⎡⎣Ι, {Δ ( Si )} , {ui ( ⋅)}⎤⎦ , a estratégia σ i é uma melhor

resposta, para o jogador i, às estratégias σ − i dos demais jogadores se

que justifique a escolha de σ i .

O conjunto que resulta da eliminação iterativa de estratégias estritamente

Numa primeira fase, podemos eliminar b4 , que é estritamente dominada pela

Nenhuma outra estratégia pode ser eliminada:

2.5. Equilíbrio de Nash

Definição: Um equilíbrio de Nash em estratégias puras do jogo