Equilibrio di Nash: differenze tra le versioni
Elimino doppie spaziature |
|||
(30 versioni intermedie di 18 utenti non mostrate) | |||
Riga 1: | Riga 1: | ||
{{F|matematica|marzo 2008}} |
{{F|matematica|marzo 2008}} |
||
In [[teoria dei giochi]] si definisce '''equilibrio di |
In [[teoria dei giochi]] si definisce '''equilibrio di Nash''' un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse ad essere l'unico a cambiare. Prende il nome dal matematico statunitense [[John Nash]]. |
||
⚫ | |||
Per cambiare occorre agire insieme.<ref>{{cita web|url=http://espresso.repubblica.it/visioni/cultura/2008/03/11/news/john-nash-genio-e-follia-1.7633|titolo=John Nash genio e follia|autore=Piergiorgio Odifreddi|editore=''la Repubblica''. ''Espresso''. Cultura.|data=11 marzo 2008}}</ref> |
|||
|[[John Nash]]}} |
|||
⚫ | {{Citazione|Un gioco può essere descritto in termini di strategie |
||
}} |
|||
== Nascita del teorema di Nash == |
== Nascita del teorema di Nash == |
||
La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa della [[teoria dei giochi]] per quel che riguarda i "[[Teoria dei giochi#Giochi non cooperativi|giochi non cooperativi]]", appare in un brevissimo articolo apparso nel [[1950]] dove [[John Nash]], allora dottorando a [[Princeton]], spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani<ref>Si noti che questa connessione era comunque già presente qui: John von Neumann: ''Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes'', Ergebnisse eines Math. Kolloquiums (curatore: [[Karl Menger]]), '''8''', 73-83, 1937. Traduzione inglese: ''A model of general economic equilibrium'', Review of Economic Studies, '''13''', 1-9, 1945-1946.</ref>: quella di un [[punto fisso]] in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo [[payoff]], sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso). |
La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa della [[teoria dei giochi]] per quel che riguarda i "[[Teoria dei giochi#Giochi non cooperativi|giochi non cooperativi]]", appare in un brevissimo articolo apparso nel [[1950]] dove [[John Nash]], allora dottorando a [[Princeton]], spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani<ref>Si noti che questa connessione era comunque già presente qui: John von Neumann: ''Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes'', Ergebnisse eines Math. Kolloquiums (curatore: [[Karl Menger]]), '''8''', 73-83, 1937. Traduzione inglese: ''A model of general economic equilibrium'', Review of Economic Studies, '''13''', 1-9, 1945-1946.</ref>: quella di un [[punto fisso]] in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo [[payoff]], sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso). |
||
Riga 9: | Riga 11: | ||
Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei "[[Gioco a somma zero|giochi a somma zero]]" studiati in precedenza da [[John von Neumann]]. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea di [[minimax]]. |
Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei "[[Gioco a somma zero|giochi a somma zero]]" studiati in precedenza da [[John von Neumann]]. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea di [[minimax]]. |
||
== L'equilibrio di Nash |
== L'equilibrio di Nash == |
||
Vediamo ora più nel dettaglio cosa si intende esattamente per ''equilibrio di Nash''. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della [[teoria dei giochi]] e definire alcuni concetti basilari. |
Vediamo ora più nel dettaglio cosa si intende esattamente per ''equilibrio di Nash''. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della [[teoria dei giochi]] e definire alcuni concetti basilari. |
||
Un gioco è caratterizzato da: |
Un gioco è caratterizzato da: |
||
* Un insieme |
* Un insieme di giocatori, o agenti, in numero di N, che indicheremo con <math>i=1,\ldots,N;</math> |
||
* Per ogni agente, un vettore |
|||
* Un insieme '''''S''''' di ''strategie'', costituito da un insieme di M vettori |
|||
⚫ | |||
⚫ | |||
⚫ | |||
* Un insieme '''''U''''' di funzioni |
|||
⚫ | |||
⚫ | |||
⚫ | |||
* Per ogni agente, una funzione |
|||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
tale che |
tale che |
||
:<math>U_i\left(s_1^e, s_2^e, |
:<math>U_i\left(s_1^e, s_2^e,\ldots,s_i^e,\ldots,s_N^e\right)\ge U_i\left(s_1^e, s_2^e,\ldots,s_i,\ldots,s_N^e\right)</math> |
||
per ogni |
per ogni <math>i</math> e per ogni strategia <math>s_i</math> scelta dal giocatore <math>i</math>-esimo. |
||
Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia <math>s_i^e</math> dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia <math>s_j^e</math>. Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore |
Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia <math>s_i^e</math> dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia <math>s_j^e</math>. Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore <math>i</math> gioca una qualunque strategia a sua disposizione diversa da <math>s_i^e</math>, mentre tutti gli altri hanno giocato la propria strategia <math>s_j^e</math>, può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia. |
||
Il contributo più importante dato da [[John Nash]] alla [[teoria dei giochi]] è la dimostrazione matematica dell'esistenza di questo |
Il contributo più importante dato da [[John Nash]] alla [[teoria dei giochi]] è la [[dimostrazione matematica]] dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash, eventualmente in strategie miste. Per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista per un dato giocatore si intende una distribuzione di [[probabilità]] sulle strategie a disposizione del suddetto giocatore. |
||
=== Teorema === |
|||
Sia <math>G=(S_i,U_i)</math> un gioco non cooperativo ad <math>N</math> giocatori. Si supponga che valgano le seguenti: |
|||
* <math>S_i \in \mathbb{R}^{n_i}</math> sono sottoinsiemi [[Insieme convesso|convessi]], [[Spazio compatto|compatti]] e non vuoti di <math>\mathbb{R}^{n_i}</math>, per ogni <math>i=1,\ldots,N</math>; |
|||
* <math>U_i\colon S:=S_1 \times \dots \times S_N \rightarrow \mathbb{R}</math> sono [[Funzione continua|funzioni continue]], per ogni <math>i=1, \dots ,N</math>; |
|||
* <math>U_i\colon S_i \rightarrow \mathbb{R}</math>, tale che <math>s_i \mapsto U_i(s_i,S_{-i})</math>, dove <math>S_{-i}</math> indica la stringa di lunghezza <math>N-1</math> in cui è stata eliminata la componente <math>i</math>-esima, sia quasi concava, per ogni <math>i=1,\ldots,N</math>. In altre parole, la funzione utilità, ristretta ad una strategia, una volta fissate le altre, sia quasi concava. |
|||
Allora il gioco ammette almeno un equilibrio di Nash. |
|||
=== Dimostrazione === |
|||
Innanzitutto, consideriamo la funzione miglior risposta (best replay) del giocatore <math>i</math>-esimo <math>B_i\colon S_{-i} \rightarrow \mathcal{P}(S_i)</math>, definita come |
|||
:<math>B_i (s_{-i}) = \{ \bar{s_i} \in S_i : U_i (s_{-i},\bar{s_i}) \ge U_i (s_{-i},s_i),\forall s_i \in S_i \}.</math> |
|||
Si noti che |
|||
:<math>B_i (s_{-i}) = \biggl\{ \bar{s_i} \in S_i : U_i (s_{-i},\bar{s_i}) \ge \max_{s_i \in S_i} \{ U_i (s_{-i},s_i) \} \biggl\}.</math> |
|||
Data la funzione miglior risposta del gioco <math>B\colon S \rightarrow \mathcal{P}(S_1) \times \dots \times \mathcal{P}(S_N) \subseteq \mathcal{P}(S)</math>, definita come <math>B(s) = (B_1(s_{-1},\ldots,B_N(s_{-N}))</math>, si ha che <math>s^e</math> è un equilibrio di Nash se e solo se <math>s^e</math> è un punto fisso della funzione miglior risposta del gioco, cioè <math>s^e \in B(s^e)</math>. |
|||
Quindi, se verifichiamo che la funzione miglior risposta del gioco, <math>B</math>, soddisfa le ipotesi del [[teorema di Kakutani]], avremo la tesi. |
|||
* Banalmente si ha che <math>S = S_1 \times \dots \times S_N</math> è non vuoto, convesso e compatto, in quanto [[prodotto cartesiano]] di sottoinsiemi non vuoti, convessi e compatti di <math>\mathbb{R}^n</math>. |
|||
* Essendo <math>S_i</math> compatto e <math>U_i</math> continua, per ogni <math>i=1, \dots ,N</math>, allora esiste almeno un massimo in <math>S_i</math>, ed inoltre, <math>B(s_1, \dots s_N) \ne \varnothing</math>. |
|||
* <math>B_i(s_{-i}) \subseteq S_i</math> è compatto, per ogni <math>i=1,\ldots,N</math>. Infatti, essendo sottoinsiemi chiusi di un compatto, sono compatti. Consideriamo una successione <math>\{ s_i^n \}_{n \in \mathbb{N}}</math>, in <math>B_i(s_{-i})</math>, convergente a <math>s_i</math>, allora <math>s_i \in B_i(s_{-i})</math>. Per definizione, si ha che |
|||
::<math>s_i^n \in B_i(s_{-i}) \iff U_i(s_i^n,s_{-i}) \ge U_i(\bar{s_i},s_{-i}),\quad\forall \bar{s_i} \in S_i.</math> |
|||
:Dal fatto che le funzioni utilità sono continue e la successione converge a <math>s_i</math>, allora |
|||
::<math>U_i(s_i^n,s_{-i}) \rightarrow U_i(s_i,s_{-i}),\quad \text{per } n \rightarrow +\infty.</math> |
|||
:Dunque, per il [[teorema della permanenza del segno]], segue che |
|||
::<math>U_i(s_i,s_{-i}) \ge U_i(\bar{s_i},s_{-i}),\quad \forall \bar{s_i} \in S_i.</math> |
|||
:Questo significa che <math>s_i \in B_i(s_{-i}) </math>. |
|||
* <math>B_i(s_{-i}) \subseteq S_i</math> è convesso, per ogni <math>i=1,\ldots,N</math>. Infatti, consideriamo l'insieme |
|||
::<math>C(\bar{s_i}):= \{ s_i \in S_i : U_i(s_i,s_{-i}) \ge U_i(\bar{s_i},s_{-i}) \},\quad\forall \bar{s_i} \in S_i.</math> |
|||
:Dal fatto che le funzioni utilità sono quasi concave, ossia il loro sottografico intersecato con iperpiani genera insiemi convessi, segue che l'insieme <math>C(\bar{s_i})</math> è convesso <math>\forall \bar{s_i} \in S_i</math>. Osserviamo che |
|||
::<math>B_i(s_{-i}) = \bigcap_{i=1}^N C(\bar{s_i})</math>, <math>\forall \bar{s_i} \in S_i.</math> |
|||
:Essendo <math>C(\bar{s_i})</math> convesso <math>\forall \bar{s_i} \in S_i</math>, allora la loro intersezione è ancora un insieme convesso, quindi <math>B_i(s_{-i})</math> è convesso. |
|||
* La funzione miglior risposta del giocatore <math>i</math>-esimo ha grafico chiuso. Consideriamo le successioni <math>\{ s_i^n \}_{n \in \mathbb{N}},\{ s_{-i}^n \}_{n \in \mathbb{N}}</math>, in <math>B_i(s_{-i})</math>, convergenti rispettivamente ad <math>s_i^0,s_{-i}^0 </math>, se, inoltre, <math>s_{-i}^n \in B_{-i,n}</math>, allora <math>s_{-i}^0 \in B_{-i,0} </math>, ossia la funzione miglior risposta del giocatore <math>i</math>-esimo ha grafico chiuso. Si supponga per assurdo che <math>s_{-i}^0 \not\in B_{-i,0}</math>. Allora esisterà un certo <math>\bar{s}_{-i}</math> tale che <math>U_i(s_i^0,s_{-i}^0) < U_i(s_i^0,\bar{s}_{-i})</math>. Sia <math>\epsilon:= U_i(s_i^0,\bar{s}_{-i}) - U_i(s_i^0,s_{-i}^0) > 0</math>. Equivalentemente si ha che |
|||
::<math>\epsilon = \big( U_i(s_i^0,\bar{s}_{-i})-U_i(s_i^n,\bar{s}_{-i}) \big) + \big( U_i(s_i^n,\bar{s}_{-i})-U_i(s_i^n,\bar{s}_{-i}^n) \big) + \big( U_i(s_i^n,\bar{s}_{-i}^n)-U_i(s_i^0,\bar{s}_{-i}^0) \big).</math> |
|||
:Dal fatto che le successioni sono convergenti e le funzioni utilità sono continue, ed inoltre, <math>s_{-i}^n \in B_{-i,n}</math>, segue che |
|||
::<math>U_i(s_i^n,\bar{s}_{-i}) \rightarrow U_i(s_i^0,\bar{s}_{-i}), \quad U_i(s_i^n,\bar{s}_{-i}^n) \rightarrow U_i(s_i^0,\bar{s}_{-i}^0),\quad\text{e}\quad U_i(s_i^n,s_{-i}^n) \ge U_i(s_i^n,\bar{s}_{-i}).</math> |
|||
:Per <math>n \rightarrow +\infty</math>, si ha che <math>\epsilon \le \frac{1}{3}\epsilon + 0 + \frac{1}{3} \epsilon = \frac{2}{3}\epsilon</math>. Assurdo. |
|||
== Equilibrio di Nash e ottimo di Pareto == |
== Equilibrio di Nash e ottimo di Pareto == |
||
Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di |
Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresenta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per sé, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il [[Giocatore singolo|singolo giocatore]] non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. È noto infatti che l'equilibrio di Nash può non essere un ottimo di [[Vilfredo Pareto|Pareto]] (o [[ottimo paretiano]]), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso del [[dilemma del prigioniero]], ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice <math>o,</math> tale che |
||
:<math>U_i\left(s_1^o, s_2^o, |
:<math>U_i\left(s_1^o, s_2^o,\ldots,s_i^o,\ldots,s_N^o\right)> U_i\left(s_1^e, s_2^e,\ldots,s_i^e,\ldots,s_N^e\right)</math> |
||
per ogni |
per ogni <math>i</math>, ma che questa tale combinazione non sia un equilibrio, come accade nel [[dilemma del prigioniero]], o, in altre parole, che <math>s_i^o</math> non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia <math>s_i^e</math> diversa da <math>s_i^o</math> che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una <math>s_i^e</math> tale che |
||
:<math>U_i\left(s_1^o, s_2^o, |
:<math>U_i\left(s_1^o, s_2^o,\ldots,s_i^e,\ldots,s_N^o\right)> U_i\left(s_1^o, s_2^o,\ldots,s_i^o,\ldots,s_N^o\right).</math> |
||
Conseguentemente, per l'assioma di razionalità, sarà portato a preferire una strategia diversa da <math>s_i^o</math>. Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia <math>s_i^o</math>, dipende, come sempre, dal fatto che |
Conseguentemente, per l'assioma di [[razionalità]], sarà portato a preferire una strategia diversa da <math>s_i^o</math>. Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia <math>s_i^o</math>, dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiché in generale il guadagno di <math>i</math> dipende dalle scelte di tutti i giocatori; non essendo <math>s_i^o</math> una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare <math>s_i^o</math>, gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia ottimale. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile. |
||
Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi <math>s_i^o</math> coincide con <math>s_i^e</math> e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una |
Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi <math>s_i^o</math> coincide con <math>s_i^e</math> e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per sé, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per sé (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiché tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) ed una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare. |
||
== Esempio: il "dilemma del prigioniero" == |
== Esempio: il "dilemma del prigioniero" == |
||
{{vedi anche|dilemma del prigioniero}} |
{{vedi anche|dilemma del prigioniero}} |
||
Il |
Il [[dilemma del prigioniero]] fornisce un valido spunto per confrontare i due concetti di equilibrio di Nash e ottimo di Pareto, e per comprenderne l'applicazione in [[economia]]. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero. Le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare. |
||
* Se entrambi non parlano avranno una pena leggera (1 anno) |
* Se entrambi non parlano avranno una pena leggera (1 anno). |
||
* Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni) |
* Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni). |
||
* Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi. |
* Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi. |
||
Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di [[John Nash|Nash]] è di parlare, per entrambi. |
Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di [[John Nash|Nash]] è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica). |
||
Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica). |
|||
Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi pay-off (2x2) che sono (indicheremo per brevità |
Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi ''pay-off'' (2x2) che sono (indicheremo per brevità confessa con <math>c</math> e non confessa con <math>n</math> e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi): |
||
* Strategie: <math>S_i=\left(c, n\right)</math> |
* Strategie: <math>S_i=\left(c, n\right).</math> |
||
* Pay-off: |
* ''Pay-off'': |
||
:<math>u_i\left(c, c\right)=-6</math> |
:<math>u_i\left(c, c\right)=-6;</math> |
||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
:<math>u_i\left(c, c\right)\ge u_i\left(n, c\right)</math> |
:<math>u_i\left(c, c\right)\ge u_i\left(n, c\right)</math> |
||
Riga 80: | Riga 136: | ||
e |
e |
||
:<math>u_i\left(c, n\right)\ge u_i\left(n, n\right)</math> |
:<math>u_i\left(c, n\right)\ge u_i\left(n, n\right).</math> |
||
Quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. È immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori |
|||
:<math>u_i\left(c, c\right)\ge u_i\left(n, c\right)</math> |
:<math>u_i\left(c, c\right)\ge u_i\left(n, c\right)</math> |
||
(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso |
(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suo ''pay-off'' nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza. |
||
La soluzione del gioco è quindi che entrambi confessino, ottenendo 6 anni di carcere ciascuno. |
La soluzione del gioco è quindi che entrambi confessino, ottenendo 6 anni di carcere ciascuno. |
||
L'aspetto tuttavia più interessante del [[dilemma del prigioniero]] è il seguente: |
L'aspetto tuttavia più interessante del [[dilemma del prigioniero]] è il seguente: tutte le combinazioni di strategie, ad eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta ad una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché |
||
:<math>u_i\left(n, n\right)>u_i\left(c, c\right)</math> |
:<math>u_i\left(n, n\right)>u_i\left(c, c\right)</math> |
||
per ogni |
per ogni <math>i,</math> <math>(c,c)</math> non è una soluzione Pareto-ottimale. |
||
L'[[ottimo paretiano]] è un concetto di grande importanza in economia: un Ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: |
L'[[ottimo paretiano]] è un concetto di grande importanza in economia: un Ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, se gli <math>N</math> agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, non è detto che essi raggiungano un ottimo di Pareto. In alcuni casi lo raggiungono ed in altri no; in quest'ultimo caso le loro azioni comportano una dispersione o cattiva allocazione di risorse. |
||
Il confronto tra |
Il confronto tra equilibrio di Nash e ottimo paretiano fa dubitare della generalità di quanto sostenuto da [[Adam Smith]]. Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale e vi sono condizioni di [[concorrenza perfetta]], l'equilibrio che ne esce è uno nel quale ogni azione individuale accresce la ricchezza complessiva del gruppo. Un ottimo di Pareto, insomma. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per sé, il risultato cui si giunge è, in generale, un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile che, se ogni agente fa solo il proprio interesse personale, si giunga ad un'allocazione inefficiente delle risorse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6 a testa. |
||
== L'equilibrio di duopolio di Cournot e l'economia == |
== L'equilibrio di duopolio di Cournot e l'economia == |
||
Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di [[duopolio]] che [[Antoine |
Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di [[duopolio]] che [[Antoine Augustin Cournot]], matematico ed economista, descrisse già nel [[1838]]. |
||
== Note == |
== Note == |
||
<references/> |
<references/> |
||
Riga 119: | Riga 176: | ||
{{Teoria dei giochi}} |
{{Teoria dei giochi}} |
||
{{Controllo di autorità}} |
|||
{{Portale|matematica}} |
{{Portale|matematica}} |
||
Versione attuale delle 11:22, 21 lug 2024
In teoria dei giochi si definisce equilibrio di Nash un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse ad essere l'unico a cambiare. Prende il nome dal matematico statunitense John Nash.
«Un gioco può essere descritto in termini di strategie che i giocatori devono seguire nelle loro mosse: l'equilibrio c'è quando nessuno riesce a migliorare in maniera unilaterale il proprio comportamento. Per cambiare occorre agire insieme.[1]»
Nascita del teorema di Nash
[modifica | modifica wikitesto]La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa della teoria dei giochi per quel che riguarda i "giochi non cooperativi", appare in un brevissimo articolo apparso nel 1950 dove John Nash, allora dottorando a Princeton, spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani[2]: quella di un punto fisso in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo payoff, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).
Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei "giochi a somma zero" studiati in precedenza da John von Neumann. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea di minimax.
L'equilibrio di Nash
[modifica | modifica wikitesto]Vediamo ora più nel dettaglio cosa si intende esattamente per equilibrio di Nash. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della teoria dei giochi e definire alcuni concetti basilari.
Un gioco è caratterizzato da:
- Un insieme di giocatori, o agenti, in numero di N, che indicheremo con
- Per ogni agente, un vettore
- di strategie che il giocatore i-esimo ha a disposizione, cioè l'insieme delle azioni che esso può compiere; per brevità indicheremo nel seguito con la strategia scelta dal giocatore
- Per ogni agente, una funzione
- che associa al giocatore il guadagno (detto anche pay-off) derivante da ogni combinazione di strategie (il guadagno di un giocatore in generale dipende infatti non solo dalla sua strategia ma anche dalle strategie scelte dagli avversari).
Un equilibrio di Nash per un dato gioco è una combinazione di strategie (che indicheremo con l'apice e)
tale che
per ogni e per ogni strategia scelta dal giocatore -esimo.
Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia . Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore gioca una qualunque strategia a sua disposizione diversa da , mentre tutti gli altri hanno giocato la propria strategia , può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia.
Il contributo più importante dato da John Nash alla teoria dei giochi è la dimostrazione matematica dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash, eventualmente in strategie miste. Per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista per un dato giocatore si intende una distribuzione di probabilità sulle strategie a disposizione del suddetto giocatore.
Teorema
[modifica | modifica wikitesto]Sia un gioco non cooperativo ad giocatori. Si supponga che valgano le seguenti:
- sono sottoinsiemi convessi, compatti e non vuoti di , per ogni ;
- sono funzioni continue, per ogni ;
- , tale che , dove indica la stringa di lunghezza in cui è stata eliminata la componente -esima, sia quasi concava, per ogni . In altre parole, la funzione utilità, ristretta ad una strategia, una volta fissate le altre, sia quasi concava.
Allora il gioco ammette almeno un equilibrio di Nash.
Dimostrazione
[modifica | modifica wikitesto]Innanzitutto, consideriamo la funzione miglior risposta (best replay) del giocatore -esimo , definita come
Si noti che
Data la funzione miglior risposta del gioco , definita come , si ha che è un equilibrio di Nash se e solo se è un punto fisso della funzione miglior risposta del gioco, cioè .
Quindi, se verifichiamo che la funzione miglior risposta del gioco, , soddisfa le ipotesi del teorema di Kakutani, avremo la tesi.
- Banalmente si ha che è non vuoto, convesso e compatto, in quanto prodotto cartesiano di sottoinsiemi non vuoti, convessi e compatti di .
- Essendo compatto e continua, per ogni , allora esiste almeno un massimo in , ed inoltre, .
- è compatto, per ogni . Infatti, essendo sottoinsiemi chiusi di un compatto, sono compatti. Consideriamo una successione , in , convergente a , allora . Per definizione, si ha che
- Dal fatto che le funzioni utilità sono continue e la successione converge a , allora
- Dunque, per il teorema della permanenza del segno, segue che
- Questo significa che .
- è convesso, per ogni . Infatti, consideriamo l'insieme
- Dal fatto che le funzioni utilità sono quasi concave, ossia il loro sottografico intersecato con iperpiani genera insiemi convessi, segue che l'insieme è convesso . Osserviamo che
- ,
- Essendo convesso , allora la loro intersezione è ancora un insieme convesso, quindi è convesso.
- La funzione miglior risposta del giocatore -esimo ha grafico chiuso. Consideriamo le successioni , in , convergenti rispettivamente ad , se, inoltre, , allora , ossia la funzione miglior risposta del giocatore -esimo ha grafico chiuso. Si supponga per assurdo che . Allora esisterà un certo tale che . Sia . Equivalentemente si ha che
- Dal fatto che le successioni sono convergenti e le funzioni utilità sono continue, ed inoltre, , segue che
- Per , si ha che . Assurdo.
Equilibrio di Nash e ottimo di Pareto
[modifica | modifica wikitesto]Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresenta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per sé, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. È noto infatti che l'equilibrio di Nash può non essere un ottimo di Pareto (o ottimo paretiano), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso del dilemma del prigioniero, ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice tale che
per ogni , ma che questa tale combinazione non sia un equilibrio, come accade nel dilemma del prigioniero, o, in altre parole, che non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia diversa da che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una tale che
Conseguentemente, per l'assioma di razionalità, sarà portato a preferire una strategia diversa da . Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia , dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiché in generale il guadagno di dipende dalle scelte di tutti i giocatori; non essendo una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare , gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia ottimale. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile.
Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi coincide con e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per sé, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per sé (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiché tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) ed una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare.
Esempio: il "dilemma del prigioniero"
[modifica | modifica wikitesto]Il dilemma del prigioniero fornisce un valido spunto per confrontare i due concetti di equilibrio di Nash e ottimo di Pareto, e per comprenderne l'applicazione in economia. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero. Le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare.
- Se entrambi non parlano avranno una pena leggera (1 anno).
- Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni).
- Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi.
Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di Nash è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica).
Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi pay-off (2x2) che sono (indicheremo per brevità confessa con e non confessa con e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi):
- Strategie:
- Pay-off:
Si deduce immediatamente che, per entrambi, la strategia dominante è confessa, infatti
e
Quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. È immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori
(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suo pay-off nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza.
La soluzione del gioco è quindi che entrambi confessino, ottenendo 6 anni di carcere ciascuno.
L'aspetto tuttavia più interessante del dilemma del prigioniero è il seguente: tutte le combinazioni di strategie, ad eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta ad una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché
per ogni non è una soluzione Pareto-ottimale.
L'ottimo paretiano è un concetto di grande importanza in economia: un Ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, se gli agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, non è detto che essi raggiungano un ottimo di Pareto. In alcuni casi lo raggiungono ed in altri no; in quest'ultimo caso le loro azioni comportano una dispersione o cattiva allocazione di risorse.
Il confronto tra equilibrio di Nash e ottimo paretiano fa dubitare della generalità di quanto sostenuto da Adam Smith. Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale e vi sono condizioni di concorrenza perfetta, l'equilibrio che ne esce è uno nel quale ogni azione individuale accresce la ricchezza complessiva del gruppo. Un ottimo di Pareto, insomma. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per sé, il risultato cui si giunge è, in generale, un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile che, se ogni agente fa solo il proprio interesse personale, si giunga ad un'allocazione inefficiente delle risorse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6 a testa.
L'equilibrio di duopolio di Cournot e l'economia
[modifica | modifica wikitesto]Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di duopolio che Antoine Augustin Cournot, matematico ed economista, descrisse già nel 1838.
Note
[modifica | modifica wikitesto]- ^ Piergiorgio Odifreddi, John Nash genio e follia, su espresso.repubblica.it, la Repubblica. Espresso. Cultura., 11 marzo 2008.
- ^ Si noti che questa connessione era comunque già presente qui: John von Neumann: Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes, Ergebnisse eines Math. Kolloquiums (curatore: Karl Menger), 8, 73-83, 1937. Traduzione inglese: A model of general economic equilibrium, Review of Economic Studies, 13, 1-9, 1945-1946.
Bibliografia
[modifica | modifica wikitesto]- Nash, John F. Jr. [1950]: Equilibrium Points in n-Person Games, Proc. Nat. Acad. Sci. U.S.A., 36, 48-49.
- Nash, John F. Jr. [1951]: Non-Cooperative Games, Ann. of Math., 54, 286-295.
Voci correlate
[modifica | modifica wikitesto]Collegamenti esterni
[modifica | modifica wikitesto]- Nash, Berge, Kakutani dimostrazione del teorema di esistenza dell'equilibrio di Nash e preliminari (file pdf, 18 pagg.)
Controllo di autorità | GND (DE) 4171190-7 |
---|