IV 
 
selezionato un equilibrio. Assumendo un gioco condotto molte volte da 
giocatori limitatamente razionali e casualmente estratti da grandi popolazioni, 
la teoria evolutiva dei giochi analizza la distribuzione nel tempo dei 
comportamenti (strategie) nella popolazione e ne verifica la stabilità, ovvero la 
robustezza rispetto ad eventuali scostamenti. Si tratta di giocatori limitatamente 
razionali in quanto non intraprendono una strategia dopo un complesso 
ragionamento; piuttosto “adattano” il proprio comportamento in base al suo 
successo relativo. Quest’ultimo, misurato dalla differenza tra il payoff 
associato a tale strategia e il payoff medio ottenuto dall’intera popolazione, 
dipende dall’ambiente strategico in cui si opera, ovvero dalla distribuzione 
“corrente” delle diverse strategie nella popolazione dei giocatori. 
Nello sviluppo della teoria evolutiva dei giochi, una prima e fondamentale 
tappa consiste nell’individuazione delle strategie evolutivamente stabili
1
, tali 
cioè da non poter essere migliorate da nessuna strategia alternativa (Maynard 
Smith 1973 e 1982). I giocatori scelgono la strategia evolutivamente stabile 
(ESS) poiché conferisce loro il payoff atteso più alto; qualunque giocatore che 
se ne discostasse otterrebbe uno “svantaggio riproduttivo”, misurato dalla 
differenza tra i payoff attesi. Non ci saranno dunque comportamenti devianti ed 
il profilo di strategie evolutivamente stabili finirà per dominare la popolazione. 
Il criterio di stabilità evolutiva suggerito dal concetto di ESS, sebbene sia 
decisamente più stringente rispetto ai criteri proposti dai tradizionali 
refinements, presenta diverse debolezze, in particolare con riferimento ai giochi 
asimmetrici (in cui sono presenti due popolazioni distinte)
2
 e riguardo alla 
mancata investigazione dei processi che conducono all’equilibrio 
evolutivamente stabile. 
La dinamica dei replicatori, la cui formulazione matematica è dovuta a Taylor 
e Jonker (1978), evidenzia come una popolazione arrivi ad adottare un certo 
tipo di comportamento e permette dunque di colmare gran parte dei limiti delle 
ESS.
3
 I replicatori sono le strategie pure del gioco, la cui diffusione all’interno 
                                                 
1
 Le strategie evolutivamente stabili (ESS) vengono affrontate nel primo capitolo. 
2
 Si veda il paragrafo 1.5. 
3
 I modelli di dinamica dei replicatori con popolazione omogenea o popolazioni multiple sono 
esaminati nel secondo capitolo. Nei capitoli terzo, quarto e quinto si è proceduto ad 
 V 
 
della popolazione di riferimento è strettamente legata al “vantaggio 
riproduttivo”(o fitness) da esse conferito, inteso come differenza tra il payoff 
corrente della strategia ed il payoff medio nella popolazione. Quanto più 
elevato è il payoff corrente (relativo allo stato della popolazione corrente) di 
una generica strategia i  rispetto alla “media”, tanto più elevato è il vantaggio 
riproduttivo da essa conseguito e dunque il numero di copie di sé stesso create. 
Analogamente al processo evolutivo che avviene in natura, la dinamica dei 
replicatori specifica come le quote della popolazione associate alle diverse 
strategie pure nel gioco evolvano nel tempo. Essendo formalizzato in un 
sistema di n  equazioni differenziali (una per ogni replicatore), tale strumento 
determina verso quale stato limite convergerà la popolazione, a partire da 
diverse condizioni iniziali. La determinazione degli stati asintoticamente 
stabili di un gioco permette di individuare la convenzione che si andrà ad 
affermare nella popolazione di riferimento. Da un punto di vista matematico, è 
possibile stabilire le condizioni, verificate le quali, la dinamica di un 
determinato sistema converge verso uno stato stabile piuttosto che un altro. Ciò 
rappresenta un eccezionale contributo nella risoluzione del problema di 
indeterminatezza e consente di definire gli strumenti attraverso i quali 
influenzare e facilitare il raggiungimento dell’equilibrio ottimale o socialmente 
efficiente.  
 
Nel presente lavoro, dopo aver definito gli aspetti teorici della dinamica dei 
replicatori, abbiamo proceduto ad applicazioni con riferimento a diverse 
situazioni di interazione strategica tra agenti. Nell’ambito delle problematiche 
ambientali, abbiamo studiato il sistema dinamico inerente l’adesione dei 
comuni, appartenenti ad un bacino idrografico, ad un programma di raccolta 
differenziata a domicilio, evidenziando l’importanza della partecipazione e 
disponibilità dei cittadini per la convergenza verso l’equilibrio socialmente 
efficiente. Quando tale propensione è sufficientemente elevata, i comuni sono 
incentivati a promuovere l’iniziativa, anche unilateralmente. L’asimmetria 
                                                                                                                                 
applicazioni con riferimento rispettivamente a problematiche ambientali, alle strategie delle 
imprese ed al comportamento dei contribuenti. 
 VI 
 
nell’etica ambientale e nel volume medio di rifiuti prodotti dai cittadini delle 
due zone (parti costituenti di un bacino o di una regione) può comportare la 
nascita di una convenzione discriminatoria, secondo la quale solo i comuni 
meno inquinanti adottano il sistema di raccolta differenziata “porta a porta”. 
Ciò deriva dal fatto che i comuni che producono un volume medio di rifiuti 
inferiore agli altri sono anche quelli particolarmente sensibili alle 
problematiche ambientali e ben disposti dunque ad impegnarsi per la rimozione 
del problema rifiuti. Tuttavia, tale risultato è possibile solo nel caso in cui il 
costo totale sostenuto dai comuni più inquinanti per la promozione unilaterale 
dell’iniziativa superi in valore assoluto l’entità del danno ambientale subito 
dagli stessi.
4
 In caso contrario, c’è la possibilità di raggiungere un risultato più 
“equo”, nel senso che promuovono ed attivano la raccolta differenziata i soli 
comuni più inquinanti e meno sensibili alle questioni ambientali.
5
 
Considerando la disponibilità e sensibilità ambientale dei cittadini di una zona 
come conseguenza della rilevanza del problema dell’inquinamento da rifiuti, è 
possibile raggiungere l’equilibrio socialmente efficiente in cui tutti i comuni 
cooperano nella realizzazione di un sistema integrato di raccolta differenziata.
6
 
Ciò sta a significare che la gravità e l’emergenza del problema 
dell’inquinamento da rifiuti in una zona possono avere un effetto trainante 
anche per gli altri comuni. 
Sempre in ambito ambientale abbiamo analizzato le condizioni che rendono 
possibile una crescita del reddito nel lungo periodo, accompagnata dalla 
conservazione del bene ambiente (una crescita sostenibile). Grazie alla teoria 
evolutiva dei giochi abbiamo introdotto nelle usuali funzioni di produzione 
l’interazione strategica ricorrente tra agenti, così da analizzare l’andamento 
dinamico nel tempo dei fattori produttivi, partendo da diverse condizioni 
iniziali. Assumendo una popolazione omogenea di agenti chiamati a scegliere 
il livello di sfruttamento economico di una risorsa ambientale tra due possibili 
                                                 
4
 Si veda il quarto e quinto caso del gioco della raccolta differenziata, discusso nel paragrafo 
3.3. 
5
 Posto che la differenza tra i volumi medi di rifiuti sia sufficientemente grande. 
6
 Anche in questo caso devono essere soddisfatte determinate condizioni, in particolare 
riguardo alla differenza tra i volumi medi di rifiuti ed al grado di inquinamento già presente 
nell’area. 
 VII 
 
alternative (elevato, 
h
P , e basso, comunque positivo, 
b
P )
7
, abbiamo studiato il 
sistema dinamico costituito dalla variazione del capitale procapite e dello 
sfruttamento ambientale.
8
 In una funzione di produzione che non considera 
l’input tecnologico, la crescita economica sostenibile può esistere solo nel 
breve termine (ciò è dovuto ai rendimenti marginali decrescenti del capitale). 
Includendo la tecnologia, trattata come variabile costante, si è rilevata la 
possibilità di una crescita del reddito sostenibile nel lungo periodo; tuttavia 
solo nell’ambito di un modello di crescita endogena (in cui i rendimenti 
marginali del capitale sono costanti) e di uno standard minimo di sfruttamento 
(
b
P ) sufficientemente elevato da garantire la crescita indefinita del capitale 
anche quando tutti i giocatori adottano tale strategia.
9
 Laddove ciò non fosse 
verificato, la crescita sostenibile può comunque esistere, ma solo in 
corrispondenza del massimo sfruttamento ambientale (tutti i giocatori scelgono 
h
P ). Tale risultato paradossale, dovuto alla definizione di sostenibilità come 
costanza del flusso economico di sfruttamento ambientale, si ridimensiona 
considerando l’eventuale esauribilità della risorsa ambientale. Introducendo 
tale ipotesi, infatti, il capitale ed il reddito procapite non potrebbero 
sperimentare all’infinito tassi di crescita positivi. 
Considerando un miglioramento tecnologico á la Hicks derivante da uno shock 
esterno, si sono rilevati effetti differenti a seconda delle condizioni iniziali di 
sviluppo di un’economia. Un’economia in via di sviluppo (bassi livelli di 
capitale procapite) ha maggiori possibilità di raggiungere la crescita sostenibile 
in corrispondenza del minimo sfruttamento ambientale, mentre un’economia 
sviluppata può conseguire una crescita sostenibile solo in corrispondenza del 
massimo sfruttamento ambientale. Tale risultato è apparentemente paradossale, 
in quanto ci saremmo aspettati che fossero le economie fortemente sviluppate a 
                                                 
7
 Si può pensare a due giocatori che pongono in essere attività economiche in concorrenza tra 
loro e che devono decidere la misura di sfruttamento delle risorse ambientali a loro 
disposizione.   
8
 Si veda il paragrafo 3.4. 
9
 Rigorosamente, 
 Ζ
b
P >
sA
n   Γ
. Stiamo implicitamente affermando che anche il livello più basso  
di sfruttamento ambientale è comunque sufficientemente elevato. Ciò potrebbe derivare dalle 
caratteristiche tecniche o di estrazione della risorsa che ne impediscono un consumo inferiore. 
 VIII 
 
potersi “permettere” di sfruttare meno l’ambiente rispetto alle economie in via 
di sviluppo. Al di là delle ragioni tecniche del risultato, derivanti dall’entità del 
reddito procapite di cui i giocatori possono appropriarsi, dobbiamo considerare 
che un Paese in via di sviluppo non presenta i costi di riconversione 
dell’apparato industriale a seguito di un miglioramento tecnologico, che può 
dunque spingere con più facilità verso un minore sfruttamento ambientale.
10
 
Senza contare che, in realtà, i Paesi maggiormente inquinanti sono quelli più 
sviluppati; il “lusso” che possono concedersi allora non è quello di non 
sfruttare affatto l’ambiente (o di farlo in maniera limitata) bensì di sfruttarlo 
costantemente, seppur ad un livello elevato.
11
  
Tuttavia, il modello non esclude la possibilità che anche un Paese in via di 
sviluppo si muova verso la crescita sostenibile col massimo sfruttamento 
ambientale. Tale situazione si verifica in corrispondenza di una scarsa etica 
ambientale che sembra dunque essere particolarmente rilevante, ai fini dello 
sfruttamento ambientale, per un’economia poco sviluppata. 
Nonostante si tenda a vedere il progresso tecnologico come un “sostituto” 
dell’impiego di risorse naturali, dalle assunzioni del nostro modello ne 
discende una tendenza netta alla scelta dell’alto sfruttamento ambientale: il 
reddito procapite che i giocatori possono ottenere in corrispondenza di un 
avanzamento tecnologico è infatti più elevato e, conseguentemente, è 
rafforzato l’incentivo all’adozione della strategia aggressiva.
12
 Quest’effetto 
può essere tuttavia contrastato dal peggioramento dell’entropia esistente nel 
sistema (causato dall’eccessivo sfruttamento della risorsa naturale) che 
comporta un miglioramento delle possibilità di conseguire la crescita 
sostenibile col livello minimo di sfruttamento ambientale.   
Una seconda applicazione della teoria evolutiva dei giochi ha riguardato le 
scelte strategiche delle imprese. Il risultato cui siamo pervenuti è che la 
                                                 
10
 Al contrario, un’economia fortemente sviluppata va incontro a maggiori costi di 
riconversione dell’apparato industriale. 
11
 E’ proprio questa la ragione dell’eccessivo inquinamento prodotto dai Paesi più sviluppati. 
12
 Stiamo dunque sottolineando un possibile ruolo negativo del progresso tecnologico ai fini 
dell’ottenimento del minimo sfruttamento ambientale. Tuttavia, si tratta di un progresso 
tecnologico che incrementa indifferentemente la produttività di tutti i fattori della produzione, 
ivi compreso l’input naturale. La maggiore produttività della risorsa ambientale incentiva i 
giocatori allo sfruttamento. 
 IX 
 
dinamica dei replicatori è in grado di eliminare tutte le strategie strettamente 
dominate (nonché quelle iterativamente dominate), senza assumere giocatori 
perfettamente razionali.
13
 Nel gioco esemplificativo di un duopolio alla 
Bertrand, infatti, la strategia che comporta la scelta di un prezzo elevato tende a 
scomparire dalla popolazione di imprese, che finiranno tutte per scegliere un 
prezzo basso, confermando il risultato dell’interazione simultanea e statica tra 
imprese secondo il modello originario.
14
 
Non è detto invece che una strategia debolmente dominata venga 
necessariamente eliminata dalla pressione della “selezione naturale”. 
Introducendo la dinamica dei replicatori in un gioco relativo all’eventuale 
reazione delle imprese esistenti in un mercato all’entrata di un potenziale 
concorrente, abbiamo potuto rilevare la presenza di un equilibrio in cui nessuna 
impresa esterna decide di entrare e, nonostante ciò, una frazione positiva delle 
imprese già insediate decida di reagire.
15
 Tale risultato, che si basa di fatto sulla 
minaccia non credibile delle imprese esistenti di reagire all’entrata, è tuttavia 
possibile perché la piccola quota iniziale di imprese potenziali entranti che 
decidono di concretizzare la scelta si azzera prima che, nella popolazione 
avversaria, la quota della strategia accomodante superi quella della strategia 
aggressiva. Si tratta dunque di uno stato stazionario, che la dinamica del gioco 
raggiunge solo partendo da particolari configurazioni iniziali. 
Lo strumento della dinamica dei replicatori è stato poi da noi utilizzato per 
analizzare l’evoluzione delle conoscenze tecnologiche di un Paese, 
conseguente all’investimento in R&S da parte delle imprese.
16
 Assumendo una 
sostituibilità tra le risorse dirette alla R&S e quelle destinate alla produzione 
attuale di beni, l’incentivo per le imprese a promuovere attività di ricerca è 
strettamente legato allo stock di conoscenze tecnologiche accumulato in 
passato; maggiore è la ricchezza culturale e tecnologica di un Paese, maggiore 
è “l’efficienza” dell’investimento in R&S (la ricerca  parte infatti da una base 
                                                 
13
 Ciò, da un lato, esalta il concetto di equilibrio di Nash, permettendo di apprezzarne 
ulteriormente la straordinarietà, dall’altro consente di superare gran parte dei limiti di un 
approccio razionalistico alla teoria dei giochi. 
14
 Si veda il paragrafo 4.1. 
15
 Si veda il paragrafo 4.2. 
16
 Si veda il paragrafo 4.3. 
 X 
 
tecnologica più ampia). Dall’analisi del sistema dinamico, costituito dal 
capitale tecnologico e dalla frazione di imprese che scelgono di investire 
maggiori risorse nella R&S rispetto alla produzione attuale dei beni, abbiamo 
rilevato la presenza di un trade-off tra crescita economica e produttiva corrente 
e progresso tecnologico o crescita economica nel lungo termine. Secondo le 
assunzioni ed implicazioni del nostro modello, il fatto che un’economia non 
sperimenti oggi elevati tassi di crescita della produzione e dei consumi non 
deriva necessariamente dalla sua arretratezza, ma potrebbe voler dire che una 
parte significativa delle risorse del Paese confluisce nell’arricchimento 
tecnologico. Nel lungo termine l’economia potrà sperimentare tassi di crescita 
superiori a quelli di un altro Paese, nei confronti del quale partiva 
apparentemente svantaggiata. 
 
Infine, abbiamo utilizzato la teoria evolutiva dei giochi per studiare il 
comportamento strategico dei contribuenti.
17
 Il problema che ci siamo posti è 
stato quello di stabilire fino a che punto ed in quali casi la disapprovazione 
sociale della comunità nei confronti dell’evasore fiscale possa incentivare i 
contribuenti a pagare le tasse. Il risultato più importante cui siamo giunti è che 
l’equilibrio socialmente efficiente (in cui tutti i giocatori pagano le tasse) è 
raggiungibile, nonostante i contribuenti ritengano particolarmente bassa la 
probabilità di subire un controllo fiscale. Questo è possibile solo se 
l’approvazione della comunità è sufficientemente importante per tutti i 
giocatori. La presenza di una sanzione sociale sopperisce in qualche modo 
all’aspettativa di una scarsa quantità di controlli fiscali. L’equilibrio ottimale, 
in cui tutti erogano effettivamente il proprio contributo, ha così il significato di 
norma sociale (o regola di comportamento) che si rafforza e mantiene nel 
tempo. 
                                                 
17
 L’argomento è sviluppato nel capitolo 5. 
 1
PARTE PRIMA: TEORIA 
 
 
CAPITOLO 1: Dai perfezionamenti degli equilibri di Nash alle 
strategie evolutivamente stabili 
 
 
1.1 Introduzione 
 
La grande utilità della teoria dei giochi è indubbiamente la sua valenza 
generale, la sua applicabilità in diverse discipline. Del resto, per gioco si 
intende un qualsiasi modello stilizzato che descrive situazioni di interazione 
strategica tra agenti, situazioni cioè dove il risultato ottenuto da ciascun agente 
dipende non solo dalle sue azioni ma anche dalle azioni di tutti gli altri. 
Dato che la vita di tutti noi è densa di situazioni di questo tipo, possiamo 
percepire la forza del concetto di equilibrio di Nash, che è la previsione di 
come sarà giocato “naturalmente” il gioco.
18
 Da sempre l’attenzione degli 
studiosi si è focalizzata su quei giochi che presentano molteplici equilibri di 
Nash. Nonostante questo problema di indeterminatezza, la teoria dei giochi ed 
il meritevole lavoro di John Nash non perdono di attrattiva in quanto è 
possibile individuare, tra i vari equilibri, quello che si distingue dagli altri come 
la soluzione obbligata del gioco, la convenzione su come il gioco verrà 
giocato, che si andrà effettivamente ad affermare. Come facciamo a selezionare 
quest’equilibrio? Il problema è al centro di un programma di ricerca nato negli 
anni ’70 del secolo scorso noto come refinements dell’equilibrio di Nash. 
L’obiettivo è quello di raffinare tale concetto e liberarsi da quegli equilibri di 
Nash che si presentano fragili, implausibili, irragionevoli alla luce di 
considerazioni basate sulla condotta “razionale” degli agenti. Tra i contributi 
                                                 
18
 Si ricorda che una coppia di strategie soddisfa la condizione di equilibrio di Nash se le 
strategie dei giocatori sono reciprocamente risposte ottime (best reply); ovvero la strategia di 
ogni giocatore dev’essere la risposta ottima alla strategia dell’altro. E’ una condizione di 
equilibrio in quanto nessun giocatore ha un incentivo unilaterale a discostarsi, a deviare da tale 
strategia che è la miglior risposta alle strategie degli altri; ciò vuol dire che, se adottasse una 
qualunque altra strategia, otterrebbe un payoff inferiore. 
 2
più interessanti di tale indagine (dal punto di vista dei possibili legami con la 
nozione di ESS), ricordiamo il concetto di trembling hand perfection (Selten, 
1975), di equilibrio appropriato (Myerson, 1978) e di equilibrio sequenziale 
(Kreps e Wilson, 1982). Il primo, che allude alla possibilità (anche piccola) che 
i giocatori commettano un errore nella scelta della best reply, concepisce 
l’equilibrio perfetto come quella combinazione di strategie che resiste ad 
eventuali errori involontari dei giocatori. Il criterio di robustezza degli EN  
proposto da Myerson è leggermente più stringente: un equilibrio è appropriato 
se resiste a possibili errori dei giocatori, dove la probabilità di commettere un 
errore dipende dalle sue conseguenze economiche (quanto più “costoso” è 
l’errore tanto minore sarà la probabilità che questo si verifichi). Il concetto di 
equilibrio sequenziale infine ha, per i giochi in forma estesa, lo stesso effetto 
della trembling hand perfection nei giochi in forma normale: eliminare gli EN 
che hanno come componente una strategia dominata e perciò non plausibili 
come soluzioni del gioco (più precisamente si tratta di scartare gli equilibri 
basati su minacce non credibili dei giocatori).  
Rimuovendo gli equilibri pericolanti, rimarrà quello robusto ovvero la 
soluzione effettiva del gioco. Le spiegazioni dei processi di selezione generate 
nell’ambito dei refinements dell’equilibrio di Nash, si sono rilevate spesso 
artificiose e forzate: si sono aggiunti vincoli o specificazioni addizionali alla 
razionalità del calcolo strategico degli individui, allontanandosi sempre più 
dalle loro capacità “naturali” di ragionamento.
19
 Esistono così tanti 
raffinamenti della nozione di equilibrio di Nash che in molti giochi che 
presentano EN multipli, ogni equilibrio può essere “giustificato” da qualche 
raffinamento presente in letteratura.  
Un contributo più “convincente” al problema dell’indeterminatezza ci viene 
fornito dal concetto di ESS (Evolutionarily Stable Strategies), prima e 
fondamentale tappa del percorso che ha portato negli anni allo sviluppo di una 
teoria evolutiva dei giochi. 
                                                 
19
 L’idea di fondo del perfezionamento di Myerson è di considerare agenti che possano 
commettere degli errori, ma che in tali errori ci sia comunque un elemento di razionalità. Si 
ammette cioè la possibilità che i giocatori si sbaglino seppur razionalmente in funzione dei 
costi che possono derivare da tali errori.