nella formulazione del problema di controllo, e a descriverli con delle traiettorie assunte a priori.
Esiste pero` una potenziale via, poco esplorata, per risolvere questo problema: identificare un mo-
dello empirico a partire non dai dati raccolti sul sistema reale, bens`ı dai dati prodotti dal modello
concettuale a parametri distribuiti. Questi modelli infatti, se ben costruiti, possono approssima-
re in modo soddisfacente il sistema che essi simulano e fornire un sufficiente numero di dati per
costruire il modello empirico.
Il concetto di modello di un modello e` stato formulato per la prima volta da Blanning (1975),
il quale propose di costruire dei modelli dei modelli di simulazione (chiamandoli metamodelli),
identificati a partire dai dati di input-output dei modelli di simulazione attraverso l’uso di semplici
relazioni concettuali o empiriche. Questo concetto e` sinteticamente cos`ı espresso da Emmerich
(2002) : “a metamodel approximates a multivariate function using points that have already been
evaluated...and is considered to be a fast surrogate model to the exact evaluation model”1.
Lo scopo di questo lavoro e` dunque quello di partire dal concetto di metamodello di Blanning e di
capire se e` possibile identificare un modello parsimonioso a partire dai dati prodotti da un modello
a parametri distribuiti, per descrivere lo stato dei consorzi irrigui e le condizioni idro-biologiche
del lago.
Vengono quindi proposti due casi di studio reali. Il primo e` relativo ad un modello bidi-
mensionale per la simulazione di un sistema irriguo, sviluppato dall’istituto di Idraulica Agraria
dell’Universita` degli studi di Milano (vedi Facchi et al., 2004 e 2005; Gandolfi et al., 2006). Es-
so prevede la suddivisione del territorio analizzato in celle, all’interno delle quali sono omogenee
le caratteristiche pedologiche, di uso del suolo e metereologiche, nonche` le pratiche irrigue. Per
ogni cella avente al suo interno una coltura irrigua viene individuato il volume di controllo (che si
estende dalla superficie del suolo alla profondita` esplorata dagli apparati radicali della vegetazione)
e ad esso si applica il bilancio idrico per il calcolo delle principali grandezze idrologiche, come il
contenuto idrico dello strato traspirativo o il coefficiente di stress delle colture.
Il secondo caso di studio riguarda invece un modello bidimensionale per la simulazione delle
sesse interne ed esterne di un lago stratificato, in fase di sviluppo presso il Centre for Water Re-
search della Western Australia University2. Il modello simula il movimento della superficie libera
e del termoclinio di un lago stratificato al variare della forza del vento. Si tratta di un modello
bidimensionale, che lavora quindi su una sezione del lago. Questa sezione viene divisa in due layer,
che rappresentano lo strato superficiale e lo strato profondo del lago. I due strati vengono a loro
volta divisi in celle, per ciascuna delle quali il modello calcola la velocita` della corrente e lo spo-
stamento del termoclinio (o della superficie libera).
Per lo sviluppo di entrambi i metamodelli e` stata seguita una procedura ispirata alla procedu-
ra proposta da Kleijnen (2000) e descritta nel primo capitolo insieme ad una breve introduzione
teorica sui metamodelli. I capitoli 2, 3, 4, 5 sono dedicati allo sviluppo del modello parsimonioso
del modello irriguo; in particolare, il capitolo 2 propone un’analisi critica del modello originale,
il capitolo 3 e` dedicato alla determinazione dello scopo e dell’uscita del modello parsimonioso, il
capitolo 4 si occupa della scelta degli ingressi e della preparazione dei dati, mentre il capitolo 5
presenta i modelli parsimoniosi identificati. Il capitolo 6 e` invece dedicato allo sviluppo del modello
parsimonioso del modello del sistema lacustre.
1“un metamodello approssima una funzione multivariata utilizzando punti che sono gia` stati calcolati...ed e`
considerato come un rapido surrogato del modello di partenza”.
2A differenza del modello del sistema irriguo, non esiste ancora una pubblicazione relativa a questo modello, dal
momento che, come detto, e` tutt’ora in fase di sviluppo.
8
Capitolo 1
Approssimazione di modelli a
parametri distribuiti tramite
l’impiego di modelli parsimoniosi
Questo primo capitolo e` interamente dedicato ai modelli parsimoniosi: dopo una breve descrizione
generale di questo ‘strumento matematico’, viene presentata la procedura utilizzata per identificare
i modelli parsimoniosi esposti in questo lavoro. Nell’ultima parte del capitolo sono infine esposte
le varie tipologie di modelli parsimoniosi utilizzate durante la fase d’identificazione.
1.1 Introduzione teorica
1.1.1 Definizione
Il termine metamodello e` stato per la prima volta utilizzato da Blanning (1975) e da Kleijnen
(1975) circa trenta anni fa ed e` anche noto come surrogate model, approximation model o response
surface model1 Si tratta, come anticipato nell’introduzione, di un modello di un modello, creato
al fine di ridurre la complessita` computazionale del modello di partenza, che in letteratura viene
generalmente definito come original model, reference model, simulation model o simulator2.
Un modello parsimonioso riproduce dunque il comportamento del relativo modello originale, il
quale, a sua volta, simula il comportamento di un sistema reale (o problem entity con la termino-
logia di Kleijnen) attraverso delle relazioni deterministiche o stocastiche. Il rapporto che esiste tra
queste tre ‘entita`’ e` schematizzato nella figura 1.1, tratta da Kleijnen (2000).
I modelli parsimoniosi sono ampiamente utilizzati in diversi campi dell’ingegneria, come la ro-
botica, la meccanica e la chimica. Essi sono stati impiegati con successo anche nello studio dei
sistemi ambientali, come per l’analisi del comportamento degli inquinanti all’interno di corpi idrici
(Belanche et al., 1999) e per rapide applicazioni su complessi modelli di circolazione atmosferica
(Voss Hooss, 2001).
1Il termine metamodello e` ampiamente utilizzato sia nel campo dell’automazione (per indicare gruppi o classi di
modelli) sia nel campo dell’ingegneria del software; per questo motivo, al fine di evitare incomprensioni, si utilizzera`
il termine modello parsimonioso.
2A partire da questo punto, al fine di evitare incomprensioni, si fara` uso del solo termine modello originale
9
SISTEMA REALE
MODELLO
ORIGINALE
MODELLO
PARSIMONIOSO
validazione validazione
validazione
analisi modellizzazione
costruzione del modello
parsimonioso
Figura 1.1: Relazione esistente tra sistema reale, modello originale e modello parsimonioso: un
modello parsimonioso viene costruito a partire da un modello originale, il quale, a sua volta, viene
costruito a partire da un sistema reale. La validizione di un modello parsimonioso puo` essere
‘misurata’ facendo riferimento sia al sistema reale sia al modello originale, la cui validizione e`
invece riferita solo al sistema reale.
10
1.1.2 Tipologie di modelli parsimoniosi
Come facilmente intuibile e` possibile costruire diverse tipologie di modelli parsimoniosi, dato che
le numerose ricerche in questo ambito hanno proposto nel corso degli anni differenti approcci e
soluzioni a questo problema.
E` bene dunque classificare ordinatamente le classi di modelli parsimoniosi; cio` tornera` poi utile
al momento della scelta del modello parsimonioso da usare durante il progetto delle politiche in
sostituzione del modello del sistema irriguo.
Gorissen (2006) identifica tre diverse tipologie:
• Process Based (PB): questi tipi di modelli parsimoniosi cercano di combinare la conoscenza
a priori sul sistema di partenza (sintetizzata e semplificata attraverso espressioni analitiche)
con informazioni empiriche sulle dinamiche del sistema (reperite dai dati), al fine di produrre
un modello parsimonioso dove la conoscenza dei processi viene esplicitamente rappresen-
tata. Il risultato finale e` il cosidetto ‘grey-box model’, che sfrutta contemporaneamente
informazioni teoriche (o concettuali) ed empiriche.
I modelli parsimoniosi PB sono stati usati con successo in diversi ambiti, come l’ecologia,
l’idrologia, l’elettronica e la climatologia. Essi possono dunque fornire ottime prestazioni,
ma per la loro costruzione e` necessario ‘reperire’ informazioni teoriche e specificare adegua-
tamente il dominio di applicazione, dal momento che le semplificazioni adottate potrebbero
farlo fallire sotto certe condizioni.
• Statistics Based (SB): questa e` la piu` nota ed utilizzata classe di modelli parsimoniosi,
che usano metodi statistici per determinare la relazione tra ingressi ed uscite del sistema. In
questo caso il modello originale viene semplicemente visto come un generatore di dati, che
produce un output y dato un ingresso u, e le cui dinamiche sono spesso ignorate. In questo
caso si ottiene dunque un ‘black-box model’, che ignora completamente la fisica del sistema,
dal momento che si basa solo su informazioni empiriche (relazione tra ingressi ed uscite del
sistema). Per questo motivo essi sono noti anche come modelli empirici.
I modelli empirici, non richiedendo informazioni specifiche sul sistema in analisi, sono dunque
facilmente applicabili in diversi ambiti. Questa mancanza di informazioni ‘concettuali’ puo`
essere vista come un limite, ragion per cui sono spesso sviluppati al fine di migliorare questo
aspetto negativo.
Alcuni esempi di black-box models sono:
- reti neurali;
- support vector machines;
- modelli kriging;
- modelli fuzzy e neuro-fuzzy;
• System Theory Based (STB): questi sono i cosiddetti ‘white-box models’, che si basano
principalmente sulle dinamiche caratteristiche del modello di partenza. In genere queste
dinamiche sono definite attraverso un set di equazioni differenziali, che, durante la costruzione
del modello parsimonioso, sono semplificate ad ordini minori. Questa tipologia di modelli
parsimoniosi puo` essere quindi usata solo nei casi in cui alcune dinamiche fondamentali
(rappresentabili con un modello parsimonioso) dominano i modi del sistema. E` necessario
inoltre notare che la loro costruzione non puo` prescindere dalle informazioni che bisogna
possedere sul sistema in analisi.
11
1.1.3 Finalita` di un modello parsimonioso
Come suddetto, i modelli parsimoniosi vengono costruiti per ridurre la complessita` dei modelli di
partenza e, conseguentemente, il tempo di calcolo nel loro uso. Questo e` certamente il punto di
partenza per lo sviluppo di un modello parsimonioso, ma e` bene specificare nel dettaglio quale
sia lo scopo che si vuole raggiungere tramite la sua costruzione, poiche` da questa scelta iniziale
dipendono le successive caratteristiche assunte dal modello parsimonioso.
Tra le diverse finalita` proposte da Kleijnen et al. (2000) e` bene ricordare le seguenti:
• comprensione: in questo caso un modello parsimonioso viene costruito per capire alcune ca-
ratteristiche del sistema reale o del modello originale (come comprendere il ‘comportamento’
di un output o condurre analisi di sensitivita`);
• previsione e simulazione: un modello parsimonioso puo` essere usato al posto del modello
originale per fare delle simulazioni o delle previsioni del sistema reale;
• ottimizzazione: un modello parsimonioso puo` inoltre essere usato al posto del modello
originale nella formulazione di un problema di ottimizzazione delle prestazioni del sistema
reale.
Prima di procedere alla descrizione di queste quattro finalita`, e` bene mettere in luce un aspetto
molto importante di questa classificazione: le categorie identificate da Kleijnen non sono rigida-
mente separate tra di loro, ma presentano eccezioni ed interazioni. Un modello parsimonioso viene
infatti identificato con uno specifico obiettivo, ma cio` non toglie che possa poi essere usato anche
per altri scopi. Un modello parsimonioso identificato per un problema di ottimizzazione puo` ad
esempio fornire delle utili indicazioni per la comprensione del modello originale e del sistema reale.
Pertanto non ci si deve soffermare eccessivamente sui concetti presentati da questa classifi-
cazione, il cui scopo e` solo quello di differenziare gli obiettivi per cui si costruisce un modello
parsimonioso ed ai quali corrispondono diversi gradi di complessita`.
Comprensione
E` molto importante determinare cosa bisogna capire del sistema reale (o del modello originale) in
analisi atrraverso l’uso di un modello parsimonioso, poiche` la sua complessita` cresce con il livello
di comprensione richiesto.
A tale proposito e` possibile distinguere i seguenti livelli, disposti in ordine di difficolta` crescente:
- direzione dell’output : un modello parsimonioso usato per determinare la direzione (o il se-
gno) di un output e` spesso molto semplice. Nel caso di piu` uscite da studiare puo` dunque
essere conveniente sviluppare alcuni semplici modelli parsimoniosi, anziche` un solo complesso
modello parsimonioso.
- screening : lo screening di un modello originale (o di un sistema) riguarda generalmente la
sola determinazione dei fattori piu` importanti. In tal caso c’e` spesso la tendenza ad usare
modelli parsimoniosi piuttosto semplici, con il rischio, ovviamente, che si possano rivelare
inadeguati.
- effetti principali, interazione ed effetti di ordine superiore al primo: questo e` il massimo livello
di comprensione a cui ci si puo` spingere e ad esso corrispondono modelli parsimoniosi piu`
complessi dei livelli precedenti. Tuttavia e` ampiamente dimostrato che anche le dinamiche
complesse possono essere ‘catturate’ qualitativamente attraverso l’uso di modelli parsimoniosi
abbastanza semplici (come polinomi di secondo o terzo ordine).
12
Previsione e simulazione
Se un modello parsimonioso viene utilizzato per la previsione (o la simulazione), allora dovra` essere
selezionato e sviluppato con estrema accuratezza. Questo fatto e` essenzialmente dovuto a due
motivi: il primo e` che il comportamento del modello originale sull’intero dominio di applicazione
puo` essere molto complesso; il secondo e` che l’accuratezza richiesta ad un modello parsimonioso
da usare in simulazione o previsione e` generalmente molto elevata.
Se un polinomio, ad esempio, dovesse essere usato in simulazione, allora il suo ordine sarebbe
probabilmente molto elevato.
Ottimizzazione
In questo caso si richiede in genere un modello parsimonioso di complessita` media, compresa tra
quella legata al livello di comprensione e quella legata al livello di previsione. Cio` perche´ gli
algoritmi di ottimizzazione necessitano in genere di modelli parsimoniosi abbastanza semplici, il
cui compito e` solo quello di definire la ‘direzione’ da seguire nella ricerca dell’ottimo.
1.1.4 La procedura d’identificazione
Al fine di sviluppare un modello parsimonioso in maniera corretta, e` bene seguire una procedura
precisa e rigorosa, che permetta al modellista di seguire un percorso coerente. L’unica procedura
esistente e` stata proposta da Kleijnen (2000) solo due decenni dopo la ‘nascita’ dei modelli parsi-
moniosi; pertanto essa verra` adottata, con alcune modifiche, nel presente lavoro3.
Di seguito sono brevemente descritti i nove passi da cui la procedura e` composta:
1. analisi critica del modello originale: come prima cosa e` necessario studiare adeguatamente
la teoria su cui e` basato il modello originale. Cio` permette al modellista di avere un’idea
del comportamento del sistema: su queste nozioni di base si reggera` infatti lo sviluppo del
modello parsimonioso.
2. determinazione dello scopo del modello parsimonioso: questo step, come ampiamente de-
scritto nel paragrafo precedente, serve a determinare lo scopo principale per cui il model-
lo parsimonioso viene identificato. Esso determina l’accuratezza nell’output che il modello
parsimonioso dovra` fornire.
3. identificazione dell’output e delle sue caratteristiche : noto con esattezza lo scopo del modello
parsimonioso, e` possibile determinare l’output, la sua ‘natura’ (se deterministica o stocastica)
e la sua unita` di misura.
4. identificazione degli input e del dominio di applicabilita` del modello parsimonioso: in questo
passo vengono selezionati gli input, di cui si determina natura ed unita` di misura. Infine
si definisce il dominio di applicabilita` del modello parsimonioso, ossia la combinazione di
input-output per la quale il modello parsimonioso verra` utilizzato.
5. specificazione dell’accuratezza richiesta: questo step serve a determinare l’accuratezza ri-
chiesta dell’output del modello parsimonioso per il suo dominio di applicazione. Questa
caratteristica dipende fortemente dallo scopo per cui il modello parsimonioso viene costruito.
6. scelta del tipo di modello parsimonioso: in questa fase e` necessario selezionare dapprima la
tipologia di modello parsimonioso (white-box, grey-box o black-box) ed in seguito il tipo
specifico di modello che si vuole usare (si sceglie, ad esempio, tra una rete neurale ed una
vector machine).
3Il lettore interessato puo` trovare la procedura originale nell’articolo di Kleijnen citato in bibliografia.
13
7. specificazione dell’experimental design (ED): per experimental design s’intende la simulazione
da eseguire sul modello originale, al fine di produrre i dati necessari all’identificazione del
modello parsimonioso. Questa operazione deve essere eseguita ad hoc, in modo tale da
rispettare i limiti del dominio di applicabilita`. I dati di input-ouput vengono infine divisi tra
dati di taratura e di validazione.
8. identificazione del modello parsimonioso: a partire dai dati di taratura si identifica il modello
parsimonioso, ossia si tarano i parametri attraverso un algoritmo opportuno. Le prestazioni
del modello parsimonioso vengono poi misurate attraverso indici sintetici (come ad esempio
il coefficiente di determinazione, vedi paragrafo 1.4.2); se i loro valori sono soddisfacenti, si
puo` procedere con l’ultimo step, in caso contrario si torna al passo 6.
9. validazione del modello parsimonioso: se gli indici usati al passo precedente hanno valori
soddisfacenti anche sui dati di validazione, allora il modello parsimonioso e` pronto per essere
utilizzato; in caso contrario e` necessario tornare al punto 6. Si noti che la validazione viene
eseguita sui dati prodotti dal modello originale e non sui dati misurati nel sistema reale (la
validazione del modello originale avviene invece sui dati misurati nel sistema).
Nella figura 1.2 e` rappresentato il diagramma di flusso della procedura: esso permette di visua-
lizzare i vari ‘passi’ che saranno seguiti durante lo sviluppo del modello parsimonioso del modello
del sistema irriguo.
1.2 Organizzazione della tesi
La procedura presentata nel paragrafo precedente non e` utile solo in fase d’identificazione del
modello parsimonioso, ma si rivela molto valida anche per presentare il lavoro svolto.
Sia la prima parte (dedicata al modello parsimonioso del sistema irriguo) sia la seconda parte
della tesi (dedicata al modello parsimonioso del sistema lacustre) sono infatti strutturate in capitoli,
che corrispondono a fasi o gruppi di fasi di tale procedura. Tenendo quindi come riferimento la
figura 1.2, e` possibile leggere i capitoli in maniera sequenziale, oppure approfondire solo le fasi di
maggior interesse.
Per quanto riguarda la prima parte, il Cap. 2 si occupa della prima fase, in cui viene descritto
ed analizzato il modello del sistema irriguo, del quale sono messi in evidenza gli aspetti utili
all’identificazione del modello parsimonioso. Il Cap. 3 descrive dettagliatamente lo scopo del
modello parsimonioso (fase 2) e gli output che saranno riprodotti (fase 3). Il Cap. 4 e` dedicato alle
fasi 4-5-6-7, ossia la descrizione degli input, la specificazione dell’accuratezza richiesta, la scelta
del tipo di modello parsimonioso e l’implementazione dell’experimental design. Le ultime due fasi
della procedura, cioe` l’identificazione del modello parsimonioso (fase 8) e la sua validazione (fase
9), sono infine riportate nel Cap. 5.
La seconda parte della tesi e` invece formata da un unico capitolo, formato da tante parti quante
sono le fasi della procedura d’identificazione impiegata.
Al fine di non appesantire troppo la lettura, nella parte relativa alla scelta del tipo di modello
parsimonioso (fase 6) da impiegare per entrambi i casi di studio, si riporta nei paragrafi seguenti
la descrizione della varie tipologie di modelli parsimoniosi a ‘scatola nera’ utilizzate nel presente
lavoro.
1.3 Tipologie di modelli empirici lineari e non lineari
Come anticipato nel paragrafo 1.1.2, i modelli4 empirici sono costruiti senza utilizzare nessuna
informazione a priori sul sistema fisico, ma riproducono semplicemente il legame tra ingressi u
4Per non appesantire la lettura, si usera` il termine modello al posto del termine modello parsimonioso negli ultimi
due paragrafi di questo capitolo.
14
9. VALIDAZIONE DEL
MODELLO PARSIMONIOSO
2. DETERMINAZIONE DELLO SCOPO
DEL MODELLO PARSIMONIOSO
3. IDENTIFICAZIONE DELL’OUTPUT
E DELLE SUE CARATTERISTICHE
4. IDENTIFICAZIONE DEGLI INPUT E
DEL DOMINIO DI APPLICABILITA’
DEL MODELLO PARSIMONIOSO
5. SPECIFICAZIONE DELL’
ACCURATEZZA RICHIESTA
6. SCELTA DEL TIPO DI
MODELLO PARSIMONIOSO
7. SPECIFICAZIONE DELL’
EXPERIMENTAL DESIGN
8. IDENTIFICAZIONE DEL
MODELLO PARSIMONIOSO
UTILIZZO
SI
SI
NONO
1. ANALISI CRITICA DEL
MODELLO ORIGINALE
Figura 1.2: Fasi della procedura proposta da Kleijnen et al. (2000) per l’identificazione e la
validazione di un modello parsimonioso. Le frecce continue indicano le relazioni dirette tra i vari
step, mentre quelle tratteggiate sono relative alle relazioni indirette.
15