Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Sviluppo di algoritmi paralleli per l’analisi di ”storie” simulative

Uno dei problemi più importanti a cui la Bioinformatica è chiamata a fornire risposte è quello del cosiddetto protein folding : si tratta di determinare la struttura tridimensionale delle proteine a partire dalla conoscenza della loro struttura primaria. Questo problema è diventato ancora più pressante dopo la mappatura del genoma di varie specie viventi, che ci può fornire la struttura primaria di un gran numero di proteine ancora sconosciute. Infatti è la struttura 3D che rende le proteine funzionanti e non esiste ancora una metodologia prevalente per
individuarla a partire dalle informazioni della loro sequenza di aminoacidi.
La simulazione meccanico-statistica è una delle tecniche adottate per acquisire dettagli altrimenti difficilmente ottenibili ed utili alla comprensione a livello microscopico dei meccanismi coinvolti nel funzionamento di sistemi biomolecolari complessi (quali le proteine durante la fase di folding ).

Questa tecnica è molto efficace ma può comportare enormi richieste sia di potenza elaborativa, sia di spazio per l’immagazzinamento (storage ) di grandi quantità di dati. E’ possibile trovare risposta alle esigenze di potenza elaborativa conducendo su aggregati di macchine (cluster s) simulazioni e analisi dei dati.

Sul cluster Linux di PC di cui disponiamo sono state effettuate simulazioni di un frammento attivo della fibronectina (FN13), una proteina di notevole rilevanza biologica: essa è coinvolta infatti nella migrazione cellulare durante lo sviluppo, nella regolazione della crescita delle cellule e nella loro differenziazione e nella crescita dei tumori.

Scopo principale del lavoro di tesi è stato quello di progettare e implementare versioni parallele di programmi, precedentemente codificati in modo seriale, per l’analisi statistica dell’evoluzione temporale (”storia” simulativa) della struttura e della dinamica dei sistemi simulati, come appunto il frammento FN13, del quale sono state studiate diverse forme.

In fase implementativa è stato opportuno rispettare alcuni requisiti:
• il linguaggio prescelto è il Fortran77 per motivi di coerenza con il codice originale.
• per la parallelizzazione del codice sono state scelte le librerie MPI nella
versione MPICH in quanto compatibile con vari moduli del pacchetto AM-
BER, scelto per condurre le simulazioni su piattaforma Linux (il sistema
operativo installato sui PC).
• il cluster è gestito con openMosix che fornisce ottimi strumenti per una
agevole amministrazione del sistema e si è rivelato utile anche per la realizzazione del progetto.

La parallelizzazione di uno di tali programmi (quello che analizza la mobilità del solvente) è stata realizzata secondo tre diversi approcci o ”modelli” per quanto concerne la distribuzione del lavoro sui nodi del cluster. L’efficienza di ciascuna delle tre versioni è stata misurata attraverso numerose prove condotte sul cluster.

I risultati dei test indicano che il modello più efficiente è quello che trae vantaggio dalla presenza del filesystem di openMosix, benchè sia stata disabilitata la feature più interessante messa a disposizione da questo software, ossia la ”migrazione dei processi”. Ciò si è reso necessario in quanto essa interferiva con il normale funzionamento del programma usato per eseguire la simulazione (cioè il modulo SANDER del pacchetto AMBER).

Il guadagno derivante dalla parallelizzazione, in termini di tempo e di ottimizzazione dell’uso delle risorse, si è rivelato rilevante. Inoltre lo schema può essere considerato paradigmatico in quanto è adottabile per parallelizzare tutta una serie di altri programmi aventi analoga struttura ma con richieste computazionali anche più elevate.

L’esperienza accumulata indica anche che probabilmente è possibile ottenere ulteriori miglioramenti, analizzando più approfonditamente l’interazione fra i vari software coinvolti e risolvendo eventuali reciproche incompatibilità.

Mostra/Nascondi contenuto.
Sommario Uno dei problemi più importanti a cui la Bioinformatica è chiamata a fornire risposte è quello del cosiddetto protein folding : si tratta di determinare la strut- tura tridimensionale delle proteine a partire dalla conoscenza della loro struttura primaria. Questo problema è diventato ancora più pressante dopo la mappatura del genoma di varie specie viventi, che ci può fornire la struttura primaria di un gran numero di proteine ancora sconosciute. Infatti è la struttura 3D che rende le proteine funzionanti e non esiste ancora una metodologia prevalente per individuarla a partire dalle informazioni della loro sequenza di aminoacidi. La simulazione meccanico-statistica è una delle tecniche adottate per acquisire dettagli altrimenti difficilmente ottenibili ed utili alla comprensione a livello mi- croscopico dei meccanismi coinvolti nel funzionamento di sistemi biomolecolari complessi (quali le proteine durante la fase di folding). Questa tecnica è molto efficace ma può comportare enormi richieste sia di potenza elaborativa, sia di spazio per l’immagazzinamento (storage) di grandi quantità di dati. E’ possibile trovare risposta alle esigenze di potenza elaborativa conducendo su aggregati di macchine (clusters) simulazioni e analisi dei dati. Sul cluster Linux di PC di cui disponiamo sono state effettuate simulazioni di un frammento attivo della fibronectina (FN13), una proteina di notevole rilevanza biologica: essa è coinvolta infatti nella migrazione cellulare durante lo sviluppo, nella regolazione della crescita delle cellule e nella loro differenziazione e nella crescita dei tumori. Scopo principale del lavoro di tesi è stato quello di progettare e implementare versioni parallele di programmi, precedentemente codificati in modo seriale, per l’analisi statistica dell’evoluzione temporale (”storia” simulativa) della struttura e della dinamica dei sistemi simulati, come appunto il frammento FN13, del quale sono state studiate diverse forme. viii

Laurea liv.I

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Gian Paolo Ghilardi Contatta »

Composta da 103 pagine.

 

Questa tesi ha raggiunto 840 click dal 22/09/2005.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.