Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Sperimentazione di tecniche di information retrieval e machine learning nello splice junction recognition

Il tirocinio è consistito nella sperimentazione di tecniche informatiche di Information Retrieval e di Machine Learning su un dominio biologico.

Negli ultimi anni Informatica e Biologia hanno subito un'inaspettata convergenza che ha portato allo sviluppo di nuove metodologie che si avvalgono delle conoscenze informatiche per semplificare la gestione di dati in campo biologico. Difatti queste informazioni, prima dell'avvento dell'informatica diffusa su larga scala, erano difficilmente gestite ed elaborate, ed inoltre la loro memorizzazione risultava quasi impossibile. La fusione tra queste due discipline è stata ribattezzata Bioinformatica.
L'Informatica ha apportato alla Biologia quel supporto indispensabile attraverso il quale molti gruppi di ricerca, composti da esperti di entrambi i settori, hanno raggiunto risultati di grande rilievo, il più recente e importante dei quali è sicuramente la decodifica del DNA umano attraverso lo Human Genome Project.
In questo vasto settore, alcuni gruppi si stanno occupando della classificazione di sequenze di DNA con presenza di Splice Junction e attraverso la recente applicazione delle tecniche di Machine Learning, stanno cercando di semplificare il procedimento di riconoscimento dei segnali nei geni eucarioti, sistema attualmente troppo oneroso e complesso. Lo scopo è di aprire la strada ad una futura e possibile classificazione rapida nella quale, durante tutte le sue scelte, il biologo sia costantemente affiancato e guidato dal calcolatore,adeguatamente istruito.
Il lavoro da me svolto ha avuto come obiettivo la sperimentazione dell'applicazione di tecniche informatiche di Information Retrieval nel processamento di sequenze di DNA con presenza di Splice Junction, estratte da un dataset biologico reale. La prima di tre fasi ha avuto come scopo quello di creare delle rappresentazioni concettualmente nuove e più efficienti delle sequenze di DNA da apprendere, rispetto a quelle comunemente utilizzate in letteratura, attraverso un adeguato preprocessamento. A tale fase è seguita quella di classificazione dei dati ricavati, attraverso algoritmi di Machine Learning allo stato dell'arte. Infine l'ultima fase è servita a testare e valutare i risultati ottenuti.
Si è cercato di trattare i dati biologici con tecniche normalmente applicate alla gestione dei testi o delle immagini, ma realizzate partendo da basi biologiche e di classificarli con tecniche di Intelligenza Artificiale. L'attività ha così dato modo di ricavare utili informazione circa l'applicabilità di questi procedimenti ad un futuro riconoscimento automatico delle sequenze di DNA interessate dal fenomeno delle Splice Junction e si sono potute verificare o smentire le ipotesi fatte per via teorica.

Mostra/Nascondi contenuto.
Capitolo 1 Introduzione Il presente lavoro è il risultato di un'attività di tirocinio interna alla Facoltà di Ingegneria Informatica dell'Università degli Studi Roma Tre, protrattasi dal Dicembre 2007 al Maggio 2008 e mirata al conseguimento della Laurea di Primo Livello in Ingegneria Informatica. Il tirocinio è consistito nella sperimentazione di tecniche informatiche di Information Retrieval e di Machine Learning su un dominio biologico. Bioinformatica Negli ultimi anni Informatica e Biologia hanno subito un'i- naspettata convergenza che ha portato allo sviluppo di nuove metodologie che si avvalgono delle conoscenze informatiche per semplificare la gestione di dati in campo biologico. Difatti queste informazioni, prima dell'avvento del- l'informatica diffusa su larga scala, erano difficilmente gestite ed elaborate, ed inoltre la loro memorizzazione risultava quasi impossibile. La fusione tra queste due discipline è stata ribattezzata Bioinformatica. L'Informatica ha apportato alla Biologia quel supporto indispensabile attraverso il quale molti gruppi di ricerca, composti da esperti di entrambi i settori, hanno raggiunto risultati di grande rilievo, il più recente e importante dei quali è sicuramente la decodifica del DNA umano attraverso lo Human Genome Project. 1

Laurea liv.I

Facoltà: Ingegneria

Autore: Emanuele Goffredo Contatta »

Composta da 96 pagine.

 

Questa tesi ha raggiunto 1183 click dal 15/09/2009.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.