Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Un ambiente informatica per la valutazione dei geni rilevanti in un processo di valutazione di microarray dataset

I microarray sono uno strumento importantissimo delle così dette nanotecnologie. Introdotto nel 1996, sono tutt’ora diventati uno strumento affidale e preciso per lo studio dell’espressione genica.
L’ultimo decennio ha visto l’implementazione e la diffusione di numerosi package per l’analisi di questa tipologia di dati. Di massima, i package, possono essere classificati in tre grandi categorie.
La prima categoria è orientata all’operatore medico e permette di effettuare operazioni di definizione e regolarizzazione dell’immagine grafica fino ad estrarre da essa i dati campionati.
La seconda categoria comprende metodi per affinare i dati numerici normalizzandoli rispetto ai valori fuori range o definendo un intervallo di tolleranza al di fuori del quale il dato è considerato non valido.
La terza categoria, prevalentemente rivolta agli operatori informatici, supporta la definizione di algoritmi per effettuare operazioni di ranking e di classificazione, cioè per definire quali geni sono veramente rilevanti rispetto ad una data patologia.

Mostra/Nascondi contenuto.
INTRODUZIONE I microarray sono uno strumento importantissimo delle così dette nanotecnologie. Introdotto nel 1996, sono tutt’ora diventati uno strumento affidale e preciso per lo studio dell’espressione genica. L’ultimo decennio ha visto l’implementazione e la diffusione di numerosi package per l’analisi di questa tipologia di dati. Di massima, i package, possono essere classificati in tre grandi categorie. La prima categoria è orientata all’operatore medico e permette di effettuare operazioni di definizione e regolarizzazione dell’immagine grafica fino ad estrarre da essa i dati campionati. La seconda categoria comprende metodi per affinare i dati numerici normalizzandoli rispetto ai valori fuori range o definendo un intervallo di tolleranza al di fuori del quale il dato è considerato non valido. La terza categoria, prevalentemente rivolta agli operatori informatici, supporta la definizione di algoritmi per effettuare operazioni di ranking e di classificazione, cioè per definire quali geni sono veramente rilevanti rispetto ad una data patologia. Spesso tali packages sono di tipo generale e necessitano di essere personalizzati con procedure “ad hoc” che consentono all’operatore che utilizza il package di effettuare agevolmente alcune operazioni ricorrenti. Questa tesi si propone di presentare due procedure: una che supporta il processo ricorrente di selezione ed abbinamento non manuale di un insieme di geni già pesati da un processo di ranking; la seconda che permette di valutare e confrontare i geni ritenuti rilevanti da diversi algoritmi di feature selection (questi risultati verranno successivamente usati dai biologi). Per inquadrare meglio l’argomento verrà inizialmente presentata una descrizione dello sviluppo della stessa tecnologia dei microarray. Verranno quindi analizzate le singole fasi che portano alla nascita dei data set provenienti dalla lettura dei microarray: si partirà dalla nascita dei microarray vero e proprio per poi continuare con la presentazione dei vari metodi di normalizzazione, di feature selection e dei metodi di classificazione. Nella seconda parte della tesi verrà presentata e descritta un’applicazione scritta in Java, che ha principalmente due diversi scopi: 1. Acquisire un numero notevole di dati provenienti da una procedura di ranking e di mettere a disposizione all’utente un ambiente informatico con un interfaccia user- friendly per la combinazione di gruppi di geni ritenuti più significativi ai fini diagnostici. 2. Confrontare i dati ottenuti attraverso l’uso di diversi metodi di classificazione. 5

Laurea liv.I

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Stefano Atzeni Contatta »

Composta da 34 pagine.

 

Questa tesi ha raggiunto 1235 click dal 02/02/2011.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.