Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Una metodologia per la classificazione di dati spettrometrici basata su serie temporali

Negli ultimi anni lo sviluppo di metodi avanzati per il sequenziamento del DNA, ha contribuito in modo notevole alla caratterizzazione e all’ottenimento del
genoma completo di numerosi organismi. Infatti mentre il genoma contiene le informazioni che permettono ad un organismo di vivere e riprodursi, le funzioni essenziali di una cellula sono svolte dai prodotti dei geni, le proteine. Alla genomica oggi si è affiancata la Proteomica, ovvero la scienza che studia su grande scala il proteoma, cioè l’intero contenuto proteico espresso da un genoma di una cellula, di un tessuto o di un organismo, in determinate condizioni ambientali. La proteomica si avvale di diverse tecnologie di analisi biochimiche, genetiche e informatiche che consentono di studiare le proteine e permettono di catalogarle e decifrarne le funzioni. Lo scopo della proteomica è proprio quello di fotografare, a livello proteico, in ogni istante della vita di una cellula, di un tessuto o di un organismo, l’evoluzione di tale sistema, al fine, ad esempio, di identificare dei biomarcatori importanti per la prevenzione, la diagnosi ed il trattamento di diverse patologie finora incurabili. La spettrometria di massa (MS) è un insieme di tecniche analitiche che consentono di misurare la massa molecolare di composti organici semplici o macromolecole biologiche, a patto che possono essere ionizzate. L’introduzione della spettrometria di massa in campo proteomico si registra dopo la diffusione delle tecniche di ionizzazione (es. MALDI) che hanno permesso d’ampliare l’intervallo di misura dei pesi mololecolari, consentendo di misurare il peso molecolare delle proteine. Il contributo di questo lavoro di tesi consiste nell’analisi del processo d’identificazione negli spettri di massa di picchi che possono essere associati a delle proteine discriminanti, o biomarcatori (biomarker); l’intero processo di estrazione delle informazioni sui trend caratteristici di uno spettro è supportato da un framework di classificazione basata su serie temporali (time series-based): l’idea alla base dell’approccio basato su serie temporali trova il suo fondamento nella possibilità di trasformare uno spettro in una sequenza temporale sfruttando il modello di rappresentazione Derivative Time Series Segment Approximation (DSA). Sulle serie temporali generate da spettri di massa, è possibile applicare algoritmi di data mining tipici delle time series e, in particolare, effettuare dei task di clustering per acquisire informazioni sugli elementi proteici discriminanti.

Il presente lavoro di tesi è strutturato in tre capitoli:

- Capitolo 1: si descrive lo stato attuale della ricerca per ciò che riguarda le problematiche inerenti il trattamento dei dati prodotti dall’analisi spettrometrica di massa. Si discutono, inoltre, le tematiche relative all’analisi di serie temporali, presentandone l’attuale stato dell’arte.

- Capitolo 2: viene presentato un approccio per la classificazione di dati spettrometrici basato sull’analisi di serie temporali. Si descrive una nuova metodologia di modellazione di serie temporali, denominata Derivative Time Series Segment Approximation (DSA), e viene, infine, proposto un framework per la classificazione di MS Data, incentrato sull’utilizzo della metodologia DSA.

- Capitolo 3: si espone la valutazione sperimentale dell'approccio proposto. Viene presentata la metodologia di valutazione e descritte le caratteristiche dei dataset utilizzati per gli esperimenti. Infine, vengono illustrati i principali risultati sperimentali in termini di accuratezza ed efficienza di classificazione ottenuti dal framework.
A conclusione del lavoro vengono presentate le osservazioni finali ed
evidenziati i risultati ottenuti dalla sperimentazione dell'approccio proposto.

Mostra/Nascondi contenuto.
3 Introduzione Negli ultimi anni lo sviluppo di metodi avanzati per il sequenziamento del DNA, ha contribuito in modo notevole alla caratterizzazione e all’ottenimento del genoma completo di numerosi organismi. I risultati ottenuti in questo campo hanno comunque reso chiaro che la conoscenza del genoma è solo il primo step per la comprensione dei processi cellulari che avvengono negli organismi. Infatti mentre il genoma contiene le informazioni che permettono ad un organismo di vivere e riprodursi, le funzioni essenziali di una cellula sono svolte dai prodotti dei geni, le proteine. Sono, infatti, le proteine che operano e che rendono possibile tutti i processi, sia fisiologici che patologici. Di conseguenza, alla genomica oggi si è affiancata la Proteomica, ovvero la scienza che studia su grande scala il proteoma, cioè l’intero contenuto proteico espresso da un genoma di una cellula, di un tessuto o di un organismo, in determinate condizioni ambientali. La proteomica si avvale di diverse tecnologie di analisi biochimiche, genetiche e informatiche che consentono di studiare le proteine e permettono di catalogarle e decifrarne le funzioni. Lo scopo della proteomica è proprio quello di fotografare, a livello proteico, in ogni istante della vita di una cellula, di un tessuto o di un organismo, l’evoluzione di tale sistema, al fine, ad esempio, di identificare dei biomarcatori importanti per la prevenzione, la diagnosi ed il trattamento di diverse patologie finora incurabili. La caratterizzazione del Proteoma cioè dell’insieme delle proteine di un campione biologico (siero, tessuto, cellule) avviene oggi principalmente grazie alla spettrometria di massa. La spettrometri di massa (MS) è un insieme di tecniche analitiche che consentono di misurare la massa molecolare di composti organici semplici o

Laurea liv.I

Facoltà: Ingegneria

Autore: Andrea Grande Contatta »

Composta da 84 pagine.

 

Questa tesi ha raggiunto 548 click dal 21/04/2009.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.