Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Teoria e ricerca di patterns in biosequenze

I metodi computazionali introdotti in questi anni hanno dato origine alla biologia molecolare computazionale, settore dell'algoritmica che studia problemi di carattere biologico, primo tra tutti la classificazione delle molecole di DNA/RNA e proteiche in insiemi detti "famiglie"

Mostra/Nascondi contenuto.
4 Introduzione La biologia molecolare è una scienza che studia la funzione e la composizione delle molecole preposte ai processi vitali mediante esperimenti di laboratorio; con il progetto “genoma umano” lanciato il 1 o ottobre 1990 negli Stati Uniti tale branca della biologia si è talmente arricchita di dati che i metodi tradizionali sono diventati ormai obsoleti e insufficienti per risolvere tutte quelle problematiche inerenti la decodifica e l’estrazione di caratteri genetici. Per questo si è reso necessario l’introduzione di strumenti combinatori che permettano l’eliminazione dei dati non necessari: infatti nelle stringhe decodificate di DNA ed RNA sono presenti grandi quantità di caratteri che non hanno alcuna validità dal punto di vista biologico. I metodi computazionali introdotti in questi anni hanno dato origine alla biologia molecolare computazionale, settore dell’algoritmica che studia problemi di carattere biologico, primo tra tutti la classificazione delle molecole di DNA, RNA e proteiche in insiemi detti “famiglie”. Una famiglia è un insieme di sequenze caratterizzate dalle stesse proprietà funzionali, strutturali o evolutive, e tali sequenze possono essere di due tipi: quelle di DNA ed RNA costituiscono le sequenze “nucleotidi”, mentre quelle degli amminoacidi sono dette sequenze “proteiche”. Tale distinzione è necessaria ai fini della decodifica: infatti l’alfabeto delle sequenze nucleotidi è costituito da 20 caratteri chiamati “basi” mentre quello delle sequenze proteiche ha solamente 4 caratteri detti “amminoacidi”. Le informazioni di cui parlato sopra sono in pratica delle stringhe di basi o amminoacidi che chiameremo “patterns”. In pratica da un dato insieme di biosequenze ritenute avere delle proprietà biologiche comuni si vogliono estrarre tutti i patterns possibili e le loro occorrenze, cioè le posizioni in cui tali patterns si presentano. Quando un pattern è proprio di una famiglia di biosequenze e non è presente in nessun altra stringa conosciuta è detto “diagnostico” per quella famiglia, mentre se un pattern è tipico di una famiglia ma è presente anche in altre sequenze non contenute in essa è detto “motivo” per la famiglia. Il problema è che i patterns diagnostici tendono molto facilmente a diventare motivi in quanto con la decodifica di nuove biosequenze si possono trovare stringhe che vadano bene per quel dato pattern pur non avendo le caratteristiche salienti della famiglia cui esso è associato e quindi il pattern da diagnostico si trasformerebbe in motivo.

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Desir Franchin Contatta »

Composta da 92 pagine.

 

Questa tesi ha raggiunto 1020 click dal 27/04/2004.

 

Consultata integralmente una volta.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.