INTRODUZIONE 11
Per simulare la produzione uno ad uno delle proteine si e` divisa la sequenza
primaria in sottostringhe. Su ogni sottostringa si e` applicato un algoritmo
di minimizzazione energetica, supponendo che la struttura gia` formata non
potesse essere soggetta ad ulteriori modifiche.
In bioinformatica un approccio simile viene indicato come metodo ab ini-
tio. In realta`, per evitare di visitare tutto lo spazio delle conformazioni e di
girarvi a zonzo, si e` deciso di aggiungere al nostro modello la conoscenza a
priori sulle strutture secondarie. Ci si e` avvalsi di software gia` esistente, per-
che´ affidabile piu` di quanto non possa essere un nuovo tool che si sta testando,
affinche` si potesse verificare l’ottimalita` o meno del modello proposto.
Perche´ si studia il problema del folding? Esistono tre possibili piani di
risposta alla domanda, ma anche altri. Il primo potrebbe essere la passione
per la scoperta, il gusto della ricerca, il desiderio di conoscere un meccanismo
naturale ancora in parte ignoto, ad esempio. Un secondo piano di risposta e`
lo sviluppo della ricerca, perche´ un problema cos`ı vasto e complesso, e bello
puo` diventare lo slancio per nuove scoperte di, ad esempio, algoritmi, modelli
di funzionamento e di simulazione, metodi di indagine. Un terzo orizzonte
di risposta porta all’idea di una scienza che sia a servizio dell’uomo, cioe` che
possa essergli d’aiuto, in linea con le esigenze umane. Sono tante, oggi, le
malattie la cui origine non e` esterna all’organismo, ma interna; va ricercata
nel corredo genetico di una persona. Una malattia passa quando la causa sca-
tenante viene tolta, ma in questo caso la causa scatenante risiede in qualche
difetto del DNA, genetico o dovuto a fattori ambientali. Il difetto genetico
si manifesta quando l’informazione arriva alle proteine, che non possono piu`
svolgere la loro funzione, perche` diverse. Ecco che il delicato equilibrio inter-
no del corpo salta e insorgono malattie che spesso implicano la morte certa.
Diventa evidente l’importanza che assume la predizione del folding proteico:
potrebbe far capire dove intervenire, quando e come. Inoltre, simulazioni che
riescano a fornire dati esatti sono utili per velocizzare il processo di produ-
zione di farmaci, e qui si esce dal campo della proteomica e si entra in quello
della farmacogenomica.
Il percorso seguito in questo elaborato e` molto lineare e intuitivo, e ha
come linea guida la proteina. Si e` iniziato con l’idea di non astrarre l’argo-
INTRODUZIONE 12
mento folding dal contesto biologico originale, quindi si e` preferito innanzi-
tutto introdurre con il primo capitolo il mondo microscopico della cellula,
soffermandosi sugli elementi che entrano in gioco nella biosintesi proteica, e
quindi si e` introdotta la proteina insieme agli altri costituenti.
Questa e` una tesi di bioinformatica, quindi e` impensabile escludere dalla
trattazione qualche disciplina inerente. Anzi si e` preferito integrare i capitoli,
evitando di dividere il testo in sezione biologica e sezione informatica, cos`ı il
secondo capitolo introduce la bioinformatica e in particolare le banche dati
biologiche, strumento di grande utilita` per le comunita` di ricercatori o per
i curiosi, per poter ottenere informazioni delle piu` varie su una proteina o
in generale su una biomolecola. Dopo aver visto dove le proteine nascono e
spesso vivono, cioe` la cellula, si e` deciso di analizzare il processo di biosintesi
proteica, partendo dalla basilare legge secondo cui l’informazione genetica
puo` viaggiare solo dal DNA alle proteine e non viceversa.
Quindi si e` discusso delle proteine, della loro struttura, di come sono
organizzate: tutto questo nel capitolo quarto, dove si e` accennato anche a
malattie che nascono dal misfolding. Il capitolo quinto entra nel vivo del-
l’argomento predizione di strutture. Qui si sono presentate prima le tecniche
sperimentali che permettono di ottenere la struttura tridimensionale di una
proteina, e poi si e` scesi nella trattazione di algoritmi e tecniche di predizio-
ne di strutture proteiche. Questo capitolo anticipa l’ultimo dove, infine, si e`
discusso del lavoro che questa tesi presenta.
Capitolo 1
Biologia Cellulare e Molecolare
Sulla terra esistono miliardi di esseri viventi dalle forme, dimensioni, com-
plessita`, origini, delle piu` svariate. Tutti questi viventi, pero`, sono accomu-
nati a livello microscopico dal loro costituente di base: la cellula. La cellula si
puo` definire come la piu` piccola unita` vivente. Senza cellula non puo` esserci
vita.
Caratteristica essenziale della cellula e` il materiale genetico in essa con-
tenuto, DNA( Acido DeossiriboNucleico) e RNA( Acido RiboNucleico), che
dirige le attivita` di una cellula e le consente di riprodursi, trasmettendo i
suoi caratteri ereditari ai discendenti.[1] Le cellule possono essere divise in
Figura 1.1: Paramecio
procariote ed eucariote, in base alla organizzazione del materiale genetico
e alla loro struttura: le cellule procariotiche, batteri e cianobatteri, sono
13
CAPITOLO 1. BIOLOGIA CELLULARE E MOLECOLARE 14
caratterizzate dall’assenza di un nucleo separato, tipico invece delle cellule
eucariotiche, quelle degli organismi complessi.
Figura 1.2: Escherichia coli
La cellula puo` esistere singolarmente (organismi unicellulari) o come com-
ponente di organismi pluricellulari, animali e vegetali. Le dimensioni variano
in media nell’ordine dei micrometri. La forma varia moltissimo, in rapporto
alla funzione.
1.1 La struttura delle cellule
La cellula e` separata dal suo ambiente esterno dalla membrana cellulare
(detta anche membrana plasmatica), struttura essenziale per la vita di una
cellula. La membrana dei procarioti e` circondata da una parete cellulare
Figura 1.3: Cellula eucariote animale
CAPITOLO 1. BIOLOGIA CELLULARE E MOLECOLARE 15
esterna fabbricata dalla cellula stessa. Alcune cellule eucariote, tra cui quelle
delle piante e dei funghi, dispongono di una parete cellulare strutturalmente
differente da quella dei procarioti; le altre cellule eucariote, tra cui quelle del
nostro corpo e di altri animali, non hanno parete cellulare.
L’interno della cellula e` costituito dal citoplasma, che contiene una gran-
de varieta` di molecole e di strutture dette organuli circondati da membrane
interne, e immersi in una sostanza gelatinosa detta citosol.[3] Queste struttu-
re specializzate compiono funzioni vitali nella cellula. Ad esempio i ribosomi
concorrono alla produzione di proteine.
Figura 1.4: Cellula eucariote vegetale
Infine incontriamo la parte centrale di una cellula: il nucleo per gli eu-
carioti o il nucleoide per i procarioti. Il nucleo e` diviso dal citoplasma da
una doppia membrana e contiene DNA sparso o sotto forma di cromosomi,
e proteine necessarie alla sua gestione; mentre il nucleoide e` una regione
individuabile nella cellula procariote contenente il DNA in un’unica grossa
molecola.
1.1.1 La Membrana Cellulare
La membrana plasmatica racchiude il contenuto della cellula e costitui-
sce una barriera tra l’ambiente intracellulare e l’ambiente extracellulare. Le
membrane interne hanno la stessa composizione della membrana cellulare.
CAPITOLO 1. BIOLOGIA CELLULARE E MOLECOLARE 16
Questa e` costituita da un doppio strato continuo di molecole di fosfolipidi,
e attraversata parzialmente o completamente da numerose proteine. I fosfo-
lipidi sono acidi grassi formati da una testa di glicerolo legato a un gruppo
fosfato, e da due code di acidi grassi.[4] Le code di acidi grassi sono idrofobe
e sono rivolte verso l’interno della membrana, mentre le teste idrofile sono
rivolte verso le estremita`.
Le proteine mediano le diverse funzioni della membrana. Se la attraver-
sano completamente, contengono una parte idrofoba, e sono dette proteine
transmembrana. Altre proteine sono esposte solo su una faccia del doppio
strato, oppure sono legate direttamente ai lipidi di membrana. Il tipo e la
quantita` di proteine presenti varia da membrana a membrana, conferendo la
capacita` di svolgere funzioni differenti. Dunque membrane di cellule diverse o
di organelli diversi avranno una composizione proteica differente e, in misura
minore, anche una composizione variabile di lipidi. Inoltre, sulle due super-
fici della membrana cellulare troveremo considerevoli differenze nella com-
posizione chimica. In molti casi, lo strato esterno e` particolarmente ricco di
Figura 1.5: Membrana cellulare
glicolipidi: le catene di carboidrati di queste molecole sporgono, come le teste
fosfato dei fosfolipidi, sulla superficie della membrana, mentre le code idrofo-
be composte dagli acidi grassi si trovano all’interno. Sul lato citoplasmatico
della membrana altre molecole proteiche, note come proteine periferiche di
membrana, aderiscono ad alcune delle proteine sporgenti. Dal lato esterno
della membrana corte catene di carboidrati sono legate covalentemente alle
proteine sporgenti. Queste catene insieme a quelle dei glicolipidi, formano un
rivestimento di carboidrati sulla superficie esterna delle membrane di molti
tipi di cellule.