1
1. Introduzione
1.1 Le Inteine
Le Inteine sono proteine composte da un numero di amminoacidi molto
variabile, compreso tra 128 e 800 definite anche introni di proteine (in analogia agli
introni di RNA) grazie alla loro capacità di mediare un processo di splicing(Y. Anraku
et al. 2009) (Figura 1.1-1). Ad oggi non è noto il ruolo biologico di queste proteine; il
fatto che esse siano state ritrovate in tutti e tre i domini filogenetici (eucarioti, archea,
procarioti) suggerisce che losplicingproteicoabbia unaantica origineevolutiva (Liu XQ,
Annu Rev Genet.2000). Le inteinesono state ritrovate inproteinecon
funzionidiverse,tra cuienzimi metabolici, DNA e RNA polimerasi, proteasi,
ribonucleotideriduttasie ATPasi ditipovacuolare (Bowman EJ et al. J Biol Chem.
1988). Tuttavia,gli enzimicoinvolti nella replicazionee riparazione del DNAsembrano
essere piø ricchi di inteine. (Gogarten et al.BMC Evol Biol 2006). La distribuzione
filogenetica delleinteineè sporadica(Pietrokovski S. Trends in Genetics 2001) (Figura
1.1-2). La presenza di uninteinain un particolare genenon significa necessariamenteche
unomologaesteinadauna specie simileo ceppoavrà la stessa inteina. In questo
momento,non è chiarose il modello didistribuzione delle inteinerappresentila perdita
diinteineantiche oacquisizionipiørecentidiinteinea causa dellamobilità del gene stesso.
In molti casianalizzati,il “codonusage”ed il contenutoGCdelleinteineè diverso
dallaregioneesteina circostante,suggerendo unarecentetrasmissione
orizzontale.Organismi che hannoun gran numero diinteinepossono averle acquisite
perchØ(1) possono facilmente prendereil DNAdall'ambiente(naturalmentecompetente),
(2) per la presenza di virus inazione,elementidi coniugazione, plasmidi ecc. che
hannoampicampi diaccoglienza,o (3)perchØ ci sonoefficientimacchinari di conversione
genica e supporto, sistemi di riparazionerotturee /o sistemi diricombinazione(Liu XQ,
Annu Rev Genet.2000).
La prima inteina è stata scoperta nell'enzima ATPasi dei vacuoli del lievitoS.
cerevisiae(Hirata 1990, Kane 1990). Fu trovato infatti un inserimento in frame nel
gene VMA1; la sequenza nucleotidica del gene faceva prevedere che la proteina
corrispondente fosse composta da 1071 amminoacidi per un peso di circa 118 kDa, ma
di fatto la proteina che si otteneva aveva una dimensione di 67 kDa. Le sequenze
amminoacidiche nelle regioni C- e N- terminale della proteina erano molto simili alle
subunità catalitiche d
mostrava somiglianze
una endonucleasi di
veniva mantenuto nell’mRN
eliminato in un processo post traduzionale. Per analogia agli introni ed esoni del pre
mRNA, il segmento interno della proteina
(internalproteinsequence
(externalproteinsequence
esclusione dell’inteina fu chiamato
importante notare che il processo di
perchØ si verificasenzacofattoriofonti di energiaesterni
oggi sono incluse nel database InBase curato dalla ricercatrice, la dott.ssa
FrancinePerler, che per prima ha studiato questo processo.
Figura
subunità catalitiche di ATPasi vacuolari di altri organismi; la sequenza
mostrava somiglianze con altre subunità delle ATPasi note, mentre risultava simile ad
una endonucleasi di S. cerevisiae codificata dal gene HO. L’inserimento
veniva mantenuto nell’mRNA che veniva tradotto nella proteina
eliminato in un processo post traduzionale. Per analogia agli introni ed esoni del pre
il segmento interno della proteina, fu denominato inteina
internalproteinsequence)e i segmenti esterni furono definiti esteine
externalproteinsequence). Il processo che porta alla ricombinazione delle esteine ed
esclusione dell’inteina fu chiamato splicing (Perler FB et al. Nucleic Acids 1994
importante notare che il processo di splicingdelle proteineè un processo
senzacofattoriofonti di energiaesterni. Tutte le inteine scoperte ad
oggi sono incluse nel database InBase curato dalla ricercatrice, la dott.ssa
FrancinePerler, che per prima ha studiato questo processo.
Figura 1.1-1. Processo di splicingpost-traduzionale delle inteine.
2
i ATPasi vacuolari di altri organismi; la sequenza interna non
mentre risultava simile ad
codificata dal gene HO. L’inserimento in frame
A che veniva tradotto nella proteina VMA1 e poi veniva
eliminato in un processo post traduzionale. Per analogia agli introni ed esoni del pre-
fu denominato inteina
furono definiti esteine
). Il processo che porta alla ricombinazione delle esteine ed
Nucleic Acids 1994). E’
è un processo auto-catalitico
Tutte le inteine scoperte ad
oggi sono incluse nel database InBase curato dalla ricercatrice, la dott.ssa
3
Figura1.1-2. Distribuzionefilogenetica delleinteinenelle diverse specie. L’albero è unarappresentazione schematica
dellarelazionetra le specieil cui interogenoma è stato completamenteo quasisequenziato. Innero, leinteine
nonrilevate; Inrosso, la presenza diinteine; Ingrigio, le inteine assenti nelle specieil cuigenoma ènon del
tuttosequenziato.
1.2 Struttura delle inteine
Le inteine sono classificate in due grandi gruppi in base alle loro dimensioni:
inteine grandi e mini-inteine. Le prime contengono un dominio endonucleasico
caratterizzato da motivi delle famiglie DOD e HNH di endonucleasi di inserimento
(homing endonucleases). Queste inteine sono proteine bifunzionali con un dominio di
splicing e un dominio centrale endonucleasico. Le mini inteine mancano del dominio
endonucleasico. E’ stato dimostrato che è possibile ingegnerizzare mini-inteine a
partire da grandi inteine eliminando il dominio endonucleasico senza perdere in
efficienza di splicing. Questa scoperta è una conferma del fatto che il dominio
endonucleasico non è coinvolto nello splicing. (Chong e Xu 1997, Derbyshire 1997,
Shingledeckder 1998). Lo studio di un elevato numero di inteine ha permesso di
4
identificare blocchi conservati e caratteristiche comuni alla maggior parte delle inteine.
(Figura 1.2-1).
Come evidenziato in figura 3, ai fini dello splicing è molto importante la presenzadei
quattroresidui conservati nella giunzionedi splicing:
- Serina, TreoninaoCisteinaall’ N-terminale dell’inteina
- lldipeptideIstidina-AsparaginaoIstidina-GlutamminaalC-terminale dell’inteina
- Serina, TreoninaoCisteinasuccessive alsito di splicinga valle (all’N-terminale della
C-esteina)
Figura 1.2-1. Motivi conservati nelle inteine (in alto) e mini-inteine (in basso). I residui che partecipano alla
reazione di splicing dell’inteina sono evidenziati in rosso (appartenenti all’inteina) e in blu (residui sull’esteina).
I motivi conservati sono divisi in blocchi: Blocchi A, B,C, D,E, H, F, G (Pietrokovski
1994 ePerler1997)oblocchiN1, N3, EN1, EN2, EN3, EN4, C2 e
C1,rispettivamente(Pietrokovski 1998). I blocchiN2e N4non sono ben conservatinella
maggior parte delleinteine(Pietrokovski1998). I blocchiA,N2, B, N4, F e G
sonocoinvolti nellosplicingdelle proteine ed infatti sono comuni alle grandi e alle
mini-inteine. I blocchiC, D, E e H sonoparte del dominio diendonucleasi di inserimento
DOD (homing endonuclease domain). Questi blocchi del dominioendonucleasico
tendono ad essere piøconservatirispetto aimotividi splicinge sono utilizzati per
l’identificazione di nuove inteinea partire dalla struttura primaria di una proteina.
Tuttavia, la presenzadi dominiendonucleasicinon è sufficiente perclassificareuna
5
proteinacomeinteina, dal momento che molteendonucleasisonofree-standingosi
trovano inintroni. Mini-inteine che mancano di questi motiviDODsono quindipiø
difficili daidentificare,soprattuttoquando contengonosequenze non-consenso in
posizioniconservate(Perler, F. B. 2002).
1.3 Meccanismi di splicing
Ad oggi sono note tre classi di inteine. La classe piø studiata e meglio
caratterizzata delle inteine è la classe 1. Un allineamento di alcune sequenze di
proteine appartenenti a questa famiglia è riportato in Figura 1.3-1 per mettere in
evidenza i residui conservati.
Figura 1.3-1. Allineamento inteine di classe 1. In azzurro i residui conservati; In rosso i residui conservati
importanti per il meccanismo di splicing.
Per la classe 1 di inteine il meccanismo di splicing ad oggi accettato prevede le
seguenti reazioni (Figura 1.3-2):
1) La giunzione di splicing all’ N-terminale dell’inteina viene attivata da un
riarrangiamento acilico N-O o N-S che muove la N-esteina verso la catena laterale
della serina / cisteina all’ N-terminale dell’inteina formando l’intermedio lineare estere
/ tioestere.
2) Amonte il legameestere/tioestereèattaccato, durante unareazione di trans-
esterificazione,dal gruppo ossidrile/tiolodei residui serina/treonina/cisteina della C-
esteina, con conseguente scissioneall’N-terminaledella giunzionedi splicing e il
trasferimento dellaN-esteina allacatena lateraledella C-esteina sui residui di
serina/treonina/cisteina, formando un intermedio ramificato.
3) L’intermedio ramificatosi risolve con la ciclizzazionedella asparagina al C-terminale
dell’inteinaper formareun anellosuccinimidico, con conseguente scissione delC-
terminaledella giunzione di splicing.L’ anello succinimidico può essere idrolizzato per
formare asparagina oisoasparagina.Inalcune inteine è presente un residuo di