In questi appunti forniremo una solida base di conoscenze riguardanti la struttura molecolare e la funzione delle proteine. Inoltre una particolare attenzione sarà rivolta alla descrizione di come una funzionalità cellulare dipenda anche da una serie di eventi dinamici, che si realizzano in modo altamente regolato negli specifici contesti cellulari a partire dalla sintesi alla distruzione e alle modificazioni della catena polipeptidica. Vengono inoltre fornite le basi teoriche di metodologie e tecniche di uso corrente per l’identificazione e l’analisi dei diversi livelli di organizzazione strutturale delle proteine (struttura primaria, secondaria, terziaria e quaternaria).
                            
                                Struttura molecolare
delle proteine
Appunti di Simone Pisu
Università: Università degli Studi di Cagliari
Facoltà: Biologia 
Corso di Laurea Magistrale in Biologia Cellulare e Molecolare
Esame: Struttura molecolare delle proteine
Docente: Prof. Pintus
Anno Accademico 2011/2012Lezione 1 14/01/11  
 
Ci occuperemo del Folding delle proteine, ovvero dei problemi legati al ripiegamento delle proteine 
verso la conquista della struttura nativa. Alcune cose che vedremo nelle prime diapositive saranno 
un ripasso di cose già acquisite. 
 
Iniziamo con il presentare l'immagine di una cellula.  
Quando voi pensate alla cellula, oltre che pensare all'unità fondamentale di qualsiasi organismo 
vivente, quindi eucarioti e procarioti, dovete pensare al fatto che le cellule presentano una 
morfologia e soprattutto all'interno delle cellule si sviluppano intense attività metaboliche; diciamo 
che affinché una cellula possa vivere, ovviamente deve produrre attività metaboliche e l'attività 
metabolica è affidata a proteine enzimatiche e non enzimatiche. 
Se voi dovreste andare a valutare il contenuto di proteine presenti all'interno della cellula, giusto per 
rimanere bassi come valori (non  termina la frase); quindi andare a valutare il numero di proteine 
espresse all'interno della cellula, vi rendereste conto che il 50% del peso secco di una cellula è 
rappresentato dal peso delle proteine; quindi evidentemente se le proteine sono così abbondanti 
all'interno delle cellule, c'è un motivo e il motivo è che le proteine all'interno delle cellule svolgono 
delle specifiche funzioni e per poter svolgere una specifica funzione una proteina deve presentare 
una struttura nativa; quindi il binomio struttura e funzione è un binomio strettamente associato 
quando si parla di proteine: proteine enzimatiche e non enzimatiche, perché lo sapete benissimo che 
ad una determinata struttura di una proteina corrisponde una specifica funzione, e qui in questa slide 
ci sono degli esempi molto familiari su come la struttura di una proteina può condizionare la sua 
funzione. 
Sulla vostra sinistra vedete un anticorpo; voi sapete che gli anticorpi hanno strutture idonee per 
interagire con gli antigeni. Sulla destra vedete il tetramero dell'emoglobina la quale presenta, grazie 
alla presenza dell'eme, una struttura che può legare e cedere un ossigeno. Sotto vedete, anche se 
schematizzata, una proteina enzimatica. V oi sapete che tutti gli enzimi presentano una specifica 
struttura e tutti hanno un sito catalitico dove si colloca in maniera molto precisa un substrato o un 
inibitore, il quale, se parliamo di substrati, può essere trasformato in un prodotto di reazione. Quindi 
pur essendo 3 tipologie di proteine diverse, come vedete, a prescindere dalla funzione che svolgono, 
vi rendete conto che comunque hanno strutture tridimensionali molto diverse tra loro e la struttura 
tridimensionale è importante ai fini della funzione che dovrà svolgere quella proteina. 
Struttura: quando parliamo di struttura ci riferiamo ad una struttura tridimensionale, quindi per 
esempio l'emoglobina ha una struttura quaternaria costituita da 2 catene alfa e 2 beta.  
Le proteine enzimatiche possono avere o non avere questa struttura quaternaria quindi possono 
essere costituite da più monomeri o no, e anche le molecole degli anticorpi possono essere costituite 
da catene pesanti e leggere che possono associarsi oppure no; quindi quando si parla di struttura ci 
si riferisce ai 4 livelli strutturali delle proteine, ovvero:  
 struttura primaria che è la sequenza, l'ordine, con il quale sono disposti gli Aa lungo la
catena peptidica
 struttura secondaria che è la disposizione che assumono tratti di una proteina; disposizione
che può essere elicoidale o distesa. Le strutture secondarie più diffuse sono le eliche e i
foglietti , tralasciando la struttura del collagene che è tipica solo del collagene
 struttura terziaria come si evince dalla diapositiva, è la disposizione nello spazio di tratti
di proteina che sono avvolti ad elica o sono rimasti distesi come i foglietti .
 struttura quaternaria è l'associazione di più subunità per costituire una proteina diciamo
funzionalmente attiva. Le proteine possono avere una struttura quaternaria oppure no. La
struttura quaternaria è tipica di tutte quelle proteine che sono costituite da più subunità; sub
unità che possono essere identiche o diverse.
Ad una determinata struttura corrisponde una specifica funzione, ma quante funzioni conosciamo 
relativamente alle proteine? (le proteine sono le molecole più versatili presenti all'interno della 
cellula).    
Le proteine strutturali: come ad esempio la cheratina; anche il collagene è una proteina 
strutturale.  
Proteine di trasporto: l'emoglobina è l'esempio classico di proteina deputata al trasporto o al 
rilascio delle molecole di ossigeno. 
Proteina di riserva: sono anche queste ubiquitarie; ad esempio la ferritina nel ferro, l'ovoalbumina 
nell'uovo, proteine nei semi che serviranno per la germinazione (quindi stiamo parlando di proteine 
vegetali). 
Proteine recettoriali: che possono essere localizzate sulla membrana delle cellule o 
intracellularmente e svolgono ruoli fondamentali ad esempio in meccanismi di trasduzione del 
segnale. 
Proteine contrattili: quelle che sono presenti nei muscoli 
Proteine di difesa: abbiamo visto prima gli anticorpi 
Proteine ormonali: regolano il metabolismo 
Proteine enzimatiche. 
Come vedete le proteine sono le molecole veramente più versatili, svolgono un grandissimo numero 
di funzioni che possono svolgere in funzione di una struttura che possiedono.  
Quando parliamo di struttura non bisogna dimenticarsi che la struttura primaria ossia la sequenza in 
cui sono localizzati gli Aa all'interno di una molecola proteica, detta rigorosamente le regole di base 
per il ripiegamento della proteina. 
Quindi a partire da una sequenza di Aa, quindi da una struttura primaria ecco qua che, la struttura 
secondaria terziaria e quaternaria avrà una significato solo se esiste una determinata struttura 
primaria.  
Se andiamo ad osservare la struttura primaria, abbiamo detto che è data dalla sequenza di Aa, ma 
sappiamo che gli Aa, quelli che rientrano nella costituzione delle proteine, sono tutti caratterizzati 
dall'avere un atomo di C alfa al quale è legato: sempre un gruppo amminico, sempre un atomo di H, 
sempre un gruppo carbossilico, quello che cambia è la catena laterale R, catena laterale che può 
essere, come c'è scritto all'interno delle etichette colorate, idrofilica o idrofobica; idrofilica carica o 
con nessuna carica. Spieghiamoci meglio, facciamo un piccolo ripasso, esaminiamo gli Aa in base 
alle caratteristiche del gruppo R.  
Catena laterale R non polare, idrofobica: all'interno di questa lista ci sono proteine che 
presentano ovviamente delle catene laterali legate al C alfa che sono idrofobiche quindi non 
interagiscono favorevolmente con le molecole di acqua, e tra queste troviamo: la glicina che è un 
po' borderline tra idrofilica e idrofobica perché ha una catena laterale costituita da un atomo di H, 
poi abbiamo sicuramente: alanina, valina, leucina, isoleucina, metionina, prolina, fenilalanina e 
triptofano. 
Tra gli AA non carichi ma con gruppo polare, quindi gruppi che interagiscono favorevolmente 
con l'acqua, abbiamo: serina, treonina, asparagina, glutammina, tirosina, cisteina.  
Tra i gruppi polari però stavolta carichi, troviamo: la lisina, l'arginina e l'istidina possono avere 
cariche positive; acido glutamico e ac. aspartico che hanno invece carica negative e sono questi Aa, 
come c'è scritto in diapositiva, i principali responsabili della carica complessiva di una proteina.  
 
Perché secondo voi sono indicati in verde? Quindi l'alanina triptofano e istidina; in questa 
diapositiva ho voluto mettere in evidenza quelli che sono gli Aa aromatici, quindi in verde sono gli 
Aa aromatici. 
 
Come si indicano gli Aa per convenzione? forse questo non lo sapete, siccome utilizzeremo molto 
le sigle degli Aa, sarebbe il caso di iniziare a studiarle.  
Gli Aa possono essere indicati con una piccola abbreviazione che include le prime tre lettere 
dell'Aa, oppure possono essere indicati con una sola lettera.  
La glicina si indica con Gly (si utilizza la terminologia inglese), se usiamo una sola lettera si indica 
con G; l'alanina si può indicare con Ala o A; la valina con Val o V; la leucina con Leu o L; 
isoleucinca Ile o I; Metiona Met o M; prolina con Pro o P; fenilalanina con Phe o F, triptofano con 
Trp o W.  Serina Ser o S, Treonina Trh, o T, Asparagina Asn o N, glutammina Gln o Q, tirosina Tyr 
o Y , cisteina Cys o C.  Per quanto riguarda la lisina Lys o K, arginina Arg o R, istidina His o H, 
acido aspartico Asp o D, acido glutammico glu o E.  
Questi gli dovete memorizzare. 
 
 
 
Ritorniamo alla nostra struttura primaria. Torniamo a focalizzare la nostra attenzione sui gruppi R 
che identificano un Aa da un altro. I gruppi R abbiamo visto che possono essere idrofilici, a 
prescindere dalla carica, o idrofobici, e sarà proprio la catena laterale R a svolgere un ruolo 
importante quando la proteina dovrà andare incontro al suo processo di folding, ossia al 
ripiegamento verso la struttura nativa.  
Questa non è la scoperta dell'acqua calda ma solo per ricordarvi che le molecole polari sapete che 
reagiscono favorevolmente con le molecole dell'acqua, mentre le apolari tendono a sfuggire il 
contatto con l'acqua. Se voi prendete dell'olio e lo buttate dentro un bicchiere d'acqua vedete che le 
goccioline tendono ad accorparsi e questo perché tutte le molecole idrofobiche tendono ad evitare il 
contatto con le molecole di acqua. Quindi possiamo dire che la tendenza dell'acqua e dei residui 
amminoacidici non polari, a evitarsi, avrà un effetto davvero considerevole su quella che sarà la 
struttura finale di una proteina, quella che sarà la struttura nativa di una proteina.  
 
In questa diapositiva (quella sotto) è rappresentata, anche se in maniera schematica, un polipeptide 
senza struttura quindi solo la struttura primaria, e sono messe in evidenza le catene polari in blu (in 
verità sono in rosa) e le catene non polari in verde. 
 
Quando il polipeptide dovrà conquistare la sua struttura nativa avrà la tendenza a spingere verso il 
core proteico tutti gli Aa apolari. Quindi qui vedete (nella slide) c'è un nucleo di colore verde 
relativo a tutti gli Aa apolari che sono presenti lungo la sequenza, lungo la proteina, all'esterno 
rimarranno invece gli Aa polari. Quindi riepilogando: gli Aa apolari tendono a sfuggire il contatto 
con l'ambiente acquoso e tenderanno ad occupare le parti interne della proteine, quindi il core 
proteico. Gli Aa polari invece si trovano frequentemente sulla superficie esterna della proteina 
proprio per il fatto che possono interagire favorevolmente con le molecole d'acqua. Questi sono 
concetti che conoscete. 
 
Struttura primaria: facciamo un piccolo ripasso e vediamo quali sono le caratteristiche principali 
dei vari livelli di struttura delle proteine.  
Sulla struttura primaria non c'è bisogno di soffermarsi più di tanto. Avete studiato che la struttura 
primaria ovviamente, seguita dalla sequenza di Aa, è contraddistinta dal presentare un legame 
peptidico con parziale carattere di doppio legame che unisce un Aa con un altro. Quindi vogliamo 
usare un termine non proprio scientifico: il legame peptidico è un legame ingessato, gli unici 
movimenti che può assumere la molecola sono quelli intorno al legame azoto-carbonio , quindi 
l'angolo (si legge fi), e quello  (si legge psi) ovvero il legame C -C carbossilico. Ovviamente  
molecola può muoversi intorno a questi legami però tenendo conto del fatto che le catene laterali 
possono avere ingombri sterici e quindi i movimenti possono essere limitati proprio dall'ingombro 
sterico della molecola; così come sapete che il legame peptidico genera una polarità negli scheletri 
proteici; ovviamente esiste una estremità aminoterminale, una estremità carbossiterminale e 
diciamo che tutto lo scheletro è tappezzato da cariche negative e positive che sono le cariche 
presenti sui gruppi ammidici e sui gruppi carbonilici. 
 
Sulla struttura primaria non credo sia il caso di soffermarsi, soffermiamoci invece sulla struttura 
secondaria. 
La struttura secondaria è stabilizzata dalla formazione dei legami idrogeno; i legami idrogeno che 
stabilizzano la struttura secondaria delle proteine, sono quelli che si stabiliscono tra il gruppo 
ammidico NH e il carbonilico C=O, quindi per quanto riguarda la struttura secondaria non entrano 
in gioco legami idrogeno tra i gruppi R.  
La struttura secondaria: abbiamo parlato di eliche e foglietti , quindi strutture secondarie molto 
diverse. Per quanto riguarda i legami idrogeno che stabilizzano queste strutture diciamo che i 
legami idrogeno, per quanto riguarda l'elica, si stabiliscono all'interno della stessa molecola, per 
quanto riguarda i foglietti  i legami idrogeno si stabiliscono tra catene polipeptidiche diverse, 
quindi sono legami intercatena a differenza dei legami intracatena tipici della strutture ad elica. 
Affinché possa stabilirsi il legame idrogeno tra questi gruppi chimici, la distanza tra i gruppi non 
deve superare 3 Å.  
 
Sapete qual è la caratteristica del legame idrogeno? Si forma quando l'idrogeno si trova tra due 
atomi molto elettronegativi, come può essere in questo esempio,  
quindi un atomo di idrogeno, in questo caso tra un atomo di N e un atomo di O, a patto che la 
distanza non superi i 3  Å.  
 
Per quanto riguarda la formazione sempre dell' elica i legami idrogeno si stabiliscono tra Aa che 
distano 3-4 residui. Considerate che un giro di elica è costituito da 3-4 residui aminoacidici; quindi 
ogni 3-4 residui si stabilisce un legame idrogeno tra un gruppo amminico e un gruppo carbossilico e 
il giro di elica è formato da circa 3-4 residui aminoacidici.  
Detto questo mettiamo in evidenza un aspetto che possono presentare le eliche. Abbiamo detto che 
un giro di elica è costituito da 3-4 residui, quindi è ovvio che (se voi date un occhiata a questo 
disegno) i residui distanti 3-4 posizioni lungo la sequenza, giacciono sullo stesso lato dell' elica; 
questa è una conseguenza normale, è logico che tutti gli AA che distano 3-4 residui si trovino sullo 
stesso lato.  
 
Immaginiamo che ogni 3-4 residui capiti sempre di trovare nell' elica un Aa apolare da una parte, 
quindi su un lato dell' elica, e un Aa polare sull'altro lato, in questo caso l' elica prende il nome di 
elica anfipatica. Le eliche anfipatiche sono quelle che presentano un lato costituito da residui Aa 
apolari, mentre sull'altro lato giacciono tutti i residui aminoacidi polari. 
 
Foglietti : 
I foglietti beta possono essere chiamati anche strand (si pronuncia strend). In questo caso non ci 
può essere una struttura spiralizzata per il fatto che i legami idrogeno non sono all'interno della 
stessa catena ma sono tra catene differenti, come mostra la diapositiva.  
 
Quindi qui vedete una serie di catene polipeptidiche tipiche di un foglietto , in cui i gruppi 
ammidici e carbonilici interagiscono con i gruppi ammidici e carbonilici di catene polipeptidiche 
che non hanno niente a che vedere con quella catena.  
 
Le catene polipeptidiche vi ricorderete che possono avere una disposizione parallela oppure 
antiparallela; cosa significa disposizione parallela o antiparallela? Significa che, come mostrato in 
diapositiva in basso, per esempio nella disposizione parallela le catene polipeptidiche sono orientate 
nella stessa direzione: amminoterminale-amminoterminale.  
 
I legami idrogeno si stabiliscono, in caso di foglietti  paralleli, in questa maniera, quindi ogni 
residuo stabilisce un legame idrogeno con altri due. Nel caso invece dei foglietti antiparalleli, 
ovvero una catena orientata secondo l'estremità amino-carbossi e l'altra carbossi-ammino, i legami 
idrogeno in questo caso si stabiliscono: un residuo prende contatto soltanto con un altro residuo. Ci 
viene da fare una considerazione: quando i foglietti sono orientati secondo una disposizione 
parallela, ovviamente....il fatto che un residuo amminoacidico debba stabilire legami con altri due 
immediatamente non è una struttura molto stabile. A differenza dei residui di quei foglietti  in cui 
le catene peptidiche sono orientate in maniera antiparallela.  
La lunghezza minima affinché possa formarsi un foglietto , in termini aminoacidici, è di circa 6 
residui; ma un foglietto  può essere costituito anche da 15 residui aminoacidici, quindi da un 
minimo di 6 ad un massimo di 15. 
 
Abbiamo detto che le strutture secondarie principali, lasciando perdere il collagene, sono l' elica e 
il foglietto, ma manca un altro tipo di struttura secondaria a questo elenco, quale può essere l'altra 
struttura secondaria? Che poi non è una vera e propria struttura; provate a pensare ad una proteina 
nella sua struttura secondaria, sono presenti solo eliche e foglietti? Io aggiungerei i -turn.  
Sono ripiegamenti, detti anche gomiti. Sono quelle regioni presenti nelle proteine in cui non esiste 
ne una struttura ad elica ne una a foglietto. Sono delle porzioni limitate a 4-5 Aa in cui la 
proteina assume una forma di gomito o di ansa. Qui vedete un turn e qui lo scheletro del -turn. 
Nel turn questi gomiti si formano perché un Aa forma legami idrogeno con un altro residuo 
aminoacidico distante almeno 3 posizioni, però mentre nelle eliche ci sono una serie di Aa che 
interagiscono  per formare una struttura spiralizzata, nel turn è limitato solo ad un pezzettino di 
porzione polipeptidica. E in questa diapositiva vedete le 3 strutture secondarie possibili: le eliche, 
i foglietti  e i  turn che mettono in collegamento foglietti  con foglietti , foglietti  con eliche, 
quindi sono i punti diciamo di snodo, nelle proteine. 
 
 
 
Struttura terziaria: ecco che entrano in gioco le catene laterali. 
Abbiamo parlato solo di gruppi amminici e gruppi carbossilici, ecco qua che la struttura terziaria, 
ossia la disposizione nello spazio delle eliche e dei foglietti , deriva dalle interazioni che si 
stabiliscono tra le catene laterali degli Aa.  
Qui vedete si tratta quasi sempre di interazioni non covalenti, tranne ponti disolfuro che rientrano 
nelle formazioni di strutture terziare ma sono interazioni covalenti tra i gruppi SH delle cisteine. Per 
quanto riguarda diciamo i legami che si possono stabilire tra i residui aminoacidici in previsione di 
una struttura terziaria, sono: i legami idrogeno, le interazioni idrofobiche che ovviamente si 
stabiliscono tra catene laterali idrofobiche, i legami ionici, a parte i ponti disolfuro.  
I legami ionici si stabiliscono tra una catena laterale carica positivamente e una catena laterale 
carica negativamente, quindi tra un Aa basico e uno acido. Qui vedete il caso di un legame idrogeno 
che si stabilisce tra un Aa acido e un Aa che presenta una catena laterale con un gruppo ossidrilico. 
Quindi queste sono le interazioni che rafforzano la struttura di una proteina.  Quindi legami idrogeni 
a patto che la distanza di legame non superi i 3 Å, il legame ionico a patto che la distanza tra i 
gruppi non superi i 2,8 Å, e le interazioni idrofobiche o di van der Waals a patto che i gruppi non si 
trovino ad una distanza superiore di 3,5 Å. 
 
Struttura quaternaria: non tutte le proteine presentano una struttura quaternaria è esclusiva di 
quelle proteine formate da più monomeri che possono essere uniti fra loro da interazioni non 
covalenti o covalenti e nel momento che si separano, nel secondo caso (interazioni covalenti), i 
monomeri, la proteina non ha più attività biologica, quindi quando le interazioni tra i monomeri 
sono covalenti, la proteina evidentemente deve trovarsi in quella struttura quaternaria per svolgere 
la propria funzione.  
Casi di interazioni non covalenti ne avete visti tantissimi, ad esempio in biologia molecolare avete 
studiato le importine che sono quelle proteine che legano le sequenze di localizzazione nucleare, 
quindi proteine destinate al nucleo. Le importine sono costituite da due subunità:  e , che si 
uniscono tramite interazioni non covalenti solo quando devono svolgere la loro funzione e si 
dissociano nel momento in cui la proteina invece non deve veicolare dentro il nucleo le proteine o le 
sequenze di localizzazione del segnale.  
Le proteine con strutture quaternarie i cui monomeri sono uniti mediante interazioni non covalenti, 
diciamo acquistano un attività biologica nel momento in cui i monomeri si assemblano, le proteine 
invece che sono tenute insieme da interazioni covalenti perdono l'attività nel momento in cui i 
monomeri vengono separati e molto spesso non la riacquistano più. 
Come si rappresentano schematicamente le strutture secondari e delle proteine. Vi faccio vedere: 
Come avete visto poco fa le eliche possono essere rappresentate o come cilindri o come frecce e 
qui vedete la struttura tridimensionale di una proteina in cui sono evidenti le eliche mostrate come 
cilindri, i foglietti  mostrati come frecce e i  turn che collegano i vari elementi di struttura 
secondaria tra di loro. Però liche e foglietti possono essere rappresentati anche come: fettucce 
per quanto riguarda i foglietti , o come spirali per quanto riguarda le eliche. Quindi qui accanto a 
questo riquadro vedete la stessa proteina rappresentata stavolta utilizzando la rappresentazione ad 
elica o la rappresentazione con questa sorta di string che si riferiscono ai foglietti . Quindi 
eliche: eliche e cilindri; foglietti  frecce o rettangoli. 
 
 
Rappresentazione terziaria delle proteine, struttura terziaria delle proteine.  
In questo riquadro c'è scritto: l'unità fondamentale della struttura terziaria è il dominio.