BIOLOGIA STRUTTURALE: Introduzione alla disciplina

Tutto ebbe inizio nel 1958. A quel tempo tutta l’attenzione della scienza era rivolta al DNA ed agli studi condotti, solo pochi anni prima, da James Watson e Francis Crick. Prima di quella data, alle proteine veniva data pochissima importanza, definendole spesso come delle sostanze colloidali dalla struttura casuale. Prorpio in quegli anni, un giovane ricercatore di nome John Kendrew, servendosi della cristallografia a raggi X, riesce a definire in modo completo la struttura atomica della Mioglobina di Capodoglio, dimostrando che la proteina presentava una disposizione degli atomi ben ordinata, necessaria a definirne la sua funzione (Nobel per la chimica nel 1962). Quella data segna una delle più grandi rivoluzioni della biologia e la nascita di una branca che, ancora oggi, continua ad influenzare il modo di vedere e studiare le proteine: la Biologia Strutturale.

La nostra comprensione riguardo al modo in cui una proteina assume una struttura tridimensionale stabile che gli permetta di svolgere la sua funzione è, sotto diversi aspetti, ancora incompleta. Questo rende difficile istruire dei software che siano in grado di predire con esattezza l’organizzazione tridimensionale di una proteina a partire dalla sequenza aminoacidica. La parola “difficile” non deve però scoraggiarci: sofisticati computer sono a lavoro 24 ore su 24 per cercare di studiare in dettaglio il complesso processo di folding con lo scopo di approfondirne la sua conoscenza, le bache dati sono oggi sempre più ricche di informazione 3D e metodi computazionali di predizione strutturale sono sempre più in grado di avvicinarsi alla realtà.

Questo panorama fa ben sperare… ed è proprio per questo motivo che la presente sezione cerca di dare spazio a diversi approcci computazionali, orientati allo studio dell’organizzazione tridimensionale delle proteine.



L'IMPORTANZA DELL'INFORMAZIONE 3D - Topic in Prossima Pubblicazione...



PROTEINE INTRINSECAMENTE NON STRUTTURATE
[Natively Unfolded Protein]

L'affermazione per cui una proteina, per esercitare una data funzione, richieda una ben determinata organizzazione strutturale non vuol dire necessariamente che tutte le proteine presenti all'interno della cellula posseggano una struttura definita per tutto il tempo. Mediante diverse tecniche sperimentali, un gran numero di proteine hanno, parzialmente o completamente, evidenziato una condizione non strutturata, con assenza di globularità e di elementi di struttura secondaria, sotto condizioni fisiologiche. Nella cristallografia a raggi X, tecnica di eccellenza utilizzata per risalire alla struttura tridimensionale di una proteina, accade spesso che alcune regioni della molecola risultino non visibili nelle mappe di densità elettronica e questa anomalia potrebbe esser dovuta a regioni non stabilmente strutturate, bensì disordinate e flessibili. Un particolare tipo di spettroscopia, definita in Dicroismo Circolare (DC), può fornire una precisa informazione sulla presenza/assenza di strutture secondarie e persino la dimensione idrodinamica di una proteina ritenuta non strutturata può essere misurata e comparata con quella di tipiche proteine globulari dalla corrispondente massa molecolare.









Generica rappresentazione di una proteina non strutturata notare la scarsità di elementi di struttura secondaria lungo la sequenza aminoacidica


La complessità operativa e l'enorme richiesta di risorse per le analisi sperimentali sopracitate, hanno indotto i bioinformatici allo sviluppo di algoritmi e procedure computazionali specificatamente indirizzate alla caratterizzazione di questa particolare classe di proteine. La predizione di stati disordinati all'interno di una proteina è infatti perfettamente possibile mediante l'implementazione di metodi di apprendimento automatico ma anche mediante approcci statistici basati sulla particolare composizione aminoacidica della sequenza. Mediante l'utilizzo di questi metodi, diversi studi hanno messo in evidenza come circa il 30% delle proteine presenti in Swiss-Prot, contengano lunghi segmenti non strutturati (>50 aminoacidi) e come più del 15% delle proteine risultino essere completamente non strutturate. Inoltre, questi valori aumentano con l'aumentare della complessità dell'organismo considerato, risalendo la scala evolutiva, dati che fanno riflettere sul come queste particolari proteine sembrano rappresentare più di una trascurabile frazione del proteoma. Si è soliti riferirsi a queste proteine con tre termini dal significato praticamente analogo:

- Natively Unfolded - Weinreb et al. 1996
- Intrinsically Unstructured - Dyson et al. 1999
- Intrinsically Disordered - Dunker et al. 2000

Disordine e flessibilità all'interno di molte proteine sono dunque caratteristiche notevolmente conservate nell'evoluzione e questo sembra suggerire importanti significati funzionali:

1] Una proteina flessibile può essere una semplice soluzione per avere una larga interfaccia intermolecolare. Proteine flessibili possono legare anche diversi substrati (spesso DNA), con alta specificità e bassa affinità (considerato il dispendio energetico per il folding prima del legame). Possono inoltre offrire una vasta superficie di interazione in grossi complessi molecolari funzionali e la flessibilità intrinseca sembra essere un impotante prerequisito per il riconoscimento molecolare (molecular recognition). Queste proteine sono infatti spesso coinvolte in importanti processi biologici che vanno dal controllo del ciclo cellulare, alla regolazione trascrizionale e traduzionale, alla modulazione di varie attività e persino all'assemblamento di altre proteine.

2] L'emivita di queste proteine all'interno della cellula è breve. Questo potrebbe rappresentare un meccanismo di rapido turnover di importanti molecole regolatorie.

3] Generalmente, le proteine disordinate evolvono più rapidamente rispetto a quelle ordinate. Shaiu et al. (1999) notò che le regioni disordinate presenti nella TOPOISOMERASE II mostrano un elevato numero di sostituzioni aminoacidiche (substitution rate) e più inserzioni e/o delezioni, rispetto alle regioni ordinate della stessa molecola.

Tutti questi effetti sono certamente responsabili dell'esistenza delle Natively Unfolded Proteins e del grande interesse che la comunità scientifica mostra verso questa particolare classe di proteine. Procedure computazionali di diverso genere, ormai largamente utilizzate, possono mettere in evidenza, con elevati livelli di attendibilità, regioni disordinate all'interno di una proteina ed evitare quindi ai biologi strutturali sprechi di tempo e di risorse.

[Torna su]





STRUTTURE PROTEICHE METASTABILI
[Prioni, Amiloidi e Serpine]

Il concetto che la struttura tridimensionale di una proteina sia determinata essenzialmente, a livello locale, dalla sua sequenza aminoacidica è, come sappiamo, alla base di molti metodi di predizione. Benchè tale concetto appaia valido per la maggior parte delle sequenze, con la crescita delle banche dati strutturali sono stati individuati un certo numero di eccezioni. Alcune piccolissime e particolari sequenze aminoacidiche, con lunghezza fino a sette residui, presentano una conformazione ad alfa elica nel contesto di un fold proteico, ma possono assumere struttura a filamento beta quando situati nel contesto di una proteina con differente struttura complessiva. Tali sequenze sono generalmente chiamate SEQUENZE CAMALEONTE, per la loro tendenza a cambiare stato in accordo con il contesto. La capacità di una sequenza aminoacidica di convertirsi da una conformazione ad alfa elica a un'altra a filamento beta ha, ormai da alcuni anni, ricevuto particolare attenzione considerando che un tale cambiamento strutturale può indurre molte proteine ad autoassemblarsi nelle cosidette fibrille amiloidi, causando numerose malattie letali.

L'esistenza delle sequenze camaleonte riflette un principio generale per cui non tutte le sequenze aminoacidiche danno necessariamente luogo ad un'unica struttura. Alcune strutture possono infatti essere considerate METASTABILI, capaci cioè di interconvertirsi tra più strutture stabili differenti. Benchè ciò accada raramente in natura, la maggior parte dei casi è spesso associata a gravi patologie.

Tra queste strutture mutevoli, quelle forse meglio caratterizzate riguardano i PRIONI associati alla malattia di Creutzfeldt - Jakob (CJD) nell'uomo ed all' Encefalopatia Spongiforme Bovina (BSE) nelle pecore e nei bovini. Prione, acronimo di "PRoteinaceus Infective ONly particle" = particella infettiva solamente proteica, è il nome attribuito da S. B. Prusiner nel 1982 ad un "agente infettivo non convenzionale" di natura proteica, privo di acidi nucleici in quanto resistente a trattamenti in grado di degradarli ma sensibile alle proteasi. Il prione è una particolare proteina, con la capacità di ripiegarsi in modo erroneo, dando origine ad un fold stabile diverso da quello presentato dalla forma normale pur possedendo la stessa sequenza aminoacidica. La conformazione differente di queste proteine, solitamente molto più ricca di strutture secondarie di tipo beta rispetto alla forma normale, condurrà a proprietà chimico-fisiche differenti.







PrPsc = proteina della scrapie di criceto A sinistra la proteina normale - A destra la proteina infettiva


Il contatto con la forma erroneamente strutturata causa, nella controparte normale, profondi cambiamenti conformazionali che portano alla formazione di aggregati proteici citotossici, quasi interamente costituiti dalla forma proteica errata. Benchè gli eventi molecolari che portano a questi cambiamenti conformazionali sono scarsamente compresi, si hanno evidenze del fatto che la forma erroneamente strutturata agisca come da "stampo", dirigendo la forma normale verso un riarrangiamento strutturale errato. Questo comportamento "infettivo" da parte di queste proteine è alla base della formazione di aggregati proteici caratteristici di un gruppo di circa 20 patologie che includono: l'Alzheimer, il Parkinson ed il diabete di tipo II. Ciascuna patologia è associata ad una proteina particolare e si ritiene che aggregati extracellulari di tali proteine siano l'origine diretta o indiretta delle condizioni patologiche associate alla malattia. E' interessante notare che i cosidetti depositi amiloidi caratteristici di queste malattie possono essere formati anche da proteine ben note quali: lisozima e la transtiretina, dotate di un fold ben definito e stabile ma che possono dar luogo ad aggregati fibrosi prevalentemente basati su filamenti beta. Studi recenti hanno evidenziato come la capacità di subire una ristrutturazione con formazione di depositi amiloidi non è caratteristica unica di una particolare classe di proteine, ma può essere osservata in molte proteine sotto condizioni di laboratorio particolari, come ad esempio un basso valore di pH. Una conclusione che discende da tali osservazioni è che i prioni possano differire dal vasto gruppo delle proteine cellulari "normali", solo per avere sequenze aminoacidiche che possono subire un tale rimodellamento spontaneamente, in condizioni fisiologiche. Chiaramente, stando così le cose, è possibile che una mutazione puntiforme possa convertire una proteina innoqua in una proteina che può ristrutturarsi spontaneamente, tali mutazioni sono state individuate in associazione con alcune delle patologie da depositi amiloidi. A differenza di virus e batteri, i prioni rimangono "infetti" anche con trattamenti ad altissime temperature, dopo bombardamento con radiazioni o immersi in formaldeide. Recentemente, l'attenzione della comunità scientifica in questo settore si sta spostando su alcuni dati che sembrano dimostrare un rapporto tra prioni ed alcune forme di cancro.

La plasticità strutturale di molte proteine può anche essere parte della loro normale funzione. In questi casi, come spesso accade, il legame con un ligando o una modificazione a seguito di una proteolisi, guidano la transizione di una forma strutturale in un'altra. Forse il migliore esempio di riarrangiamento strutturale, causato da proteolisi, si trova nella famiglia degli inibitori proteici delle proteasi chiamati SERPINE. Vediamo più in dettaglio di cosa si tratta. Le nostre cellule devono spesso utilizzare strumenti pericolosi. Costruiscono molti tipi di enzimi per realizzare demolizioni, come le nucleasi che rompono DNA ed RNA, le amilasi che rompono i carboidrati, le lipasi che spezzano i lipidi, e le proteasi che smontano le proteine. Queste molecole distruttive sono necessarie in molte situazioni: 1) nella digestione, per rompere le macromolecole del cibo in frammenti utilizzabili. 2) Sono usati nella difesa, per attaccare i virus e i batteri. 3) Sono utilizzati nella demolizione di molecole difettose o inutili all'interno delle cellule. 4) Vengono utilizzati anche nelle segnalazioni, per attivare determinate molecole quando giunge un messaggio. Questi enzimi sono quindi essenziali quando sono usati al momento giusto, ma possono provocare disastri se vanno fuori controllo. Per controllare queste macchine distruttive, le nostre cellule costruiscono un insieme di proteine per bloccare la loro azione e neutralizzare il pericolo. Le serpine sono una classe di queste molecole, progettate per cercare e distruggere alcune specifiche proteasi alla serina. Il nome deriva dalla loro funzione: SERina Protease INhibitor.

Le serpine sono delle macchine molecolari che funzionano in modo simile alle trappole per topi, complete di esca e braccio a molla. Sono proteine metastabli, cioè solo parzialmente stabili nella loro forma attiva e possono "scattare", per assumere una forma molto più stabile, quando trovano una proteasi bersaglio. Sono state studiate più di trenta serpine umane diverse, ognuna con un compito essenziale. Alcune controllano il processo della coagulazione del sangue: la antitrombina limita l'azione della trombina quando si forma il coagulo e la antiplasmina limita l'azione della plasmina quando i coaguli di sangue vengono degradati. Altre serpine controllano l'azione delle proteasi usate nel sistema complementare che ci protegge dalle infezioni batteriche. Quando le serpine falliscono, possono provocare gravi danni. Una serpina può essere difettosa, così da non essere più capace di bloccare il suo bersaglio molecolare lasciando le proteasi libere di compiere devastazioni. Questo avviene nell'enfisema polmonare, quando la alfa-1-antitripsina è difettosa e permette alla elastasi di distruggere il tessuto connettivo dei polmoni. In alternativa, il meccanismo di trappola delle serpine, mostrato di seguito in maggior dettaglio, può condurre ad un altro problema. Dopo che il tratto di catena viene rotto, si può avere una associazione con altre molecole di serpina, producendo grossi aggregati. Se questi si formano all'interno delle cellule nervose, possono bloccare la funzione nervosa e condurre alla demenza.

MECCANISMO D'AZIONE: La SERPINA alfa-1-antitripsina

Il filamento flessibile delle serpine, evidenziato nello schema sottostante in rosso, è noto come il centro reattivo della molecola e funge sia da esca che da braccio a molla della "trappola". La proteasi bersaglio, mostrata in verde, si lega all'esca e comincia a compiere la sua normale reazione di taglio della catena proteica. Normalmente a questo punto dovrebbe intervenire una molecola di acqua, per liberare la proteasi dalla sua molecola bersaglio. Invece la serpina prende il controllo prima che la sfortunata proteasi possa liberarsi. Il filamento flessibile, ora tagliato e libero di muoversi, scatta portandosi all'interno di una vasta fenditura sul lato della serpina e trascinando con se la proteasi dall'altro lato. Il filamento della serpina, diviene il filamento centrale di un foglietto beta posto al centro della molecola (evidenziato in blu), formando una struttura molto più stabile che blocca la proteasi mantenendola in uno stato di tensione contro il fondo della serpina. Questo deforma il sito attivo della proteasi, tanto da renderlo inattivo.



Queste straordinarie strutture cristallografiche mostrano una immagine iniziale e una finale dell'azione della alfa-1-antitripsina: sulla sinistra, archivio PDB: 1K9O, il complesso serpina-proteasi prima che scatti la trappola, sulla destra, archivio PDB: 1EZX, il complesso dopo che è scattato, il filamento è stato tagliato e la proteasi è stata trascinata all'altro lato della serpina

La molecola si trasforma quindi in un facile bersaglio per l'apparato cellulare che spazza via le proteine difettose che così distrugge sia la proteasi che la serpina, un enzima che quindi può agire una sola volta.

[Torna su]