LA COMPLESSITA' DEL PROTEOMA

Con il termine Proteoma, coniato da Mark Wilkins nel 1995, usiamo descrivere l'insieme delle proteine di un sistema biologico. Esiste così un Proteoma Completo (riferito ad uno specifico organismo), un Proteoma cellulare (riferito ad un particolare tipo di cellula) e perfino un Proteoma Sub-cellulare (solitamente riferito ai virus). Dobbiamo immaginare il proteoma come un qualcosa di dinamico, la sua composizione varia in risposta a diversi fattori esterni ed è sostanzialmente differente nei diversi tipi cellulari di uno stesso organismo. Il Proteoma è molto più grande del Genoma e mostra almeno due livelli di complessità in più:

1] La conoscenza delle proteine presenti in un sistema biologico, in termini di sequenze aminoacidiche non basta. La maggior parte delle proteine mostrano, in condizioni fisiologiche, una struttura tridimensionale stabile ed è pertanto necessario risalire alla loro struttura per poterne ben comprendere anche il loro funzionamento. Questo livello di complessità aumenta notevolmente se consideriamo anche l'esistenza di modificazioni post-traduzionali ed isoforme.

2] Le proteine possono interagire funzionalmente tra loro, con gli acidi nucleici e con piccole molecole di varia natura.

Lo studio a più livelli del Proteoma è affidato alla Proteomica, moderna area altamente multidisciplinare che richiede l’integrazione di conoscenze biochimiche, bioanalitiche, bioinformatiche e biomolecolari.

[Torna su]





PRINCIPALI PROBLEMATICHE NELLA BIOINFORMATICA DELLE PROTEINE
In parte tratto dal libro di Anna Tramontano - The ten most wanted solution in protein bioinformatics - Chapman & Hall/CRC
Relazione Evolutiva tra Proteine
[Evolutionary Relationship between Proteins]

Le sequenze di aminoacidi che costituiscono le proteine sono state selezionate dall'evoluzione per le loro favorevoli proprietà termodinamiche, cinetiche e funzionali. Variazioni nelle sequenze aminoacidiche delle proteine sono però continuamente generate da molteplici meccanismi molecolari e proteine contenenti mutazioni sono evolutivamente accettate soltanto se non deleterie e se non prevedono sostanziali effetti sulla struttura tridimensionale nativa. Su questa base, possiamo identificare relazioni di tipo evolutivo, tra proteine appartenenti a differenti specie, mediante opportune analisi computazionali che mettano in risalto i residui aminoacidici evolutivamente più conservati all'interno di una proteina. Certamente, dobbiamo distinguere tra aminoacidi che sono stati conservati per il loro ruolo funzionale ed aminoacidi che sono stati preservati per il loro ruolo strutturale.

Predizione di determinate Caratteristiche dalla Sequenza
[Predicting Protein Features from the Sequence]

La predizione e la mappatura degli elementi di struttura secondaria di una proteina, gli eventuali siti funzionali, le modificazioni post-traduzionali, i compartimenti cellulari dove la proteina risiede e molte altre caratteristiche sono specificate dalla semplice sequenza aminoacidica. Importanti funzioni possono anche essere dedotte dalla ricerca, sempre all'interno della sequenza aminoacidica, di specifici set di aminoacidi (pattern) oppure utilizzando metodi stocastici.

Predizione di Struttura
[Protein Structure Prediction]

La funzione biochimica di una proteina è soprattutto determinata dalla sua struttura tridimensionale e la struttura tridimensionale è principalmente dettata dalla sequenza lineare degli aminoacidi, come dimostrato da Anfinsen nel 1972 nei suoi ormai storici esperimenti. La struttura di una proteina può essere sperimentalmente determinata mediante due tecniche molto complesse: Cristallografia a raggi X e Risonanza Magnetica Nucleare (RMN), esse richiedono spesso lunghe tempistiche di esecuzione ed attrezzature molto costose, inoltre, non tutte le proteine esistenti in natura possono essere sperimentalmente risolte nella loro struttura 3D. Considerato che i metodi sperimentali per la determinazione della sequenza aminoacidica di una proteina sono rapidi e relativamente poco costosi, la conseguenza è che negli anni, si è costituito un enorme divario tra il numero di sequenze aminoacidiche, depositate all'interno della banca dati SWISSPROT, ed il numero di strutture ad oggi risolte, depositate all'interno della banca dati PDB, come mostrato dalla figura in basso.

Per questi motivi la bioinformatica sta facendo grandi sforzi per riuscire ad utilizzare approcci computazionali sempre più sofisticati in grado di predire, con discreta accuratezza, la struttura tridimensionale di una proteina, data la sua sequenza aminoacidica.

Predizione di Funzione
[Function Prediction]

Esistono numerosi metodi per ottenere informazioni circa la funzione di una proteina. Lo studio delle relazioni evolutive è un metodo, come lo è quello di andare alla ricerca di patterns caratteristici all'interno della sequenza aminoacidica. Moltissime informazioni possono sicuramente derivare da una conoscenza della struttura tridimensionale della proteina intera o della specifica regione in analisi (dominio). C'è da dire che ancora oggi, si ha spesso difficoltà nel definire il complesso concetto di funzione biologica, ancora per certi versi ambiguo.

Proteine di Membrana
[Membrane Proteins]

Le membrane biologiche sono complesse strutture dinamiche dove i componenti sono continuamente sintetizzati e degradati. Sono fondamentalmente costituite da lipidi e proteine tenute insieme da interazioni di tipo non covalente. La relativa abbondanza delle due componenti varia in dipendenza alla funzione svolta dalla membrana stessa. Le membrane delle cellule animali hanno una percentuale proteica approssimativa del 50%. La membrana mitocondriale interna arriva a contenere una percentuale in proteine intorno al 75%, mentre la mielina che avvolge le cellule nervose e che svolge una funzione di isolante elettrico, contiene soltanto il 25% in proteine. Le proteine di membrana svolgono svariati compiti: come trasportatori, come recettori, posseggono attività enzimatica e sono responsabili della comunicazione cellula-cellula. Non sorprende quindi l'enorme interesse che oggi viene rivolto a queste proteine. Sfortunatamente, la struttura e la funzione delle proteine di membrana è estremamente difficile da predire. Questa difficoltà ci sorprende se consideriamo che l'ambiente lipidico della membrana, limita le possibili conformazioni che una proteina può assumere. Ma questo potenziale vantaggio è più che controbilanciato da almeno due fattori limitanti: Primo, le proteine di membrana interagiscono con l'ambiente lipidico idrofobico attraverso interazioni non specifiche e quindi difficili da modellare. Secondo, la determinazione strutturale a livello sperimentale per le proteine di mambrana è più difficile rispetto a quella condotta su proteine solubili. Come risultato, il numero di proteine di membrana risolte da un punto di vista strutturale è, ad oggi, molto basso e questo limita ai bioinformatici, la possibilità di estrapolare regole utili circa il loro rapporto sequenza-struttura.

Identificazione di Siti Funzionali
[Functional Site Identification]

Le proteine effettuano molteplici funzioni che spesso sono svolte solo da particolari residui, per questo definiti "residui funzionali". Quando si parla di individuare i cosidetti residui funzionali all'interno di una proteina, possiamo riferirci ad una varietà di ruoli svolti da questi residui. In un enzima, i residui funzionali corrispondono al suo sito attivo. In altre proteine essi formano la superficie di legame per altre macromolecole. In proteine coinvolte nel trasporto selettivo di atomi o piccole molecole, essi possono essere coinvolti nella apertura o chiusura della via d'accesso. In proteine coinvolte nella trasduzione del segnale, essi modulano la trasmissione del segnale e così via. L'analisi di sequenze aminoacidiche, atte ad evidenziare la conservazione evolutiva di un pattern, all'interno di una sequenza, indica una pressione selettiva su quella regione che può essere utilizzata per studiare la presenza di residui funzionali all'interno di una proteina. Certamente, come abbiamo già detto, dobbiamo distinguere tra aminoacidi che sono stati conservati per il loro ruolo funzionale ed aminoacidi che sono stati preservati per il loro ruolo strutturale.

Interazione Proteina - Proteina e Proteina - Ligando
[Protein - Protein Interaction and Protein - Small Molecule Interaction]

Molte funzioni biologiche sono mediate da interazioni tra proteine. Queste interazioni possono essere di due tipi: fisiche (una proteina forma un complesso con un'altra proteina) o logiche (una proteina controlla il comportamento di un'altra proteina senza però stabilire una interazione fisica con essa, ad esempio, regolandone l'espressione o cambiando la concentrazione di un fattore che è percepito dalla proteina target). Il numero di algoritmi disponibili per il docking proteina-proteina è ampio, ma il numero di metodi per il docking di piccole molecole e proteine è molto più vasto. Questo non sorprende data la centralità di questo problema in molti processi biologici e considerata anche la sua applicazione in ambito farmacologico. Il docking di piccole molecole (ligandi) a proteine (recettori) viene infatti effettuato per cercare di rispondere ad una serie di domande: dove si legano queste molecole all'interno della proteina? con quale orientamento? con quale affinità? Quando le condizioni lo consentono, il docking può addirittura fornire preziose informazioni su come modificare la molecola ligando per aumentarne la sua affinità e la sua specificità con il recettore, processo noto sotto il nome di Ligand Design.

Disegno di Proteine
[Protein Design and Protein Engineering]

Le moderne tecniche di Biochimica e Biologia molecolare possono essere utilizzate per sintetizzare proteine che non esistono in natura. Possiamo quindi "disegnare" una specifica sequenza aminoacidica, produrre la corrispondente proteina e testare le sue propietà. Ma perchè dovremmo fare tutto ciò? Oggi, molte applicazioni biotecnologiche richiedono specifiche proprietà e spesso, una proteina naturale che disponga di tutte le proprietà richieste non esiste. Inoltre, questo problema raffina la comprensione circa la stretta relazione esistente tra sequenza e struttura nelle proteine e migliora la nostra capacità di predire la struttura delle proteine naturali. Le proteine che osserviamo in natura sono un prodotto dell'evoluzione e questo comporta che tali molecole presentino spesso diversi vincoli, legati alla loro funzione all'interno della cellula. Immaginiamo di disegnare una sequenza aminoacidica e di analizzarne la struttura che ne deriva, possiamo estrapolare le regole che portano un polipeptide ad assumere un determinato arrangiamento tridimensionale nel solvente, senza considerare nessun'altra costrizione. Oggi sappiamo che: proteine evolutivamente correlate preservano la loro struttura tridimensionale durante l'evoluzione e che, in molti casi, sequenze aminoacidiche evolutivamente non correlate possono formare strutture similari. Questa osservazione implica che il codice sequenza-struttura è degenerato in quanto, sequenze diverse possono essere propense a "fittare" in una medesima topologia tridimensionale. Ma non sarebbe più semplice modificare una proteina nativa e cercare di dotarla di nuove proprietà? Possiamo disegnare una sequenza aminoacidica modificata che sia abile a svolgere una funzione desiderata, certo il lavoro, anche in questo caso, è tutt'altro che semplice. Potrebbe infatti accadere che la modificazione, anche di un singolo aminoacido, non garantisca che la struttura della proeina venga preservata.

[Torna su]





PROTEINE CON PIU' DI UNA FUNZIONE

Una cosa è certa! Considerando il livello di complessità degli organismi viventi, possiamo senz'altro dire che i genomi sono notevolmente piccoli, in termini di numero di geni. Una possibile spiegazione è che il numero effettivo di proteine differenti derivate da un dato gene possa essere ampliato tramite il meccanismo dello splicing alternativo. Una ulteriore spiegazione risiede nel fatto che una data proteina può avere più di una distinta funzione biochimica.

La glucosio-6-fosfato isomerasi o PGI è il secondo enzima della glicolisi, una via metabolica essenziale che converte il glucosio in piruvato e nel quale PGI converte il glucosio-6-fosfato in fruttosio-6-fosfato. Il gene per PGI è dunque un gene presente in quasi tutti gli organismi e la sua sequenze aminoacidica è ben conservata, indicando che tale funzione biochimica è catalizzata da un singolo fold proteico. Se proviamo a prendere la sequenza aminoacidica di PGI di coniglio, e cominciamo a cercare sequenze omologhe in banca dati, oltre a PGI troveremo anche una sequenza identica chiamata neuroleuchina. La proteina neuroleuchina fu scoperta come citochina secreta dalle cellule T, coinvolta nella sopravvivenza di alcuni neuroni embrionali spinali e nella maturazione dei linfociti B. Recentemente si sono identificate altre due attività abbinate a sequenze identiche a PGI: il fattore di motilità autocrino (AMF) ed il mediatore di differenziazione e maturazione (DMM). AMF prodotto dalle cellule tumorali e stimola la migrazione delle cellule cancerose e quindi potrebbe essere coinvolto nel processo metastatico. DMM causa la differenziazione cellulare in vitro nella leucemia mieloide umana. PGI purificata di coniglio causa la stessa crescita della motilità cellulare prodotta da AMF, nonchè la differenziazione delle cellule della leucemia umana indotta da DMM. Viceversa, sia AMF che DMM hanno la stessa attività di PGI. PGI, neuroleuchina, AMF e DMM sono la stessa proteina, codificata dallo stesso gene. Si conclude che le funzioni extracellulari di questa proteina sono, almeno parzialmente, indipendenti l'una dall'altra e si sono evolute senza grosse modificazioni del fold ancestrale.

Il termine MOONLIGHTING (chiaro di luna), è stato coniato per descrivere lo svolgimento di più di una funzione da parte della stessa proteina. Con questi presupposti, la conoscenza di una funzione di un prodotto genico non implica necessariamente che sia stata acquisita la conoscenza di tutte le sue funzioni.

  • Jeffery, C. J. Crystal structure of rabbit phosphoglucose isomerase, a glycolytic enzyme that moonlights as neuroleukin, autocrine motility factor and differentiation mediator. Biochemistry 2000, 39:955-964.

[Torna su]