1.
ABL ed ARG

Proteine con alternanza di domini strutturati e regioni intrinsecamente non strutturate



INTRODUZIONE

ABL ed ARG sono gli unici membri della famiglia delle ABL Y-Chinasi non recettoriali (1). Entrambe queste proteine sono coinvolte in importanti processi molecolari all'interno della cellula e nella patogenesi di diverse forme di leucemia: Leucemia Mieloide Cronica (LMC), Leucemia Linfoblastica Acuta (LLA) e Leucemia Mieloide Acuta (LMA) (2,3). In pazienti affetti da queste patologie, a causa di specifiche traslocazioni cromosomiche, i geni ABL e ARG sono stati trovati frequentemente fusi ai geni BCR e TEL, dando luogo a proteine chimeriche di fusione che mostrano una attività catalitica chinasica costitutivamente attiva e refrattaria ai meccanismi regolatori, normalmente messi in atto dalla cellula. Questo si traduce da una parte in un aumento del segnale di crescita e proliferazione delle cellule leucemiche e, dall'altra, in una concomitante riduzione del segnale di morte cellulare (apoptosi) delle stesse, fattori che quindi conducono alla trasformazione neoplastica (4,5).

La figura in basso mostra l'organizzazione strutturale di ABL ed ARG, proteine multifunzionali che, sulla base delle attuali conoscenze, alternano domini tridimensionalmente ben strutturati a regioni intrinsecamente non strutturate.

Abbiamo immaginariamente diviso le due proteine in quattro sezioni:

ABL ed ARG presentano, nelle rispettive isoforme 1b, una regione N-terminale strutturalmente non caratterizzata conosciuta come Cap (Capping), che in ABL sembra modulare l’attività chinasica (6).

La regione Cap è seguita, in entrambe le proteine, da un Core Domain altamente conservato e ben strutturato, composto dai domini SH2, SH3 e Y-chinasico, organizzati in modo simile a quanto mostrato dai membri della SRC Kynase Family. Da diversi anni, il gruppo capeggiato da John Kuriyan, ha cristallograficamente risolto il Core Domain di ABL complessato con una variante di Imatinib (7), [PDB code: 1OPL].

Dopo il Core Domain, ABL e ARG presentano entrambe un lungo segmento, interamente codificato dall'ultimo esone, contenente diversi domini e regioni funzionali. La maggior parte di questo ultimo esone, che abbiamo chiamato bLER (bulk of Last Exon Region) non è mai stata caratterizzata strutturalmente in nessuna delle due proteine. Eppure questa estesa regione include tre PXXP motifs, tre Nuclear Localization Signals (NLS) ed un putativo DBD (DNA Binding Domain), in ABL. Tre PXXP motifs, un I/LEWQ F-Actin Binding Domain ed un MBD (Microtubule Binding Domain), in ARG.

In entrambe le proteine, la porzione C-terminale dell'ultimo esone codifica per un ABD (Actin Binding Domain) che in ABL mostra al suo interno una sequenza Nuclear Exportation Signals (NES). Recentemente, il gruppo capeggiato da Superti-Furga ha cristallograficamente risolto la struttura dell' ABD di ABL (8), [PDB code: 1ZZP].

ARG PRESENTA UN C-Terminal ABD CON UN ARRANGIAMENTO SPAZIALE OMOLOGO AL CORRISPONDENTE DOMINIO DI ABL

Abbiamo inizialmente effettuato una serie di analisi computazionali preliminari atte a stabilire la fattibilità di un lavoro di modelling sul non caratterizzato C-terminal ABD di ARG. L'identità in sequenza del 42% tra questa regione di ARG e la corrispondente regione di ABL, cristallograficamente risolta dal gruppo di Superti Furga, ha permesso di avviare un lavoro di Computational Homology Modelling. Il file di coordinate atomiche della molecola scelta come templato [PDB Code: 1ZZP-A] è stato ottenuto dalla Brockhaven Protein Data Bank (http://www.pdb.org) ed opportunamente trattato, per eliminare le molecole di acqua e altre molecole non necessarie dal set di coordinate, prima del modelling. Il modello tridimensionale del suddetto dominio è stato manualmente costruito utilizzando una workstation OCTANE della Silicon Graphics corredata del software INSIGHT II (Accelrys, San Diego, CA). Per informazioni più dettagliate sulle principali fasi operative di un Homology Modelling, consultare la sezione Bioinformatics Laboratory.

Una volta ottenuto il modello, sono state effetuate le opportune analisi strutturali, le catene laterali conservate sono state lasciate nella specifica conformazione del templato e qualche urto intramolecolare, derivante dalla sostituzione dei residui, è stato risolto utilizzando una opportuna libreria di rotameri che descrive le conformazioni spaziali più comuni per ogni aminoacido, fino a quando nessun urto è stato più rilevato. Il modello tridimensionale finale del C-terminal ABD di ARG è stato successivamente validato utilizzando i programmi VERIFY-3D e PROCHECK per verificarne la corretta geometria degli angoli diedrici ed il rispetto di alcune regole chimico-fisiche. PROCHECK fornisce una accurata analisi del modello tridimensionale prodotto e alcuni parametri, riferiti al nostro modelo (G factor -0.05, Hydrogen bond energy 0.7 e soltanto 0.3 bad contacts ogni 100 residui), sono stati evidenziati a dimostrazione della buona qualità della struttura prodotta.

Il meccanismo di esporto nucleare di una proteina richiede il riconoscimento di una breve regione segnale NES, generalmente ricca in residui di leucina, da parte di un trasportatore noto come CRM1 (esportina-1) (9). L'esposizione e la disposizione di questi residui di leucina all'interno della regione NES sono fattori critici per l'interazione della proteina con CRM1 e la conseguente fuoriuscita dal nucleo. I dati forniti dal modello strutturale del C-terminal ABD di ARG, hanno evidenziato come questo presenti un arrangiamento spaziale a quattro eliche, omologo al corrispondente dominio di ABL e contenente, al suo interno, una putativa regione NES strutturalmente sovrapponibile alla medesima regione di ABL. Questo è un dato affascinante se consideriamo il fatto che nessun NLS e mai stato evidenziato in ARG e numerosi articoli descrivono questa proteina come principalmente citoplasmatica.

Modello computazionale del C-terminal ABD di ARG (immagine dorata a sinistra), un "four helix bundle up and down". Sovrapposizione strutturale tra il modello generato ed il suo rispettivo templato (colorato in blu), RMSD (Root Mean Square Deviation) di 1.073 Å, calcolata sui carboni alfa. Le immagini dei modelli strutturali sono state renderizzate per la pubblicazione utilizzando Pymol v.9.98 - DeLano Scientific LLC, South San Francisco, CA.

Questa regione NES di ARG presenta tre residui di leucina lungo la parte interna della terza alfa elica, non esposti al solvente e perfettamente sovrapposti a quelli presenti nella medesima regione di ABL, figura in alto a destra. Diversamente da ABL, la regione NES di ARG presenta anche un quarto residuo di leucina (L1145), corrispondente in ABL all' N1111, completamente esposto al solvente, dato confermato anche dal calcolo di accessibilità al solvente specifico sul residuo (65,8 Å2). Questo potrebbe suggerire che la regione NES di ARG potrebbe essere funzionale e contribuire quindi alla localizzazione intracellulare della proteina.

ABL ED ARG PRESENTANO UNA ESTESA REGIONE INTERNA NATIVELY UNFOLDED

Comparando tra loro una serie di analisi computazionali incrociate condotte sulle regioni Cap e bLER di ABL e di ARG ci hanno portato ad ipotizzare, per queste regioni, l'assenza di strutture tridimensionali stabili in condizioni fisiologiche (10). Dimostrare in maniera significativa la condizione di Natively Unfolded per una regione proteica, più o meno estesa, è tutt'altro che semplice e numerose analisi di diversa natura e complessità sono spesso necessarie. Analizzeremo in questa sede una delle fondamentali procedure computazionali di analisi, normalmente applicata alle regioni intrinsecamente astrutturate, riferita all'estesa regione bLER sia di ARG (circa 500aa) che di ABL (circa 510aa).

Un semplice calcolo della composizione aminoacidica delle due regioni bLER, evidenzia un marcato arricchimento di queste zone dei residui "promuoventi il disordine" (A, R, G, Q, S, P, E e K): 70,255% per ABL e 64,000% per ARG, come mostrano le rispettive tabelle in basso. Viceversa, nelle medesime regioni, assistiamo ad una carenza di residui "promuoventi l'ordine" (W, C, F, I, Y, V, L and N) (11).

La semplice composizione aminoacidica riferita alle regioni di interesse da sola non è però sufficiente a dare una chiara visione della particolare composizione di queste zone. E' necessario utilizzare uno specifico approccio sviluppato per le proteine intrinsecamente astrutturate (12), dove, i dati composizionali calcolati, vengono riferiti a quelli di un set di proteine strutturalmente ordinate, così da evidenziarne le differenze composizionali. Si genera così quello che viene chiamato Amino acid Compositional Profile.

I grafici realizzati sono stati manualmente calcolati è sono il risultato finale di questo approccio dove, ogni istogramma rappresenta la differenza frazionata tra una data regione ed un insieme di proteine strutturalmente ordinate, per ogni residuo aminoacidico. La differenza frazionata è calcolata come (Disordered – Ordered) / Ordered [(D – O) / O], dove Disordered è il contenuto di uno specifico aminoacido all'interno della regione considerata e Ordered è il corrispondente valore riferito ad un set di proteine strutturalmente ordinate (7290 sequenze aminoacidiche di proteine incluse in PDB). Un picco negativo indica che la regione analizzata è carente di quei residui in riferimento al set di proteine strutturalmente ordinate, mentre un picco positivo ne indica un arricchimento. I residui aminoacidici sono ordinati in accordo alla Vihinen’s flexibility scale (13), dove ogni aminoacido è posizionato all'interno del grafico sulla base della sua crescente flessibilità (B-factor) ed i picchi colorati in nero evidenziano i residui promuoventi il disordine.

REFERENZE BIBLIOGRAFICHE:

  1. Manning G, Whyte DB, Martinez R, Hunter T, Sudarsanam S. The protein kinase complement of the human genome. Science 2002;298(5600):1912-1934.
  2. Heisterkamp N, Stam K, Groffen J, de Klein A, Grosveld G. Structural organization of the bcr gene and its role in the Ph' translocation. Nature 1985;315(6022):758-761.
  3. Cazzaniga G, Tosi S, Aloisi A, Giudici G, Daniotti M, Pioltelli P, Kearney L, Biondi A. The tyrosine kinase abl-related gene ARG is fused to ETV6 in an AML-M4Eo patient with a t(1;12)(q25;p13): molecular cloning of both reciprocal transcripts. Blood 1999;94(12):4370-4373.
  4. Ren R. Mechanisms of BCR-ABL in the pathogenesis of chronic myelogenous leukaemia. Nat Rev Cancer 2005;5(3):172-183.
  5. Okuda K, Oda A, Sato Y, Nakayama A, Fujita H, Sonoda Y, Griffin JD. Signal transduction and cellular functions of the TEL/ARG oncoprotein. Leukemia 2005;19(4):603-610.
  6. Pluk H, Dorey K, Superti-Furga G. Autoinhibition of c-ABL. Cell 2002; 108:247-259.
  7. Schindler T, Bornmann W, Pellicena P, Miller WT, Clarkson B, Kuriyan J. Structural mechanism for STI-571 inhibition of abelson tyrosine kinase. Science 2000;289(5486):1938-1942.
  8. Hantschel O, Wiesner S, Guttler T, Mackereth CD, Rix LL, Mikes Z, Dehne J, Gorlich D, Sattler M, Superti-Furga G. Structural basis for the cytoskeletal association of Bcr-Abl/c-Abl. Mol Cell 2005;19(4):461-473.
  9. Sweitzer TD, Love DC, Hanover JA. Regulation of nuclear import and export. Curr Top Cell Regul. 2000;36:77-94.
  10. Uversky VN, Gillespie JR, Fink AL. Why are "natively unfolded" proteins unstructured under physiologic conditions? Proteins 2000;41(3):415-4.
  11. Romero P, Obradovic Z, Li X, Garner EC, Brown CJ, Dunker AK. Sequence complexity of disordered protein. Proteins 2001;42(1):38-48.
  12. Dunker AK, Lawson JD, Brown CJ, Williams RM, Romero P, Oh JS, Oldfield CJ, Campen AM, Ratliff CM, Hipps KW, Ausio J, Nissen MS, Reeves R, Kang C, Kissinger CR, Bailey RW, Griswold MD, Chiu W, Garner EC, Obradovic Z. Intrinsically disordered protein. J Mol Graph Model 2001;19(1):26-59.
  13. Vihinen M. Relationship of protein flexibility to thermostability. Protein Eng 1987;1(6):477-480

[Torna su]