Argomenti Trattati:

[1] Concetti Introduttivi
[2] RASMOL - guida all'uso

VISUALIZZAZIONE MOLECOLARE 3D CON RASMOL - Parte 1
Autore: Pietro BUFFA

OTTENERE RASMOL

RasMol è un ottimo visualizzatore molecolare per analisi grafica tridimensionale su: Acidi nucleici, proteine e piccole molecole con la particolarità di possedere una elevata velocità di esecuzione, un motore grafico basato sulle librerie OpenGL ed una vasta rosa di interessanti funzionalità. RasMol è disponibile per tutte le principali architetture hardware, se non lo avete ancora installato, provvedete al Download seguendo questo link al sito ufficiale:

http://www.bernstein-plus-sons.com/software/rasmol


ORGANIZZAZIONE STRUTTURALE DELLE PROTEINE

Utilizzeremo il programma RasMol per effettuare alcune semplici analisi su una determinata proteina modello, che utilizzeremo a scopo dimostrativo. E' opportuno quindi, prima di procedere alle analisi, spendere alcune parole sulla organizzazione strutturale delle proteine, rimandando, quanti di voi fossero interessati ad approfondire questo affascinante quanto complesso argomento della biochimica, a prendere visione di alcuni manuali specifici, uno tra tutti: Struttura e Funzione delle Proteine - Gregory A. Petsko, Dagmar Ringe - edito dalla ZANICHELLI (2006), ben organizzato e ricco di informazioni aggiornate.

LIVELLI STRUTTURALI DELLE PROTEINE

La successione degli aminoacidi nella catena polipeptidica (Sequenza Aminoacidica), prende il nome di Struttura Primaria. Gran parte delle sequenze aminoacidiche si trovano avvolte in strutture regolari e compatte, dette Strutture Secondarie, i cui elementi principali sono l' α-elica (Alpha helix) ed il filamento β (Beta strand). Più filamenti β possono unirsi a formare un foglietto β (Beta sheet). L' α-elica è una struttura cilindrica nella quale la catena polipeptidica si ripiega ad elica, in genere destrorsa, con le catene laterali dei residui esposte verso l'esterno. Questa struttura è stabilizzata da legami idrogeno che si formano tra gruppi NH e CO della catena principale appartenenti ai residui in posizione i ed in posizione i + 4, dove i rappresenta la generica posizione di un residuo aminoacidico nell'elica. Nelle proteine globulari la lunghezza delle eliche varia tra i 4 ed i 40 residui. Il foglietto β è composto da filamenti β che possono provenire anche da regioni non consecutive nella sequenza. I filamenti che costituiscono il foglietto possono trovarsi tra loro paralleli o antiparalleli ed in conseguenza di ciò i foglietti β si definiscono paralleli, antiparalleli o misti. Il foglietto β è stabilizzato da legami idrogeno tra i gruppi NH e CO della catena principale di filamenti β adiacenti. Nelle strutture proteiche, le α-eliche ed i filamenti β sono collegati da regioni a forma di ansa (loop), di lunghezza variabile e forma irregolare. Le strutture secondarie possono quindi disporsi in modo ordinato a formare semplici Motivi Strutturali (due eliche unite da un loop, due filamenti adiacenti uniti da un loop, etc). Più motivi strutturali possono anche combinarsi tra loro a formare strutture compatte e funzionali dette Domini. Il ripiegamento dell'intera catena peptidica, che può anche comprendere uno o più domini, si indica in genere con il nome di Struttura Terziaria. Molte proteine sono costituite da una singola catena polipeptidica e sono perciò dette monomeriche, altre proteine possono invece essere costituite da più catene polipeptidiche e sono perciò dette: dimeriche, trimeriche, tetrameriche, ... multimeriche. L'insieme delle catene polipeptidiche che compongono una proteina definiscono la Struttura Quaternaria.


PROTEIN DATA BANK E FILEs DI COORDINATE ATOMICHE

La banca dati di riferimento per strutture molecolari di interesse biologico è PDB (Protein Data Bank), attualmente situata presso la RCSB - Rutgers University USA. La banca dati attualmente (Febbraio 2008) contiene circa 48.778 strutture risolte che comprendono: strutture proteiche, complessi di proteine con acidi nucleici o altri ligandi e strutture di acidi nucleci (DNA ed RNA).

Per effettuare studi di tipo strutturale su una qualunque molecola (es. una proteina), abbiamo bisogno di due cose: 1] Un particolare file, generalmente chiamato "file di coordinate atomiche", per la molecola di interesse 2] Possedere un programma in grado di interpretare questo file e renderizzare a video una struttura tridimensionale dinamica della molecola in questione. Il programma di visualizzazione RasMol è adatto allo scopo, vediamo quindi come ottenere il file che utilizzeremo per i nostri studi.

Collegatevi alla banca dati PDB cliccando sul seguente link: http://www.pdb.org

La molecola che cerchiamo è la proteina RAS, enzima della famiglia delle GTP-asi monomeriche coinvolte nella trasmissione di segnali che stimolano la proliferazione ed il differenziamento cellulare. Diversi studi hanno evidenziato l'importanza di tale proteina anche a livello oncologico dimostrando come il gene RAS è solitamente alterato nel 35% circa delle neoplasie umane. Possiamo avviare una Ricerca per ID, ovvero per codice identificativo della molecola (se lo si conosce), oppure fare una semplicissima Ricerca di tipo testuale per parola chiave.

Inseriamo la parola chiave "ras" nell'apposita casella di testo posta nella regione superiore della pagina PDB principale. Il motore di ricerca trova 319 strutture. E' necessario quindi raffinare la nostra ricerca cliccando sulla voce: "Modify / Refine this Search", nel menù di sinistra. Si apre un'area grigia, come quella mostrata dalla figura in basso, che rende possibile l'inserimento di ulteriori parametri di restrizione della ricerca. Inseriamo, ad esempio, come "Experimental Method" tutte le strutture risolte mediante X-RAY. Cliccando sul bottone "Evaluate Subquery" otterremo il numero di strutture risolte con questa tecnica, presenti in banca dati: 36.421.

Cliccando invece sul bottone "Evaluate Query" otterremo il numero di strutture che rispondono ai nostri due parametri di restrizione inseriti. Il numero delle strutture trovate scende a 267. Potremmo raffinare ancora di più la nostra ricerca, inserendo degli ulteriori parametri di restrizione, ma ci fermiamo qui. La proteina con il codice identificativo 121P, fa al caso nostro. Diciamo subito che ogni molecola in PDB possiede un codice identificativo alfanumerico costituito da 4 elementi, una piccola immagine, alcune brevi informazioni e 3 piccole icone: L'icona raffigurante una freccia serve per scaricare il relativo file di coordinate atomiche, nel nostro caso trattasi del file 121P.pdb. L'icona raffigurante un foglio con del testo da una visione del file di coordinate atomiche. L'icona raffigurante un occhio avvia un visualizzatore molecolare senza troppe pretese (JMOL), per fornire subito una visione 3D della molecola. Cliccando invece sulla figura, si accede a tutta una serie di dettagli sulla molecola in questione.

Prima di scaricare il relativo file 121P.pdb, che utilizzeremo per le analisi con RasMol, clicchiamo sulla piccola icona raffigurante un foglio con del testo in modo da vedere come è organizzato un file di coordinate atomiche PDB. Ogni file è essenzialmente diviso in due parti: La prima parte contiene generalmente la descrizione della molecola, l'autore, i dettagli sperimentali, la risoluzione della struttura, la lista dei residui aminoacidici, le referenze etc. La seconda parte contiene le coordinate di ogni atomo che costituisono la molecola, organizzate in colonne, vediamole in dettaglio analizzando un tratto di file. Andando da sinistra verso destra il file è così organizzato:

  • [ATOM] Una delle parole chiave (TAG) che identificano ogni riga del file
  • Numero Atomo
  • Nome Atomo
  • Nome Residuo aminoacidico
  • Numero Residuo aminoacidico
  • Se la proteina è multimerica esisterà anche una colonna contenente il numero della catena
  • Coordinate atomiche X, Y, Z (espresse in Angstrom)
  • Parametri di interesse cristallografico (Occupancy e Beta Factor)

Adesso che conosciamo meglio la struttura di un file di coordinate atomiche PDB, provvediamo ad effettuare il Download del file 121P.pdb sul nostro computer. La maniera più semplice è quella di cliccare sull'icona raffigurante una freccia, vicino alla molecola di interesse. Una volta scaricato il file, è sempre possibbile vederne il contenuto, ed all'occorrenza anche modificarlo, utilizzando un qualsiasi editor di testo.

[Torna su]