BIOLOGI O INFORMATICI

Finalmente, anche nel nostro paese, si sente adesso la necessità di formare e reclutare giovani ricercatori bioinformatici con capacità creative ed innovative, in grado di supportare gli sperimentali nella ricerca e fornire loro consulenza, tenendoli sempre aggiornati sugli sviluppi del settore. Risulta evidente il grosso impegno didattico necessario per offrire al mercato una figura professionale completa ed autonoma nel settore, le cui competenze bio-molecolari (Biochimica, Genetica e Biologia molecolare), devono integrarsi con diverse competenze informatiche (Algoritmica, Programmazione e Basi di dati).

La Bioinformatica costituisce l'ambizioso tentativo di utilizzare le tecnologie computazionali per analizzare e descrivere, in maniera integrata, sistemi biologici complessi al fine di formulare ipotesi sui processi molecolari della vita.

Viene generalmente chiamato Bioinformatico chi utilizza in maniera professionale e mirata le procedure e gli strumenti di analisi computazionale oggi disponibili, ma anche chi ne sviluppa di nuovi o di migliori. Su questa base possiamo quindi distinguere:

ANALISTA BIOINFORMATICO (Background Biomolecolare)
SVILUPPATORE BIOINFORMATICO (Background Matematico-Informatico)

[Torna su]





PRINCIPALI AREE DI STUDIO DELLA BIOINFORMATICA

1] Organizzare le conoscenze acquisite a livello globale su genoma e proteoma in banche dati al fine di conservare, recuperare e manipolare, all'occorrenza, l'enorme quantità di informazioni oggi a disposizione.

2] Cercare omologie tra Bio-sequenze e formulare ipotesi sulle relazioni evoluzionistiche di geni e proteine.

3] Abbiamo bisogno di un quadro completo che mostri la totale composizione molecolare della cellula in maniera tale da studiare e far luce circa i numerosi e complessi pathways metabolici.

4] Comprendere il meccanismo in base al quale una determinata proteina esercita la sua funzione. Ci serve capire non solo cosa fa, ma soprattutto come lo fa. E sappiamo che fondamentalmente lo fa perché ha una determinata struttura tridimensionale.

5] Il problema del FOLDING resta ancora oggi aperto e vorremmo essere in grado di riprodurre in silico quanto avviene in vivo: seguire i vari passi che portano un polipeptide a passare da una struttura disordinata iniziale (random coil) a una struttura stabile, energicamente favorita e funzionante.

6] Simulare e comprendere il meccanismo in base al quale una determinata molecola (ligando) prende contatto (Docking) con una determinata regione della proteina.

7] Progettare, realizzare e/o testare BIO-software che implementi e/o migliori gli algoritmi descriventi le complesse regole biomolecolari della natura.

[Torna su]





LE BIOSEQUENZE

L’elemento fondamentale in Bioinformatica è la Sequenza (Nucleotidica / Aminoacidica). Le sequenze Nucleotidiche (DNA ed RNA) vengono rappresentate mediante stringhe di 4 elementi (A, T (U per RNA), C, G), nelle quali ciascuna lettera rappresenta un singolo nucleotide. Le sequenze aminoacidiche vengono invece rappresentate mediante stringhe di 20 elementi (A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y), nelle quali ciascuna lettera rappresenta un singolo aminoacido.

Le Biosequenze che selezioniamo continuamente dalle banche dati, utilizzando i diversi sistemi di interrogazione, vanno poi estratte e depositate sul proprio PC per poter compiere successive analisi, sottomettendole a differenti programmi. Molti server automatici sono in grado di riconoscere come validi, soltanto determinati formati ed il formato ormai più diffuso ed accettato per sequenze Nucleotidiche ed Aminoacidiche è il Pearson FASTA:

>ID - Nome Gene - Organismo
CGATCAACTATAATCTGATAATCGATCAGTCAATCGAGCAGCGGCGCATCTGACTAGACTAGC
GCATTAGCTAGCATGCTAGCATGACTGTAGCTAGCATGTAGATGAATGCTGCTAGCTATGCTA
AGCTCTACGATCGATCGACGCGAGCGCGGCAGCACGTATCATCGATCTGATCGTATCAGCGCG

>ID - Nome Proteina - Organismo
QWWQEERAGGILLIPKKKVGHIILVVPREETTWQACCVPIMMPLPLKIYYTPILGYWQPCAAP
ACVFPILHKYTREMVGHFDPLIPTYQMLADTERPLIPMVETGADILVGTYRWELPGMCVILKL
AGFKLHGCFGGASDQWTPWLLWQCGCGTFDDAYYDAPPAIALSDLVGGALGIIVDREWQQPLP

La sequenza viene scritta dall'inizio alla fine senza spazi. Il formato FASTA impone una riga di intestazione che comincia con il simbolo ">" e contiene generalmente alcune informazioni basilari (non obbligatorie), relative alla sequenza: Codice identificativo per la ricerca rapida della sequenza in banca dati, nome dell' elemento biologico ed organismo di appartenenza.

LE BIOSEQUENZE NASCONDONO DIVERSE INFORMAZIONI BIOLOGICHE AL LORO INTERNO ed algoritmi più o meno avanzati vengono utilizzati con lo scopo di “estrarre informazione utile”, partendo da semplici analisi condotte esclusivamente sulla sequenza. Una sequenza di DNA come quella riportata in basso, può ad esempio, contenere diverse informazioni al suo interno. Il problema è quello di conoscere le giuste procedure ed utilizzare i migliori algoritmi disponibili per ottenere queste informazioni.

Un Bioinformatico con esperienza riesce a rispondere a queste domande nel giro di qualche minuto !!!

[Torna su]