LES TRANSPOSASES MARINER Hsmar1 i Hsmar2

ANÀLISI BIOINFORMÀTIC, RESULTATS I DISCUSSIÓ

 

 

PÀGINA PRINCIPAL

 

OBJECTIUS

 

INTRODUCCIÓ
Els transposons

 

ANÀLISI BIOINFORMÀTIC, RESULTATS I DISCUSSIÓ

 

CONCLUSIONS

 

BIBLIOGRAFIA

 

En primer lloc, és mostra l'índex de l'anàlisi que s'ha fet, que a continuació s'exposarà i comentarà pas a pas:

1. DETERMINACIÓ DE LES SEQÜÈNCIES PROTEÍNIQUES 

           - Búsqueda de la seqüència de la proteïna Hsmar1

           - Búsqueda de la seqüència de la proteïna Hsmar2

2. DISTRIBUCIÓ DE LES PROTEÏNES EN EL GENOMA HUMÀ

           - Distribució en la base de dades d'Homo sapiens

           - Blastp d'Hsmar1 per determinar-ne la distribució

           - Blastp d'Hsmar2 per determinar-ne la distribució

3.COMPARACIÓ DE LES DUES TRANSPOSASES: ALÍNIAMENT DE SEQÜÈNCIES

           - Clustalw per comparar les dues transposases: Hsmar1 i Hsmar2

4. FILOGÈNIA

           - Estima de la Filogènia de la superfamília mariner

 

 

1. DETERMINACIÓ DE LES SEQÜÈNCIES PROTEÍNIQUES

En aquest anàlisi, es treballarà amb dues proteïnes, Hsmar1 i Hsmar2, de les quals, en primer lloc, en determinarem la seqüència. Per a fer-ho, s'ha fet servir el buscador Entrez protein, on s'ha efectuat la búsqueda per "Hsamr1" i "Hsmar2" separadament, i s'han obtingut les seqüències en format FASTA. Els resultats es mostren en els links a continuació: 

Búsqueda de la seqüència de la proteïna Hsmar1. Com veiem, apareixen 4 resultats a la búsqueda, per tant, els analitzarem cada un individualment per tal de trobar la seqüència correcta d'Hsmar1. Donat que durant l'anàlisi es va detectar que els resultats 2 i 3 són redundants (s'explicarà més endavant) només s'analitzarà el resultat 2.

              Resultat 1. Seqüència Hsmar1 Q53H47         Format FASTA: Q53H47      

              Resultat 2. Seqüència Hsmar1 NP 006506     Format FASTA: NP 006506

              Resultat 4. Seqüència Hsmar1 AAC52010      Format FASTA: AAC52010

Búsqueda de la seqüència de la proteïna Hsmar2        

            Resultat 1. Seqüència Hsmar2 AAC52011        Format FASTA Hsmar2

 

  Tornar a l'Inici

2. DISTRIBUCIÓ DE LES PROTEÏNES EN EL GENOMA HUMA

 Distribució en la base de dades d'Homo sapiens

Per tal de conèixer la distribució de les proteïnes en el genoma humà, s'ha utilitzat l'eina Homo sapiens genome view en el qual s'ha efectuat la búsqueda, igual que abans, per "Hsmar1" i "Hsmar2". Els resultats es mostren a continuació.

d' Hsmar1 Com es pot veure en aquests resultats, el gen codificant per Hsmar1 es troba distribuït per tot el     genoma i és present en tots els cromosomes i en la majoria, n'hi ha més d'una còpia.

d' Hsmar2 Per contra, tot i que el gen codificant per Hsmar2 també està àmpliament extès en tot el genoma, i en molts casos també, els cromosomes en presenten més d'una còpia, és abscent en els cromosomes 1 i 7.

 Blastp  El següent pas és llençar les seqüències abans obtingudes en FASTA contra la base de dades de proteïnes per tal de saber exactament a què corresponen les seqüències i comprovar que són seqüències corresponents a transposases humanes.

 - Blastp d'Hsmar1 per determinar-ne la distribució

              Resultat 1. Blastp Hsmar1 Q53H47               

En tots els resultats és mostra que aquesta seqüència pertany a un gen de fusió de la transposasa mariner Hsmar1 d'Homo sapiens 
A continuació és mostren 3 d'aquests resultats on es pot veure clarament.
 
                  gb|EAW63905.1| SET domain and mariner transposase fusion gene, isoform CRA_c 
                  Homo sapiens]
                  Length=684
                  Score = 1394 bits (3608),  Expect = 0.0, Method: Composition-based stats.
                  Identities = 671/671 (100%), Positives = 671/671 (100%), Gaps = 0/671 (0%) 
 
                  sp|Q53H47|SETMR_HUMAN Histone-lysine N-methyltransferase SETMAR (SET domain and mariner 
                  transposase fusion gene-containing protein) (Metnase) (Hsmar1) 
                  [Includes: Histone-lysine N-methyltransferase; Mariner 
                  transposase Hsmar1]
 
                  dbj|BAD96454.1| SET domain and mariner transposase fusion gene variant [Homo sapiens]
 

              Resultat 2. Blastp Hsmar1 NP 006506    

El primer resultat mostra que aquest resultat també correspon a una proteïna de fusió. D'altra banda, el segon resultat, veiem que és idèntic a la tercera referència dels resultats inicials (AAC52012), de manera que, com s'ha dit a l'inici, veiem que són redundants i no s'analitzarà (senyalat en groc). A partir del tercer resultat, el tant per cent de coincidència comença a disminuir.

                  ref|NP_006506.1| SET domain and mariner transposase fusion [Homo sapiens]
                  gb|AAC52012.1| unknown [Homo sapiens]
                  Length=671
                  Score = 1392 bits (3603),  Expect = 0.0, Method: Composition-based stats.
                  Identities = 671/671 (100%), Positives = 671/671 (100%), Gaps = 0/671 (0%)
 
                  gb|EAW63905.1| SET domain and mariner transposase fusion gene, isoform CRA_c [Homo sapiens]
                  Length=684
                  Score = 1386 bits (3587),  Expect = 0.0, Method: Composition-based stats.
                  Identities = 668/671 (99%), Positives = 668/671 (99%), Gaps = 0/671 (0%)

              Resultat 4. Blastp Hsmar1 AAC52010

En aquest cas, el primer resultat mostra que aquesta sí és la seqüència corresponent a la transposasa mariner humana, donat que hi ha un 100% d'homologia amb aquesta.

                   gb|AAC52010.1| mariner transposase [Homo sapiens]
                   Length=343
                   Score =  689 bits (1777),  Expect = 0.0, Method: Composition-based stats.
                   Identities = 343/343 (100%), Positives = 343/343 (100%), Gaps = 0/343 (0%)
 
Les seqüències que es mostren en els resultats següents, corresponen a gens de fusió, com per exemple 
Histone-lysine N-methyltransferase SETMAR
 
                   gb|EAW63905.1| SET domain and mariner transposase fusion gene, isoform CRA_c [Homo sapiens]
                   Length=684
                   Score =  683 bits (1763),  Expect = 0.0, Method: Composition-based stats.
                   Identities = 324/343 (94%), Positives = 337/343 (98%), Gaps = 0/343 (0%)
 
                   sp|Q53H47|SETMR_HUMAN Histone-lysine N-methyltransferase SETMAR (SET domain and mariner 
                   transposase fusion gene-containing protein) (Metnase) (Hsmar1) 
                   [Includes: Histone-lysine N-methyltransferase; Mariner transposase Hsmar1]

 - Blastp d'Hsmar2 per determinar-ne la distribució

             Resultat 1.  Blastp Hsmar2 AAC52011

En els resultats es mostren coincidències per a molts organismes, ordenats de més a menys coincidents. En primer lloc es mostra la coincidència per a la transposasa mariner humana amb 100% de coincidències i  0 gaps.

                 gb|AAC52011.1|  mariner transposase [Homo sapiens]
                 Length=351
                 Score =  693 bits (1789),  Expect = 0.0, Method: Composition-based stats.
                 Identities = 351/351 (100%), Positives = 351/351 (100%), Gaps = 0/351 (0%)

En segon lloc, es mostra la transposasa corresponent a Bythograea thermydron, que disminueix el tant per cent de coincidència a un 59% i presenta 2/348 gaps tot i que es considera un 0%.

                 emb|CAD45368.1|  transposase [Bythograea thermydron]
                 Length=349
                 Score =  270 bits (691),  Expect = 7e-71, Method: Composition-based stats.
                 Identities = 149/348 (42%), Positives = 208/348 (59%), Gaps = 2/348 (0%)

A mesura que s’avança en la llista, el tant per cent de coincidència disminueix i també apareixen més gaps, la qual cosa ens confirma que la seqüència trobada per a Hsmar2 és exclusiva d’aquesta i única per a humans.

 

  Tornar a l'Inici

 

3.COMPARACIÓ DE LES DUES TRANSPOSASES: ALÍNIAMENT DE SEQÜÈNCIES

 Clustalw per comparar les dues transposases: Hsmar1 i Hsmar2

               Resultat ClustalW

En aquest aliniament de seqüències s'observa fàcilment que les dues transposases han divergit, donat que s'aprecien clares diferencies en les dues seqüències. Les dues seqüències són idèntiques o conservades en 111 aminoàcids (31,6% de la seqüència) que es poden observar marcats amb un asterisc (" * "). Les substitucions d'aminoàcids conservades és marquen amb dos punts (":"), i se n'observen 89 (25,35%), i de substitucions semi-conservades ("."), n'apareixen 38 (10,82%). També apareixen 13 gaps a l'inici, final i en mig de l'aliniament. La resta d'unions, que són no coincidents, són 100 (28,5%). La transposasa Hsmar2 amb 351 aminoàcids, te una seqüència lleugerament més llarga que Hsmar1 que en té 343.

Així doncs, 238 aparellaments dels 352 totals (67,6%), es poden explicar per residus idèntics o conservats i substitucions conservades i semiconservades.

 

  Tornar a l'Inici

 

 

4. FILOGÈNIA

 - Estima de la Filogènia de la superfamília mariner

Per tal d'analitzar breument la filogènia de la família de transposons mariner, i ubicar les nostres transposases d'interès, s'han buscat a Entrez protein diferents seqüències corresponents a transposons d'aquesta família presents en diferents organismes de filogènia variada. D'aquesta manera també es podrà determinar si la filogènia d'aquests elements s'adequa a la filogènia dels organismes. La búsqueda s'ha realitzat aplicant els paràmetres "mariner transposon AND _______ " i el nom de cada una de les famílies que s'esmenten a continuació:

             Hsmar2 mariner transposase (Homo sapiens)

             Hsmar1 mariner transposase (Homo sapiens)

             Gorilla gorilla (Goril·la)

             Pan troglodytes (Ximpancé)

             Pongo pygmaeus (Orangutan)

             Drosophila nikananu (Mosca)

             Chrysoperla plorabunda (Mosca)

             Ceratitis capitata (Mosca de les fruites)

             Glossina palpalis (Mosca hematófoga)

             Apis cerana (Abella de la Mel)

             Bombyx mori (Papallona)

             Pycnoscelus surinamensis (Escarbat)

Les seqüències analitzades en format fasta es poden conslutar fent click AQUÍ

L'aliniament múltiple de les seqüències s'ha realitzat amb el programa ClustalW on s'ha generat l'arxiu (fes click AQUÍ per conslutar-lo) a partir del qual es pot realitzar un arbre filogenètic amb el programa TREE VIEW . Els resultats es mostren a continuació.

En primer lloc trobem un arbre en el qual s'ha escollit la "Mosca" com a outgrup ja que és l'element més allunyat. Com es pot veure, sembla situa Hsmar1, el Ximpancé, el Goril·la i l'Orangutant en un moment de l'evolució més tardà, però Hsmar2 queda completament desplaçada en situar-se pràcticament a l'inici de l'arbre. Per tant, la filogènia de l'arbre, tot i separar els primats de la resta, en desplaçar Hsmar2 no mostra una filogènia coherent amb la dels organismes.
 

Per això, a partir de les mateixes dades s'ha generat un arbre radial, on no hi ha un outgrup preestablert, la qual cosa significa que no hi ha un ancestre comú, per tal d'analitzar les diferències obtingudes. En aquest cas, l'arbre obtingut ha estat el següent:

Els resultats en aquest cas, tampoc són del tot satisfactoris, ja que a la part superior veiem una agrupació de Hsmar1, el Ximpancé i l'Orangutan coherent amb la filogènia de primats, però s'hi barreja la Mosca hemaòfoga. De nou, a la part més inferior de l'arbre, veiem com la transposasa Hsmar2 humana queda vinculada a la Mosca i l'Escarabat, la qual cosa no té coherència filogenètica.

 

  Tornar a l'Inici

 

Tornar a la pàgina principal