PUBLICACIÓN DEL GENOMA

En 1998 se publica el genoma completo de Mycobacterium tuberculosis, concretamente de la cepa de laboratorio H37Rv: 4411529 pares de bases de información a descifrar, todo un potencial a la hora de descubrir, entre todo el repertorio de genes, aquellos que son claves para la virulencia, patogénesis, supervivencia, latencia posibles dianas contra las que actuar mediante fármacos diseñados “a conciencia”.

Se estima que el genoma de M. tuberculosis, con un contenido importante en citosina/guanina (65.5%) relativamente constante a lo largo de toda la secuencia, alberga alrededor de 4000 genes (3924 ORFs identificados), y llama la atención por la elevada proporción de su capacidad codificante destinada a la expresión de enzimas implicadas en lipogénesis y lipólisis. De hecho, pocas bacterias son capaces de sintetizar una gama de moléculas lipofílicas tan variada como M. tuberculosis, y llama la atención el hecho de que su genoma codifique incluso para sistemas enzimáticos  de biosíntesis lipídica propios de plantas y de mamíferos. Así pues, si se compara el número de enzimas implicados en el metabolismo de los ácidos grasos de E.coli versus M. tuberculosis, se tiene que los 50 de E.coli resultan ridículos frente a los 250 de M. tuberculosis, y de entre todos ellos, es importante destacar que en su mayor parte están destinados a la lipólisis más que a la lipogénesis. En efecto, resulta decisiva para la patogenia, así como para la obtención de energía, la degradación de lípidos propios de las membranas celulares o vacuolares de huésped,.

Por otro lado, el genoma de M. tuberculosis difiere respecto al resto de bacterias por poseer dos nuevas familias de proteínas ricas en glicina, cuya estructura repetitiva proporciona una fuente importante de variabilidad antigénica; se calcula que un 10% de la capacidad codificante de M. tuberculosis va destinado a esta familia multigénica, cuyos genes se hallan organizados en forma de cluster.

Se trata de un genoma rico en DNA repetitivo, especialmente en forma de secuencias de inserción, como la IS6110, de la que se han hallado 16 copias,  pero también son fuentes de repetición las nuevas familias multigénicas y genes housekeeping duplicados. Pese a que la tasa de duplicación es similar a la de otros microorganismos (el 51% de sus secuencias codificantes han surgido a partir de un proceso de duplicación), como E.coli o B.subtilis, difiere respecto a ellos en el hecho de que el grado de conservación es considerablemente superior, es decir, al proceso de duplicación no le ha seguido un fenómeno de divergencia, lo cual constituye una evidencia más que confirma la hipótesis de que M. tuberculosis  ha surgido de un proceso de especiación relativamente reciente, o bien que se halla ante un bottleneck.

El hecho de que la proporción C/G sea elevada a lo largo de todo el genoma, esto es, de una forma homogénea, no concentrada en regiones puntuales, denota que se trata de un genoma que no ha recibido el impacto de la transferencia horizontal de islas de patogenia. No obstante, se observan regiones con una proporción en C/G superior a la media y que son secuencias pertenecientes a una gran familia de genes que incluyen PGRSs (polymorphic G+C-rich secuences).

En cuanto a la polaridad de los genes, se tiene que un 59% se transcriben en la misma dirección que sucede la replicación, frente al 75% de B. subtilis, hecho que viene reflejado en su lento crecimiento.

Los 3924 ORFs identificados suponen un 91% de la capacidad codificante del genoma, esto es, está muy explotado. Haciendo uso de la información disponible en bases de datos, y estableciendo comparaciones de secuencias (ver COGs), se ha atribuido función precisa a un 40% de los ORFs predichos, y para otro 44% se ha encontrado secuencias similares o información relacionada. El 16% restante alberga genes de función desconocida, entre los que se deben de hallar codificadas funciones específicas de Mycobacterium.

En cuanto a la composición aminoacídica, los datos guardan coherencia con el contenido elevado en guanina/citosina; en efecto, predominan aminoácidos del tipo alanina, glicina, prolina, arginina y triptófano, puesto que son los codificados por codones ricos en G/C, frente a unos aminoácidos menos representados como son la asparagina, isoleucina, lisina, fenilalanina y tirosina.

Dos nuevas familias de proteínas, las PE ( motivos Pro-Glu a nivel del extremo N-terminal) y las PPE (Pro-Pro-Glu),  se caracterizan precisamente por ser ricas en glicina, y su elevado grado de polimorfismo hace pensar en ellas como potenciales antígenos.  El hecho de que se las atribuya un papel inmunológico no sólo se debe a la importante fuente de variación (antigénica) que suponen, sino porque se cree que podrían interferir el la respuesta inmune vía inhibición del procesamiento antigénico, tan necesario para la presentación de antígeno posterior.

La familia PE por ejemplo, se compone de 90 miembros que comparten un dominio en el extremo N-terminal muy conservado, consistente en 110 residuos aminoacídicos que se disponen dando lugar a una estructura globular, mientras que el extremo C-terminal varía en secuencia, longitud y número de repeticiones. Estudios filogenéticos han llevado a subdividir la familia en distintos grupos, siendo el más numeroso el de las PGRS, cuyo contenido en glicina supera el 50%, y se distribuye en forma de repeticiones en tándem del motivo Gly-Gly-Ala/Asn. Existe cierto paralelismo entre las proteínas PGRS y los antígenos del virus nuclear Epstein-Barr (EBNAS). Los EBNAS actúan bloqueando la acción del proteasoma, impidiendo así la presentación de antígenos de clase I.

Con la compleción del genoma de M. tuberculosis se abre una prometedora puerta que nos permite pensar en nuevos tratamientos a la hora de luchar contra la epidemia emergente de la que son responsable un número cada vez mayor de cepas multiresistentes.

En efecto, se puede decir que, si el final del siglo XX vivió la explosión de la genómica, este siglo XXI que acaba de empezar va a ser testigo de un no menos impactante bombardeo de información en lo referente a la proteómica.

    

Previo a su secuenciación, el cromosoma circular de MTB ha sido organizado en una biblioteca de cósmidos, así como en forma de BACs (bacterial artificial chromosomes); la metodología seguida a la hora de obtener la secuencia es una combinación de análisis sistemático de los insertos clonados a nivel tanto de BACs como de cósmidos, de 1.4-2 kb, junto con el análisis de secuencias obtenidas al azar (random small insert clones) a partir de una genoteca "shotgun" del genoma completo.

 

ASPECTOS EVOLUTIVOS que el genoma nos ha desvelado

Desde que en 1998 se publicara el genoma de la cepa H37Rv, otras cepas aisladas de pacientes han ido siendo secuenciadas; la comparación de estos genomas ya completados nos debería propiciar una interesante línea de trabajo dirigida a elucidar cuáles son los mecanismos implicados en la virulencia.

Han sido empleados microarrays para analizar genomas completos y realizar así estudios epidemiológicos en 19 cepas clínicas de M. tuberculosis, detectándose hasta 25 regiones cromosómicas deleccionadas. Se ha visto que existe una correlación inversa entre el porcentaje de genoma deleccionado de cada clon y el porcentaje de pacientes infectados con tal clon que presentaban cavitación pulmonar. Los autores de este estudio han interpretado estos datos considerando que la acumulación de delecciones en M. tuberculosis  conduce a una disminución de la virulencia. Parece ser que estas delecciones tienen lugar como consecuencia de la recombinación homóloga entre copias de IS6110 que se hallan flanqueando ciertas regiones cromosomales.

Por otro lado, se tiene que el genoma de M. leprae ya ha sido completado, mientras que los genomas de otros miembros del complejo M. tuberculosis, como M. bovis, M. avium y M. smegmatis están siendo secuenciados; la información desprendida de sus secuencias completas en cuanto a evolución y adquisición de la virulencia en el complejo M. tuberculosis será decisiva.

En este sentido, se ha visto que los miembros del complejo MTB están extremadamente relacionados en lo que al nivel nucleotídico se refiere, y carecen de diversidad genética: los cambios de nucleótido se dan con una frecuencia de 3x10-4, un valor excepcionalmente bajo entre las bacterias. (La razón de ser de esta homogeneidad puede encontrarse en una maquinaria de replicación de gran fidelidad de copia, o bien un sistema de reparación altamente eficiente).

Así, se han realizado trabajos de secuenciación comparativa de 26 loci estructurales en más de 800 ejemplares del complejo MTB, y se ha visto que la variación nucleotídica silenciosa (sinónima), está altamente restringida, siendo muy inferior a la de otros patógenos. De ello se puede extraer que el genoma de M. tuberculosis es inusualmente inerte, que se trata de un organismo relativamente “joven” en términos evolutivos, o bien se halla ante un bottleneck.

En efecto, muchos son los datos que nos  indican que M. tuberculosis ha sufrido en su evolución un reciente bottleneck (cuello de botella) en el momento de la especiación, y que se calcula que tuvo lugar hace 15000 o 20000 años. De acuerdo con esto, se podría considerar que M. tuberculosis ha sido liberado al ambiente hace relativamente poco tiempo, desde la perspectiva evolutiva.

Otro estudio, dirigido a estudiar 24 genes que se sabe codifican para dianas del sistema inmune humano en 16 muestras extraídas de distintas fuentes, nos desvela un hecho sorprendente: 19 de estas 24 dianas estaban libres de variación nucleotídica, es decir, sólo 5 de los genes poseen cierto polimorfismo, lo cual confirma que la variación en los genes estructurales de M. tuberculosis es negligible, incluso para aquellas proteínas que interaccionan a nivel del sistema inmune del huésped, y de las que sería esperable una mayor variabilidad.

En cualquier caso, esta falta de variación  tiene sus consecuencias en lo que a inmunidad y al desarrollo de nuevas vacunas se refiere, puesto que la mayoría de proteínas habrán de ser idénticas para todas las cepas, y por tanto, la deriva a nivel de antígenos será mínima.

 

 

t

t

ENLACES

Nature 393,

            537-544 (1998)

t

DOCUMENTOS


    

  (Listado de genomas

  bacterianos completos

  publicados)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

     

 

 

 

 

 

 

 

 

 

 

FOTOS

Esquema de las familias

PE, PPE y PGRSs.

 

Distribución del proteoma

de MTB en COGs

t

Uso de la IS6110

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 IMPRIMIR ESTE DOCUMENTO

Subir arriba