19 de marzo de 2024 19 / 03 / 2024

El poder de la bioinformática

Angélica Jara Servín

Imagen de El poder de la bioinformática

Imagen: Shutterstock

La secuenciación genética y las bases de datos que contienen los resultados de esta son de gran ayuda para identificar con nombre y apellido a microorganismos como bacterias y virus.

Hace ya varios años, durante las vacaciones de diciembre, coincidí con una tía que llegó a casa quejándose de un malestar en la espalda que padecía desde hacía ya varios días. Había decidido dejar pasar un tiempo y corregir su postura por si se había lastimado al hacer algún movimiento brusco. Sin embargo, el tiempo pasó y el dolor no disminuía, sino que había días en los que incluso aumentaba y los médicos no parecían encontrar la causa. Le hicieron muchas pruebas y análisis que aparentemente no llevaban a ningún lado hasta que a algún médico se le ocurrió que podría ser una infección que se estaba desarrollando en la zona de la espalda baja. Sorprendentemente el resultado de un análisis de laboratorio fue positivo para una enfermedad conocida como brucelosis o fiebre de Malta, causada por bacterias del género Brucella y que suelen transmitirse a los humanos a través del consumo de productos lácteos no pasteurizados. Mi tía jamás pensó que el queso fresco que se comió en un pequeño poblado pudiera causar esta enfermedad.

Normalmente no tenemos en cuenta los lugares, algunos totalmente insospechados, en los que uno se encuentra con un sinnúmero de microorganismos que pueden ser patógenos, inocuos o incluso benéficos. La enorme cantidad de ellos que están presentes en una porción diminuta de queso, de suelo o de saliva, puede ser abrumadora y en muchas ocasiones nos desalienta para investigar el nombre y apellido de cada uno de los microorganismos que habitan en la muestra que queremos analizar. Además, es importante tomar en cuenta que el término microorganismos engloba no solo a las famosas bacterias, sino también a otros seres vivos como los hongos y a seres ni vivos ni muertos, como los virus. Surge entonces la pregunta entre los científicos: ¿Cómo identificar un cóctel de organismos que además no podemos ver a simple vista?

Un arduo proceso

Después de la consolidación de la microbiología como ciencia y del desarrollo de sus bases fundamentales, el método utilizado para estudiar microorganismos consiste a grandes rasgos en tomar una muestra de interés y ya en el laboratorio, separar todos los que estén presentes en ella de manera que cada tipo de microorganismo quede aparte de todos los demás. Esta es una tarea que, aunque puede sonar sencilla, en realidad presenta varios retos y limitantes. Imaginemos que queremos saber únicamente qué bacterias viven en el agua que usamos para regar las plantas que tenemos en casa. Realmente no tenemos ni idea de cuántas bacterias pueden estar presentes en una sola gota de este líquido y, menos aún, qué necesita cada una de ellas para poder crecer y reproducirse.

Existen unas cajas con tapa de 100 mm de diámetro y 20 mm de altura llamadas cajas de Petri en las que se pone un medio de cultivo que es una mezcla de nutrientes y agua a la que se añade un agente obtenido de algas de mar denominado agar que, básicamente, cumple la misma función de la grenetina para hacer gelatinas: solidificar. Lo interesante es que podemos jugar con las proporciones y componentes de esa mezcla de nutrientes e incluir algún compuesto que sea esencial para la supervivencia de cierta bacteria, pero letal para otra especie. Estos medios se conocen como medios selectivos, ya que así conseguimos eliminar una de las especies y conservar la otra en el espacio físico delimitado por la caja de Petri. Si utilizamos y combinamos una amplia gama de medios selectivos y trabajamos arduamente podemos llegar a tener una colección de muchos cultivos aislados, cada uno en su propia caja, pero en la mayoría de los casos aún no sería suficiente para identificar a las bacterias que hay en cada caja. El siguiente paso es realizar las llamadas pruebas bioquímicas, que consisten en someter cada uno de los cultivos aislados a distintos compuestos químicos para que reaccionen produciendo distintos colores o emitiendo gas (formación de burbujas); esto ya nos da más información para identificar por género y especie a las bacterias presentes.

A pesar de lo mucho que nos pueda apasionar la microbiología, habrá situaciones en las que no sea conveniente invertir mucho tiempo y energía en la preparación de medios de cultivo y realización de pruebas bioquímicas. Si son tantas las bacterias que existen en una muestra cuyas características no conocemos en su totalidad, es seguro que no conseguiremos aislarlas todas porque no daremos con la combinación de nutrientes adecuada. ¿Qué se hace en este caso?

El nombre está codificado en el ADN

Cada microorganismo puede identificarse a través de su secuencia de ADN (material genético) que es particular para cada especie. Nosotros podríamos extraer de cualquier muestra todo el ADN que esté presente en ella de un solo golpe. ¡Olvidémonos de tener que separar cada tipo de microorganismo!, únicamente debemos seguir una serie de procesos físicos y químicos para tener todo el ADN de todos los microorganismos presentes en una gota de agua.

Ahora imaginemos que tenemos el título de un libro, por ejemplo, Los miserables. El título puede estar formado por cualquiera de las 27 letras del abecedario, pero estas deben seguir un orden o secuencia particular para formar estas palabras juntas: Los miserables, y que nosotros podamos identificarlas como la obra de Víctor Hugo. Algo muy similar sucede con el ADN de un microorganismo o de cualquier otro ser vivo, formado por una combinación particular de cuatro moléculas llamadas adenina, timina, citosina y guanina (A, T, C y G). Conocer el orden de estas moléculas dentro del ADN de un microorganismo nos permite identificarlo, tal y como identificamos Los miserables. En nuestra mezcla de ADN hay un montón de moléculas mezcladas, como si tuviéramos los títulos de muchos libros sin saber cuáles son. Para identificarlos es necesario conocer el orden en el que A, T, C y G se encuentran en cada molécula presente en la mezcla. Y podemos hacerlo mediante un proceso denominado secuenciación genética que nos permite obtener una lista con varias secuencias formadas por A, T, C y G. ¿Qué sigue ahora?, ¡la bioinformática!

Tres dominios

A principios del siglo XX la clasificación taxonómica de todos los seres vivos estaba dividida en los dominios Bacteria y Eukarya. La aparición de un tercer dominio tuvo lugar a raíz de los estudios realizados por el microbiólogo estadounidense Carl Woese. Este investigador consideraba que era mejor utilizar material genético para identificar microorganismos en vez de basarse únicamente en características físicas. Decidió utilizar el gen 16S rRNA para hacer comparaciones entre distintas bacterias. Una de ellas era una productora de metano cuyo gen 16S rRNA difería considerablemente del de todas las demás bacterias conocidas. Después de hacer varias comparaciones y de cerciorarse de sus resultados, en 1977 Woese dio a conocer en un artículo la existencia de microorganismos denominados archaebacteria, que con el tiempo se agruparon en un nuevo dominio: Archaea. De esta manera se consolidó la clasificación molecular de los microorganismos en tres dominios: Bacteria, Eukarya y Archaea.

La bioinformática al rescate

La bioinformática utiliza programas informáticos, como su nombre lo dice, para almacenar y analizar muchos tipos de datos biológicos, entre los que se encuentran secuencias de ADN. Con el paso de los años se han ido conociendo las secuencias de ADN características de distintos organismos y estas se han almacenado en enormes bases de datos a las que se tiene acceso gratuito. Por ejemplo, uno puede acceder a la base de datos llamada GenBank, teclear el nombre de algún organismo y obtener la secuencia de ADN que lo caracteriza. Por lo tanto, si tenemos una lista de secuencias de bacterias presentes en una gota de agua podemos usar herramientas bioinformáticas para compararlas con la base de datos que nos dirá a qué microorganismo corresponde cada secuencia. De repente ya no tendremos un montón de letras, sino que sabremos el nombre de cada una de las bacterias sin preocuparnos de sus requerimientos nutricionales y de preparar miles de cajas de Petri con medios de cultivo.

Al igual que los libros que no están conformados únicamente por su título, el ADN no contiene únicamente la secuencia que da nombre al microorganismo: contiene también información sobre las proteínas que este produce para vivir. Si buscamos dar nombre a las bacterias, debemos encontrar la región de ADN que equivaldría al título de un libro. Esta región es un gen llamado 16S rRNA. Este gen, o porción de ADN que codifica una proteína (tiene las instrucciones para producirla), está conformado por regiones constantes y regiones denominadas hipervariables. Las regiones constantes son secciones de este gen que son iguales en todas las bacterias, mientras que las regiones hipervariables son diferentes entre distintas especies e iguales o muy parecidas entre individuos de la misma especie. El gen 16S rRNA de la bacteria Salmonella enterica tendrá las mismas regiones constantes que la bacteria Vibrio cholerae, por lo que podremos concluir que ambas son bacterias. En cambio, las regiones hipervariables entre Salmonella enterica y Vibrio cholerae serán distintas y esto nos permitirá diferenciarlas entre sí.

De todos los microorganismos, los virus son por mucho de los que tenemos menos información almacenada en bases de datos.

¿Y los demás microorganismos?

Si hacemos memoria y nos transportamos a nuestras clases de la materia de biología recordaremos que las bacterias no son los únicos seres vivos microscópicos que existen. Los hongos son organismos que pueden ser de gran tamaño y deliciosos, como los champiñones que consumimos en una deliciosa quesadilla, o tan diminutos que no podemos verlos a simple vista y pueden medir incluso apenas 1 micrómetro (0.0000001 m). Las arqueas son otro tipo de organismo que suele encontrarse en ambientes extremos y cuyas dimensiones también están en el rango de los micrómetros. Estos microorganismos pueden estudiarse e identificarse mediante un proceso muy similar al que seguimos para estudiar bacterias con herramientas bioinformáticas. La principal diferencia radica en la sección de ADN que se utiliza. Tomemos como ejemplo a los hongos; la porción de material genético que debemos secuenciar recibe el nombre de región ITS. El estudio de los hongos en esta área empezó después que el de las bacterias, por lo que aún hay discusiones acerca de la manera más conveniente de analizar la región ITS para poder identificarlos. Además de utilizar una región diferente a la de las bacterias, para identificar hongos se usan programas bioinformáticos distintos, así como bases de datos especializadas en otros microorganismos que no son bacterias.

Es posible que algunos lectores se hayan percatado de que falta un ser microscópico que apenas hemos mencionado. Los virus, que causan controversia y fascinación al no estar vivos sin estar muertos, son también sujetos de estudio para la bioinformática, ya que cuentan con lo único que esta disciplina necesita: material genético. Sin embargo, de todos los microorganismos los virus son por mucho de los que menos información tenemos almacenada en bases de datos y los programas que existen para estudiarlos no están tan desarrollados como los que usamos para bacterias y otros microorganismos.

La bioinformática en la actualidad

A pesar de las claras ventajas de la secuenciación y la bioinformática para analizar muestras, el método clásico sigue siendo fundamental ya que, como toda técnica, el enfoque bioinformático presenta limitantes; la más importante se refiere a las bases de datos. Estas enormes plataformas han ido nutriéndose a lo largo de los años con secuencias nuevas de distintos microorganismos, pero a pesar de nuestros mayores esfuerzos, no estamos cerca de conocer y almacenar las secuencias de todos los microorganismos de nuestro planeta. Es una labor titánica que bien podría considerarse utópica.

La secuenciación es un método que está en boga en laboratorios de investigación, más que nada para el análisis de muestras complejas, como las ambientales: de aguas residuales y agua entubada, muestras de aire tomadas con equipos llamados muestreadores biológicos de aire, muestras de suelos contaminados o de suelos agrícolas, que además pueden o no estar sometidos a tratamientos de fertilización y rotación de cultivos. En todos estos ejemplos, y muchos más que por espacio no podemos mencionar, las variaciones climáticas y las condiciones adversas a las que se enfrentan los microorganismos son tan diversas que podemos esperar una cantidad inimaginable de diferencias dentro de los distintos géneros de bacterias que ya conocemos, lo cual complica más el panorama y nos enfrenta a nuevos retos.

Recurrir a la secuenciación como método de identificación es más caro pero puede agilizar el diagnóstico.

Ahora volvamos a la historia de mi tía que enfermó por comer queso fresco. La bacteria Brucella se ha estudiado desde hace mucho tiempo, basta con decir que se aislaron cepas de esta durante la guerra de Crimea, que tuvo lugar de 1853 a 1856. Mientras más conocido sea el microorganismo, mucho más probable es encontrar su secuencia en las bases de datos, como podría ser el caso de Brucella. Sin embargo, en la gran mayoría de casos clínicos está muy estandarizado el proceso de cultivo e identificación de patógenos comunes, por lo que es raro que se elija la opción de secuenciación, que además es más cara. Existen laboratorios que ofrecen la posibilidad de secuenciar muestras clínicas, pero es un servicio que suele utilizarse para cepas extrañas que no pueden identificarse por métodos de cultivo u otras técnicas más económicas. Probablemente en los análisis que se realizaron para averiguar qué enfermedad padecía mi tía se usaron medios de cultivo y distintas pruebas bioquímicas de esos medios. El motivo por el cual tardaron tanto en identificar al microorganismo pudo deberse a otros factores de su sintomatología que no llegaron a mis oídos y no me permiten acabar de cerrar la historia. Seguramente habrían tardado menos en diagnosticarla de haber recurrido a la secuenciación como método de identificación. Con el paso de los años he perdido contacto con ella, pero espero que algún día tenga este texto entre sus manos y, asombrada por el increíble potencial que tiene la bioinformática, se haga las mismas preguntas.

  • Ramakrishnan, Venki, La máquina genética. La carrera por descifrar los secretos del ribosoma, Ed. Grano de Sal, Cd. de México, 2020.
  • Austin, Christopher P., Bioinformática, National Human Genome Research Institute, Estados Unidos: www.genome.gov/es/genetics-glossary/Bioinformatica

Angélica Jara Servín es maestra en ciencias bioquímicas por la UNAM. Actualmente desarrolla su trabajo de doctorado en el Laboratorio de Genómica Ambiental (UNAM), donde estudia las comunidades de microorganismos asociados a raíces de plantas.

Logotipo facebook
Logotipo Twitter
Logotipo instagram
Logotipo tiktok

Síguenos en nuestras redes sociales

Imagen de Ciencia a domicilio
Imagen de Suscripción a la revista
Imagen de Universum
Imagen de Ciencia UNAM