El mayor hallazgo hasta ahora: una IA descubre, de una sola vez, más de 160.000 nuevas especies de virus
Se trata de la mayor investigación publicada hasta ahora sobre nuevos virus. Las nuevas especies fueron halladas en la atmósfera, en aguas termales y en respiraderos hidrotermales de las profundidades oceánicas
Descubren, de una sola vez, 132.000 tipos de virus desconocidos hasta ahora

Un equipo internacional de investigadores acaba de hacer público el descubrimiento de 161.979 nuevas especies de virus gracias al uso de una Inteligencia Artificial. Todo un hito en la historia del conocimiento de estas pequeñas, omnipresentes y aún no del todo comprendidas criaturas.
En la frontera misma entre lo que está vivo y lo que no, los virus solo pueden replicarse dentro de las células de otros seres vivos, a las que obligan a fabricar copias de sí mismos. Por eso infectan a toda clase de organismos, desde bacterias a hongos, plantas, animales e incluso a otros virus. No resulta exagerado decir que los virus se encuentran, literalmente, por todas partes, y que solo conocemos un pequeño número de ellos. De hecho, y aunque se han descubierto ya varios cientos de miles, hasta ahora apenas se han descrito unos 5.000. Los científicos, sin embargo, creen que su número real es muchísimo mayor.
En un artículo recién publicado en 'Cell', los investigadores explican que utilizaron una herramienta de aprendizaje automático que, según escriben, mejorará enormemente el mapeo de la vida en la Tierra y podría ayudar en la identificación de muchos millones de virus más aún por caracterizar. El trabajo es el mayor publicado hasta ahora sobre el descubrimiento de nuevas especies de virus.
Solo es el principio
«Se nos ha ofrecido una ventana a una parte de la vida en la Tierra que de otro modo estaría oculta -explica Edwards Holmes, de la Universidad de Sydney y autor principal del artículo- revelando una notable biodiversidad. Se trata del mayor número de nuevas especies de virus descubiertas en un solo estudio, lo que amplía enormemente nuestro conocimiento sobre los virus que viven entre nosotros. Encontrar tantos virus nuevos de una sola vez es algo alucinante, pero apenas roza la superficie, abriendo todo un mundo de descubrimientos. Hay millones más por descubrir, y podemos aplicar este mismo enfoque para identificar bacterias y parásitos».
Aunque los virus de ARN se asocian comúnmente con enfermedades humanas, también es posible encontrarlos en los entornos más extremos del mundo, desde calderas de volcanes activos a varios km bajo el hielo, y se cree que incluso pueden desempeñar funciones clave en los ecosistemas globales. Los virus encontrados en el presente estudio se observaron viviendo en la atmósfera, en aguas termales y en respiraderos hidrotermales de las profundidades oceánicas.
«El hecho de que los entornos extremos contengan tantos tipos de virus -prosigue Holmes- es sólo otro ejemplo de su fenomenal diversidad y tenacidad para vivir en los entornos más duros, lo que potencialmente nos da pistas sobre cómo surgieron los virus y otras formas de vida elementales».
Una herramienta revolucionaria
Para identificar a las nuevas especies víricas, Holmes y sus colegas crearon un algoritmo de aprendizaje profundo, llamado 'LucaProt', para calcular grandes cantidades de datos de secuencias genéticas, incluidos genomas de virus extensos de hasta 47.250 nucleótidos e información genéticamente compleja. El resultado fue el hallazgo de más de 160.000 virus previamente desconocidos.
«La gran mayoría de estos virus -explica Holmes- ya habían sido secuenciados y estaban en bases de datos públicas, pero esos datos eran tan dispersos que nadie sabía lo qué representaban. De hecho, formaban lo que a menudo se conoce como 'secuencia de materia oscura'. Nuestro método de IA, sin embargo, consiguió organizar y categorizar toda esa información dispar, arrojando luz por primera vez sobre el significado de esa materia oscura».
La herramienta de IA, pues, fue entrenada para analizar la materia oscura e identificar virus basándose en secuencias y estructuras secundarias de la proteína que todos los virus de ARN utilizan para la replicación. Lo cual logró acelerar el proceso de identificación de nuevos virus, algo que con los métodos tradicionales requiere de una gran cantidad de tiempo.
Según afirma Mang Shi, de la Universidad Sun Yat-sen y coautor del estudio, «solíamos depender de tediosos procesos bioinformáticos para el descubrimiento de virus, lo que limitaba la diversidad que podíamos explorar. Ahora tenemos un modelo basado en IA mucho más eficaz que ofrece una sensibilidad y especificidad excepcionales y, al mismo tiempo, nos permite profundizar mucho más en la diversidad viral. Planeamos aplicar este modelo en varias aplicaciones».
«LucaProt -dice por su parte el también coautor Zhao-Rong Li- representa una integración significativa de virología y tecnología de inteligencia artificial de vanguardia, lo que demuestra que la IA puede realizar tareas de exploración biológica de manera efectiva».
MÁS INFORMACIÓN
«El siguiente paso obvio -concluye Holmes- es entrenar nuestro método para descubrir aún más de esta asombrosa diversidad, y quién sabe qué nuevas sorpresas nos aguardan».
Esta funcionalidad es sólo para suscriptores
Suscribete
Esta funcionalidad es sólo para suscriptores
Suscribete