Medicina

IA que lee frases ahora está detectando mutaciones del coronavirus

En un estudio publicado el 14 de enero en Science, Berger y sus colegas unen varias de estas hebras y usan el procesamiento de lenguaje natural (NLP) para predecir mutaciones que permiten que los virus eviten ser detectados por anticuerpos en el sistema inmunológico humano, un proceso conocido como escape inmunológico viral. La idea básica es que la interpretación de un virus por un sistema inmunológico es análoga a la interpretación de una oración por un humano.

«Es un documento impecable, que se basa en el impulso de trabajos anteriores», dice Ali Madani, científico de Salesforce, que utiliza el NLP para predecir secuencias de proteínas.

Oraciones y virus

El equipo de Berger utiliza dos conceptos lingüísticos diferentes: gramática y semántica (o significado). La aptitud genética o evolutiva de un virus —características tales como lo bueno que es para infectar a un huésped— puede interpretarse en términos de corrección gramatical. Un virus infeccioso exitoso es gramaticalmente correcto; uno que no tiene éxito no lo es.

De manera similar, las mutaciones de un virus se pueden interpretar en términos de semántica. Las mutaciones que hacen que un virus parezca diferente a las cosas de su entorno, como los cambios en las proteínas de su superficie que lo hacen invisible para ciertos anticuerpos, han alterado su significado. Los virus con diferentes mutaciones pueden tener diferentes significados, y un virus con un significado diferente puede necesitar diferentes anticuerpos para leerlo.

Para modelar estas propiedades, los investigadores utilizaron un LSTM, un tipo de red neuronal que es anterior a las basadas en transformadores utilizadas por modelos de lenguaje grandes como GPT-3. Estas redes más antiguas se pueden entrenar con muchos menos datos que los transformadores y aún funcionan bien para muchas aplicaciones.

En lugar de millones de oraciones, entrenaron el modelo de NLP en miles de secuencias genéticas tomadas de tres virus diferentes: 45,000 secuencias únicas para una cepa de influenza, 60,000 para una cepa de VIH y entre 3,000 y 4,000 para una cepa de Sars-Cov. -2, el virus que causa el covid-19. «Hay menos datos sobre el coronavirus porque ha habido menos vigilancia», dice Brian Hie, un estudiante graduado del MIT, que construyó los modelos.

Redacción IA

Entradas recientes

La IA logra su mayor avance matemático hasta ahora

Un modelo de inteligencia artificial (IA) acaba de conseguir algo que durante décadas muchos matemáticos…

3 horas hace

Director de Spotify defiende su decisión de apostar por la música con IA

Alex Norström, CEO de Spotify, defendió públicamente la decisión de la compañía de incorporar música…

1 día hace

Uber busca métricas para justificar el gasto en herramientas de IA

Las tensiones internas por el gasto en inteligencia artificial ganaron visibilidad en Uber después de…

1 día hace

Cada vez más personas solicitan cirugías faciales recomendadas por IA

El auge de la inteligencia artificial (IA) en aplicaciones de edición de imágenes y chatbots…

1 día hace

La IA predice quién será el ganador de las elecciones presidenciales de Colombia

La carrera por la Presidencia de Colombia entra en una etapa decisiva y las más…

1 día hace

Modelos predictivos basados en IA en el deporte contemporáneo

En las últimas dos décadas, la inteligencia artificial (IA) ha redefinido múltiples campos del conocimiento…

1 día hace