Google enseña a una inteligencia artificial a detectar mutaciones en el ADN

Google enseña a una inteligencia artificial a detectar mutaciones en el ADN

Comparta este Artículo en:

Si alguna vez has visto un drama policial como CSI, probablemente recuerde una escena en la que un analista forense usa una computadora para recorrer miles de fragmentos de ADN, buscando una coincidencia entre la escena del crimen y un sospechoso.

La vida real no sucede como en la televisión, pero la esencia es la misma.

La genética es intrínsecamente una ciencia comparativa.

Ya sea que intente identificar a un sospechoso o una enfermedad genética o un pariente perdido hace mucho tiempo, se trata de comparar un genoma con otro, buscando expresiones o similitudes entre miles de millones de letras de ADN.

Pero mientras que encontrar a un familiar o sospechoso de un delito generalmente implica mirar solo unos pocos fragmentos del código genético de una persona, problemas como identificar la variante genética responsable de una enfermedad requieren muchos más datos.

Incluso con todas las matemáticas sofisticadas diseñadas para ayudar a los científicos a hacer esto, dar sentido a toda esa información sigue siendo un gran desafío.

También es exactamente el tipo de problema para el que la inteligencia artificial está diseñada para resolver.

Google lanzó una herramienta llamada DeepVariant que utiliza el aprendizaje profundo para reconstruir el genoma de una persona e identificar con mayor precisión las mutaciones en una secuencia de ADN.

Construido sobre la base de la misma tecnología que permite a Google identificar si una foto es de un gato o un perro, DeepVariant resuelve un problema importante en el mundo del análisis de ADN.

Los secuenciadores modernos de ADN realizan lo que se conoce como secuenciación de alto rendimiento, y no devuelven una lectura larga de una secuencia completa de ADN, sino fragmentos cortos que se superponen.

Esos fragmentos se comparan con otros genomas para ayudar a unirlos e identificar variaciones.

Pero la tecnología es propensa a errores, y puede ser difícil para los científicos distinguir entre esos errores y pequeñas mutaciones. Y la pequeña mutación importa.

Podría proporcionar información importante sobre, digamos, la causa raíz de una enfermedad.

Distinguir qué pares de bases son el resultado de un error y cuáles son reales se llama “llamada de variantes”.

Ya hay herramientas para ayudar a los científicos a hacer esto.

La más utilizada es GATK, un algoritmo de ingeniería humana que aplica estadísticas para determinar dónde las máquinas de secuenciación a menudo cometen errores.

DeepVariant, sin embargo, aprovecha la tecnología de red neuronal para construir algo más preciso que cualquier otra cosa en existencia.

El año pasado, ganó el primer lugar en un concurso de la FDA destinado a mejorar la precisión de la secuenciación genética.

Las redes neuronales se llaman así porque son análogas a cómo funcionan las neuronas en el cerebro.

Cada capa de la red trata un problema progresivamente más complejo.

Para usar una IA de reconocimiento de imágenes para construir una secuencia de ADN precisa, el equipo de Google convirtió los datos de secuenciación de ADN en una imagen.

Los As, Ts, Cs y Gs que componen un código genético, por ejemplo, se representaron visualmente como rojo.

Luego, los investigadores entrenaron su red en millones de genomas secuenciados y lecturas de alto rendimiento, enseñándoles qué cosas pesan más y cuáles ignorar.

El algoritmo resultante puede ordenar las mutaciones reales de los errores con más precisión que cualquier sistema anterior.

Inicialmente, las imágenes estaban formadas por solo tres colores o tres capas de datos.

Pero la última versión lanzada esta semana contiene siete, lo que lo hace aún más preciso.

Fue lanzado como un software de código abierto, que los investigadores externos pueden usar e incluso aumentar.

DeepVariant de ninguna manera es 100% precisa.

Pero su éxito es representativo del impacto que el aprendizaje automático está a punto de tener en la genómica.

La escala y complejidad de los datos genómicos es inmensa.

Las máquinas pueden ser justo lo que necesitamos para darle sentido.

Fuente: Gizmodo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *