Categorías: Ciencia

Nuevo software e inteligencia artificial para analizar datos genómicos

Comparta este Artículo en:

La complejidad de un organismo emerge de su genoma, el libro que contiene las instrucciones de su ADN para la vida.

El método para leer este libro, la secuenciación, ha evolucionado hacia la lectura de fragmentos cada vez más largos del genoma.

En este campo, un grupo de investigación liderado por el Instituto de Biología Integrativa de Sistemas (I2SysBio), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad de Valencia (UV), en España, ha creado y presentado públicamente una mejora de un programa informático propio capaz de descubrir nuevos tránscritos, moléculas de ARN que usan los genes para sintetizar proteínas y crear tejidos, a partir de su secuenciación con instrumentos de lectura larga, así como asignarles una función en la formación del organismo.

La secuenciación de lectura larga (long-read sequencing) es la tercera generación de métodos de secuenciación del genoma.

Frente a la lectura de fragmentos cortos, que analiza unos 200 nucleótidos (las letras que componen los genes), los métodos de lectura larga pueden obtener lecturas 100 veces más largas, unos 20.000 nucleótidos, lo que deja menos huecos en la información del genoma para rellenar mediante herramientas bioinformáticas.

Esta fue una de las razones para que la propia Nature Methods lo considerase Método del Año 2022.

Unos años antes, en 2018, la investigadora Ana Conesa, entonces en la Universidad de Florida, desarrolló un programa informático llamado SQANTI para analizar la información que se extraía mediante estos métodos de lectura larga.

Ahora, su equipo de investigación en el I2SysBio, que incluye a Francisco J. Pardo-Palacios, presenta una mejora sustancial de este software que se puede usar libremente en los principales sistemas comerciales que emplean secuenciación de lectura larga, Pacific Biosciences (PacBio) y Oxford Nanopore Technologies (ONT).

“Las técnicas de lectura larga analizan mejor la complejidad de los tránscritos y el transcriptoma humanos”, opina Conesa.

Esto identifica la porción del genoma que se lee en cada célula para dar lugar a tejidos y órganos.

Así, un único gen puede dar lugar, mediante pequeños cambios en la estructura de ARN que codifica, a una gran diversidad tránscritos, y con ellos de proteínas con distintas funciones celulares.

“La secuenciación de lectura corta no puede resolver este rompecabezas.

La lectura larga reconstruye mejor la complejidad funcional del transcriptoma humano, algo clave para estudiar determinadas enfermedades, sobre todo de tipo neurológico y en cáncer”, sostiene la investigadora del CSIC.

La versión publicada ahora, SQANTI3, soluciona algunos problemas anteriores, derivados de la degradación del ARN o el análisis único de cada molécula, para introducir notables mejoras.

El programa es capaz ahora de descubrir nuevos tránscritos que no estaban en las bases de datos del genoma que usan estos programas informáticos.

Además, mediante técnicas de inteligencia artificial, el software puede asignar información funcional para el nuevo tránscrito, “algo esencial para entender la complejidad funcional del organismo y de las enfermedades”, remarca Conesa.

Para desarrollar este programa informático se ha usado el clúster de computación Garnatxa del I2SysBio, que dispone de 15 nodos de computación capaces de ofrecer 950 hilos de cómputo en paralelo.

En el desarrollo de SQANTI3 colaboraron la Universidad de Florida y Pacific Biosciences, una de las empresas que comercializa la tecnología para la secuenciación de lectura larga mediante su sistema PacBio, que recomienda el uso del software español para analizar sus datos.

El uso del programa informático es libre, contando ya con “miles de usuarios en todo el mundo”, según Conesa, aunque “el éxito de esta herramienta requiere también de más personal técnico para atender a las numerosas peticiones que recibimos”.

Así, la investigadora ha coliderado la reciente puesta en marcha de la Conexión CSIC de Biología Computacional y Bioinformática, una plataforma para conectar personas, métodos y recursos en estos ámbitos en el CSIC.

Fuente: Nature

Editor PDM

Entradas recientes

Atlas, robot completamente eléctrico e impulsado por IA

Boston Dynamics renovó su robot humanoide con una versión completamente eléctrica e impulsada por inteligencia…

25 mins hace

Samsung presenta la primera DRAM de 10,7 Gbps de la industria, para aplicaciones de IA

Aprovechando la tecnología de proceso de clase de 12 nanómetros (nm), Samsung presenta la primera…

26 mins hace

Inteligencia artificial para detectar contenidos radicalizantes

Actualmente, los sistemas de inteligencia artificial son capaces de generar e interpretar contenidos a gran…

28 mins hace

Inteligencia artificial intuitiva contra el cáncer

En un intento por mejorar la investigación y los tratamientos contra el cáncer, científicos han…

29 mins hace

Motorola Edge 50 Ultra con cámaras y diseño innovadores

Se centra en la apuesta fotográfica, pero también quiere destacar en diseño. (more…)

1 day hace

Adobe integrará este año inteligencia artificial generadora de video

Aunque los videos generados con IA todavía tienen camino por recorrer, era solo cuestión de…

1 day hace
Click to listen highlighted text!