Categorías: Tecnología

IA acelera la recuperación de datos almacenados en ADN 3200 veces

Comparta este Artículo en:

Investigadores de la Facultad de Informática Henry y Marilyn Taub han desarrollado un método basado en IA que acelera la recuperación de datos de ADN en tres órdenes de magnitud, a la vez que mejora significativamente la precisión.

El equipo de investigación estuvo compuesto por el estudiante de doctorado Omer Sabary, la Dra. Daniella Bar-Lev, el Dr. Itai Orr, el Prof. Eitan Yaakobi y el Prof. Tuvi Etzion.

El almacenamiento de datos de ADN es un campo emergente que utiliza el ADN como plataforma para almacenar información.

El ADN ofrece importantes ventajas como medio de almacenamiento, entre ellas:

Preservación a largo plazo: En 2013, investigadores en Dinamarca extrajeron con éxito ADN de un hueso de caballo que data de hace 700 000 años.

En 2021, un equipo internacional recuperó ADN de mamuts que vivieron hace más de un millón de años.

En cambio, los discos magnéticos utilizados en los centros de datos tienen una vida útil que se mide en años o, en el mejor de los casos, en unas pocas décadas.

Esto resalta el potencial del ADN para el almacenamiento a largo plazo.

La nube que impulsa la mayoría de los servicios informáticos actuales depende de centros de datos que consumen aproximadamente el 3% de la electricidad global y emiten alrededor del 2% de las emisiones totales de carbono.

Con el crecimiento exponencial de los datos, se prevé que el impacto ambiental de las tecnologías existentes aumente significativamente.

El almacenamiento de ADN ofrece una densidad de datos hasta 100 millones de veces mayor que el almacenamiento digital tradicional.

Esto significa que un volumen que actualmente contiene un megabyte podría, en teoría, almacenar hasta 100 terabytes utilizando ADN.

El ADN es una molécula compuesta por una secuencia de compuestos orgánicos llamados nucleótidos.

Estos nucleótidos se clasifican en cuatro tipos, representados por las letras A, C, G y T.

A diferencia de la informática tradicional, donde los datos se codifican con solo dos dígitos (0 y 1), el almacenamiento de ADN se basa en secuencias de cuatro letras, lo que aumenta drásticamente el número de combinaciones posibles.

Para escribir (almacenar) datos en esta tecnología, se requiere la síntesis de ADN: la creación de moléculas de ADN basadas en las secuencias que codifican la información.

Para leer los datos almacenados, es necesaria la secuenciación de ADN.

El desarrollo de tecnología de almacenamiento basada en ADN presenta varios desafíos tecnológicos:

Tanto la síntesis como la secuenciación son procesos largos y propensos a errores, que introducen errores de deleción, inserción y sustitución.

Debido a las limitaciones del proceso de síntesis, se producen múltiples copias de cada molécula de ADN que codifica los datos.

Estas copias se almacenan juntas, desordenadas, en un contenedor de almacenamiento.

Durante la secuenciación, se recuperan muchas copias erróneas de estas moléculas; la mayoría contiene errores, mientras que algunas desaparecen por completo.

La investigación actual presenta una solución computacional integral para recuperar y corregir errores en sistemas complejos de almacenamiento basados ​​en ADN.

Mediante algoritmos avanzados y técnicas de codificación, los investigadores han demostrado que su solución reduce el tiempo de recuperación y lectura de datos de varios días a tan solo 10 minutos.

El método desarrollado por el Technion, DNAformer, se basa en un modelo de transformador entrenado con datos simulados (generados mediante un simulador, también desarrollado en el Technion) para reconstruir secuencias de ADN precisas a partir de copias erróneas.

El método también incluye un código de corrección de errores personalizado y adaptado al ADN, lo que garantiza una robusta integridad de los datos.

Además, un mecanismo de margen de seguridad adicional detecta secuencias de ADN especialmente ruidosas (señales o errores no deseados que se producen durante el proceso de secuenciación y que pueden interferir con la interpretación precisa de los datos) y aplica potentes herramientas algorítmicas para gestionarlas eficientemente.

Al final del proceso, los datos se convierten de nuevo en información digital.

El nuevo método permite leer 100 megabytes de datos a una velocidad 3200 veces superior a la del método más preciso existente, sin pérdida de precisión.

En comparación con los métodos rápidos conocidos anteriormente, DNAformer también mejora la precisión hasta en un 40 %, a la vez que reduce significativamente el tiempo de procesamiento.

Esto se demostró en un conjunto de datos de 3,1 megabytes, que incluía:

Una imagen fija a color
Un clip de audio de 24 segundos con las palabras del astronauta Neil Armstrong en la Luna
Un texto escrito que analiza las ventajas del ADN como prometedor método de almacenamiento de datos
Datos aleatorios para ilustrar su aplicabilidad a datos cifrados o comprimidos

Los investigadores planean desarrollar versiones personalizadas de DNAformer adaptadas a diferentes necesidades.

Destacan que su tecnología es escalable y adaptable, lo que significa que puede optimizarse para aplicaciones de almacenamiento de datos a gran escala, satisfaciendo las demandas del mercado y los futuros avances en la síntesis y secuenciación de ADN.

Fuente: Nature machine intelligence

 

Editor PDM

Entradas recientes

Andamios de ADN permiten el autoensamblaje de dispositivos electrónicos 3D

Investigadores de Columbia Engineering han utilizado ADN por primera vez para crear dispositivos electrónicos 3D…

3 hours hace

Entrenan IA para resolver complejos desafíos de planificación

Imaginemos una empresa cafetera que intenta optimizar su cadena de suministro. La empresa obtiene granos…

3 hours hace

Almacenamiento limpio y barato de energía

Científicos han inventado un sistema respetuoso con el medio ambiente y barato para almacenar energía…

3 hours hace

Robot de servicio con IA semihumanoide

En el futuro hoteles emplearán el FlashBot Arm de Pudu, un robot de servicio semihumanoide…

3 hours hace

China anuncia un cable que transmite video 8K y alimenta dispositivos al mismo tiempo

El nuevo estándar GPMI combina transmisión de video 8K, alimentación y control de dispositivos en…

3 hours hace

Físicos escuchan cómo hablan los átomos cuánticos entre sí

¿Y si pudiera oír al gato de Schrödinger? Un experimento suizo convierte el sonido en…

1 day hace
Click to listen highlighted text!