Categorías: Tecnología

Desarrollan inteligencia artificial capaz de traducir una de las lenguas más antiguas del mundo

Comparta este Artículo en:

El acadio cuneiforme una de las lenguas más antiguas que se conocen, con más de 5.000 años de antigüedad. Son pocos los traductores capaces de descifrar textos escritos en ella, por lo que la IA podría significar todo un avance.

Investigadores de la Universidad de Tel Aviv han conseguido traducir al inglés textos escritos en acadio con el sistema cuneiforme, una de las lenguas más antiguas conocidas con más de 5.000 años de antigüedad.

Lo han logrado desarrollando una inteligencia artificial que podrá ser usada tanto por expertos como por profanos en la materia.

La escritura cuneiforme se caracteriza, entre otras cosas, porque se llevaba a cabo sobre tablillas de arcilla con un instrumento llamado estilete, que se usaba a modo de lápiz.

Las marcas que quedaban impresas en la arcilla eran como muescas y al principio representaban pictogramas (palabras-signo) y luego fonogramas (palabras-concepto).

Cuando se terminaba de escribir (se usaban las dos caras), las tablillas se cocían en el horno o se ponían al sol.

El cuneiforme es uno de los sistemas de escritura más antiguos de la humanidad.

Se cree que se usó desde el 3.400 a.C. aproximadamente al 75 d.C. Tal y como apuntan los investigadores en su publicación, en los dos últimos siglos se han encontrado muchos textos cuneiformes, cientos de miles, sobre todo escritos en sumerio y acadio.

Estos escritos documentan la historia política, social, económica y científica de la antigua Mesopotamia.

Sin embargo, la mayoría de estos documentos no han podido traducirse por ser pocos los expertos que son capaces de traducirlos y mucho el material a descifrar.

Ahora, parece que la tarea de traducción podría ser más sencilla gracias a la IA desarrollada por los investigadores.

“Este trabajo presenta un modelo de traducción automática neuronal de última generación para la traducción automática de textos acadios al inglés, a partir de glifos cuneiformes Unicode y de transliteraciones de los signos cuneiformes, logrando puntuaciones de 36,52 y 37,47 Best Bilingual Evaluation Understudy 4 (BLEU4), respectivamente.

Es especialmente eficaz a la hora de mantener el estilo del género textual en la traducción”, dicen los investigadores en su publicación.

Los investigadores llevaban desde el 2000 con el proyecto de IA traductora.

Ese año anunciaron que habían desarrollado una inteligencia artificial que era capaz de traducir el acadio cuneiforme a la transliteración del latín, que refleja la forma exacta en que una determinada palabra se representa en su lengua original.

Tuvieron éxito y es que las traducciones alcanzaron un 97 % de precisión.

Eso sí, posteriormente había que traducir de la transliteración latina al inglés.

Lo que acaban de conseguir es que la IA directamente traduzca del acadio al inglés, con el esfuerzo extra de tener que encadenar frases completas que tengan sentido en ese idioma.

La tarea no ha sido fácil y es que los investigadores han tenido que entrenar a la IA con muy pocos textos e imágenes de tablillas, todo lo contrario que ChatGPT, que se ha entrenado con prácticamente todo Internet.

Los investigadores sacaron las muestras de una base de datos de la Universidad de Pensilvania llamada ORACC (Open Richly Annotated Cuneiform Corpus).

El 90% de la muestra, unas 50.544 frases se emplearon para entrenar a la IA. El 10 % restante se empleó para la validación y para hacer pruebas.

Otra dificultad a la que se enfrentaron los investigadores fue a las variaciones que se produjeron en el propio acadio durante el tiempo que se empleó, cambios que dieron lugar a dialectos con símbolos cuneiformes diferentes.

Los investigadores están contentos con lo conseguido y afirman que los mejores resultados se han obtenido en frases cortas y de longitud media.

Las frases más largas funcionaron peor, “produjeron más alucinaciones o traducciones ausentes”, dicen los investigadores.

“Esto es prometedor para el uso en escenarios realistas, ya que todos los textos cuneiformes se dividen en líneas manejables en la tablilla de arcilla”.

La IA funcionó especialmente bien en géneros de estilo técnico o formulista, como decretos reales o textos adivinatorios, que siguen un cierto patrón, que en escritos más poéticos y literarios, como cartas o tratados que son más libres.

Para medir la calidad de las traducciones hechas por la IA, los investigadores han usado el Best Bilingual Evaluation Understudy 4 (BLEU4), una herramienta que puntúa cómo de precisas son las traducciones realizadas por la inteligencia artificial.

Sobre 100, BLEU4 le puso un 36,52 a la traducción del acadio al inglés y un 37,47 a la transliteración del acadio al inglés.

El modelo está en una fase inicial y los investigadores esperan mejorarlo en el futuro.

“A medida que aumente el número de textos digitalizados, el modelo podrá mejorarse mediante un entrenamiento adicional como parte de un sistema humano en bucle que corrija los resultados”.

El equipo está orgulloso ya que tener una puntuación de cerca de 37 es algo muy bueno y es que, según ellos Google Translate tendría una nota de 60 al traducir del español al inglés.

Fuente: PNAS

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace
Click to listen highlighted text!