El acadio cuneiforme una de las lenguas más antiguas que se conocen, con más de 5.000 años de antigüedad. Son pocos los traductores capaces de descifrar textos escritos en ella, por lo que la IA podría significar todo un avance.
Investigadores de la Universidad de Tel Aviv han conseguido traducir al inglés textos escritos en acadio con el sistema cuneiforme, una de las lenguas más antiguas conocidas con más de 5.000 años de antigüedad.
Lo han logrado desarrollando una inteligencia artificial que podrá ser usada tanto por expertos como por profanos en la materia.
La escritura cuneiforme se caracteriza, entre otras cosas, porque se llevaba a cabo sobre tablillas de arcilla con un instrumento llamado estilete, que se usaba a modo de lápiz.
Las marcas que quedaban impresas en la arcilla eran como muescas y al principio representaban pictogramas (palabras-signo) y luego fonogramas (palabras-concepto).
Cuando se terminaba de escribir (se usaban las dos caras), las tablillas se cocían en el horno o se ponían al sol.
El cuneiforme es uno de los sistemas de escritura más antiguos de la humanidad.
Se cree que se usó desde el 3.400 a.C. aproximadamente al 75 d.C. Tal y como apuntan los investigadores en su publicación, en los dos últimos siglos se han encontrado muchos textos cuneiformes, cientos de miles, sobre todo escritos en sumerio y acadio.
Estos escritos documentan la historia política, social, económica y científica de la antigua Mesopotamia.
Sin embargo, la mayoría de estos documentos no han podido traducirse por ser pocos los expertos que son capaces de traducirlos y mucho el material a descifrar.
Ahora, parece que la tarea de traducción podría ser más sencilla gracias a la IA desarrollada por los investigadores.
“Este trabajo presenta un modelo de traducción automática neuronal de última generación para la traducción automática de textos acadios al inglés, a partir de glifos cuneiformes Unicode y de transliteraciones de los signos cuneiformes, logrando puntuaciones de 36,52 y 37,47 Best Bilingual Evaluation Understudy 4 (BLEU4), respectivamente.
Es especialmente eficaz a la hora de mantener el estilo del género textual en la traducción”, dicen los investigadores en su publicación.
Los investigadores llevaban desde el 2000 con el proyecto de IA traductora.
Ese año anunciaron que habían desarrollado una inteligencia artificial que era capaz de traducir el acadio cuneiforme a la transliteración del latín, que refleja la forma exacta en que una determinada palabra se representa en su lengua original.
Tuvieron éxito y es que las traducciones alcanzaron un 97 % de precisión.
Eso sí, posteriormente había que traducir de la transliteración latina al inglés.
Lo que acaban de conseguir es que la IA directamente traduzca del acadio al inglés, con el esfuerzo extra de tener que encadenar frases completas que tengan sentido en ese idioma.
La tarea no ha sido fácil y es que los investigadores han tenido que entrenar a la IA con muy pocos textos e imágenes de tablillas, todo lo contrario que ChatGPT, que se ha entrenado con prácticamente todo Internet.
Los investigadores sacaron las muestras de una base de datos de la Universidad de Pensilvania llamada ORACC (Open Richly Annotated Cuneiform Corpus).
El 90% de la muestra, unas 50.544 frases se emplearon para entrenar a la IA. El 10 % restante se empleó para la validación y para hacer pruebas.
Otra dificultad a la que se enfrentaron los investigadores fue a las variaciones que se produjeron en el propio acadio durante el tiempo que se empleó, cambios que dieron lugar a dialectos con símbolos cuneiformes diferentes.
Los investigadores están contentos con lo conseguido y afirman que los mejores resultados se han obtenido en frases cortas y de longitud media.
Las frases más largas funcionaron peor, “produjeron más alucinaciones o traducciones ausentes”, dicen los investigadores.
“Esto es prometedor para el uso en escenarios realistas, ya que todos los textos cuneiformes se dividen en líneas manejables en la tablilla de arcilla”.
La IA funcionó especialmente bien en géneros de estilo técnico o formulista, como decretos reales o textos adivinatorios, que siguen un cierto patrón, que en escritos más poéticos y literarios, como cartas o tratados que son más libres.
Para medir la calidad de las traducciones hechas por la IA, los investigadores han usado el Best Bilingual Evaluation Understudy 4 (BLEU4), una herramienta que puntúa cómo de precisas son las traducciones realizadas por la inteligencia artificial.
Sobre 100, BLEU4 le puso un 36,52 a la traducción del acadio al inglés y un 37,47 a la transliteración del acadio al inglés.
El modelo está en una fase inicial y los investigadores esperan mejorarlo en el futuro.
“A medida que aumente el número de textos digitalizados, el modelo podrá mejorarse mediante un entrenamiento adicional como parte de un sistema humano en bucle que corrija los resultados”.
El equipo está orgulloso ya que tener una puntuación de cerca de 37 es algo muy bueno y es que, según ellos Google Translate tendría una nota de 60 al traducir del español al inglés.
Fuente: PNAS