Una técnica de aprendizaje automático revela palabras griegas en tomografías computarizadas de papiro enrollado.
Un estudiante de informática de 21 años ganó un concurso mundial para leer el primer texto dentro de un pergamino carbonizado de la antigua ciudad romana de Herculano, que había sido ilegible desde una erupción volcánica en el año 79 d.C., la misma que sepultó cerca Pompeya.
El avance podría abrir cientos de textos de la única biblioteca intacta que ha sobrevivido de la antigüedad grecorromana.
Luke Farritor, de la Universidad de Nebraska-Lincoln, desarrolló un algoritmo de aprendizaje automático que ha detectado letras griegas en varias líneas del papiro enrollado, incluida πορϕυρας (porphyras), que significa “púrpura“.
Farritor utilizó diferencias sutiles y de pequeña escala en la textura de la superficie para entrenar su red neuronal y resaltar la tinta.
“Cuando vi la primera imagen, quedé impactada”, dice Federica Nicolardi, papiróloga de la Universidad de Nápoles en Italia y miembro del comité académico que revisó los hallazgos de Farritor.
“Fue un gran sueño”, dice. Ahora, “de hecho puedo ver algo desde el interior de un pergamino”.
Cientos de pergaminos fueron enterrados por el Monte Vesubio en octubre del año 79 d. C., cuando la erupción dejó Herculano bajo 20 metros de ceniza volcánica.
Los primeros intentos de abrir los papiros crearon un desorden de fragmentos y los estudiosos temieron que el resto nunca pudiera desenrollarse ni leerse.
“Estos son objetos tan locos. Están todos arrugados y aplastados”, dice Nicolardi.
El Vesuvius Challenge ofrece una serie de premios, entre los que destaca un premio principal de 700.000 dólares estadounidenses por leer cuatro o más pasajes de un pergamino enrollado.
El 12 de octubre, los organizadores anunciaron que Farritor había ganado el premio de las “primeras letras” de 40.000 dólares por leer más de 10 caracteres en un área de papiro de 4 centímetros cuadrados.
Youssef Nader, un estudiante de posgrado de la Universidad Libre de Berlín, recibe 10.000 dólares por quedar en segundo lugar.
Ver finalmente letras y palabras dentro de un pergamino es “extremadamente emocionante”, dice Thea Sommerschield, historiadora de la antigua Grecia y Roma de la Universidad Ca’ Foscari de Venecia, Italia.
Los rollos fueron descubiertos en el siglo XVIII, cuando unos trabajadores encontraron los restos de una villa de lujo que podría haber pertenecido a la familia del suegro de Julio César.
Descifrar los papiros, dice Sommerschield, podría “revolucionar nuestro conocimiento de la historia y la literatura antiguas”.
La mayoría de los textos clásicos conocidos hoy en día son el resultado de repetidas copias realizadas por escribas durante siglos.
Por el contrario, la biblioteca de Herculano contiene obras no conocidas de otras fuentes, directamente de los autores.
Hasta ahora, los investigadores sólo podían estudiar fragmentos abiertos.
Se han identificado algunas obras latinas, pero la mayoría contiene textos griegos relacionados con la escuela de filosofía epicúrea.
Hay partes de Sobre la naturaleza, escritas por el propio Epicuro, y obras de un filósofo poco conocido llamado Filodemo sobre temas como los vicios, la música, la retórica y la muerte.
Se ha sugerido que la biblioteca podría haber sido alguna vez su colección de trabajo.
Pero más de 600 rollos, la mayoría conservados en la Biblioteca Nacional de Nápoles, y unos pocos en el Reino Unido y Francia, permanecen intactos y sin abrir.
Y aún se pueden encontrar más papiros en los pisos inferiores de la villa, que aún no han sido excavados.
Brent Seales, un científico informático que ayudó a crear el Vesuvius Challenge, y su equipo pasaron años desarrollando métodos para “desenvolver virtualmente” las capas cada vez más delgadas mediante tomografía computarizada (TC) de rayos X y visualizarlas como una serie de imágenes planas.
En 2016, Seales, que está en la Universidad de Kentucky en Lexington, informó que utilizó la técnica para leer un rollo carbonizado de En-Gedi en Israel, revelando secciones del Libro de Levítico, parte de la Torá judía y el Antiguo Testamento cristiano, escrito en el siglo III o IV d.C.
Pero la tinta del pergamino En-Gedi contiene metal, por lo que brilla intensamente en las tomografías computarizadas.
La tinta de los pergaminos más antiguos de Herculano está basada en carbón, esencialmente carbón y agua, con la misma densidad en los escaneos que el papiro sobre el que se asienta, por lo que no aparece en absoluto.
Seales se dio cuenta de que incluso sin diferencias en el brillo, las tomografías computarizadas podrían capturar pequeñas diferencias en la textura que pueden distinguir áreas de papiro recubiertas de tinta.
Para demostrarlo, entrenó una red neuronal artificial para leer letras en imágenes de rayos X de fragmentos abiertos de Herculano.
Luego, en 2019, llevó dos pergaminos intactos del Instituto de Francia en París a Diamond Light Source, una instalación de rayos X sincrotrón cerca de Oxford, Reino Unido, para escanearlos con la resolución más alta hasta el momento (4 a 8 micrómetros por elemento de imagen 3D o vóxel).
Sin embargo, leer pergaminos intactos seguía siendo una tarea enorme, por lo que el equipo hizo públicos todos sus escaneos y códigos y lanzó el Vesuvius Challenge.
“Todos estuvimos de acuerdo en que preferiríamos leer lo que hay dentro antes que intentar acaparar todo”, dice Seales.
Pronto, alrededor de 1.500 equipos comenzaron a discutir y colaborar a través de la plataforma de chat para jugadores Discord.
Los premios se diseñaron en fases y, a medida que se alcanza cada hito, se publica el código ganador para que todos puedan aprovecharlo. Farritor, que siempre había estado interesado en la historia y aprendió por sí mismo latín cuando era niño, se involucró desde el principio.
Paralelamente, el equipo de Seales trabajó en el desenvoltorio virtual, publicando imágenes de las piezas aplanadas para que los concursantes las analizaran.
Un momento clave llegó a finales de junio, cuando un competidor señaló que en algunas imágenes, la tinta era ocasionalmente visible a simple vista, como una textura sutil que pronto fue denominada “crujido”.
Farritor inmediatamente se centró en el crujido, buscando más indicios de letras.
Una tarde de agosto, estaba en una fiesta cuando recibió una alerta de que se había lanzado un segmento nuevo, con un crujido particularmente prominente.
Conectándose a través de su teléfono, ejecutó su algoritmo en la nueva imagen.
Al regresar a casa una hora más tarde, sacó su teléfono y vio cinco letras en la pantalla.
“Estaba saltando arriba y abajo“, dice. “Dios mío, esto realmente va a funcionar“.
A partir de ahí, sólo tomó unos días perfeccionar el modelo e identificar las diez letras necesarias para el premio.
Los papirólogos también están entusiasmados.
La palabra “púrpura” aún no se ha leído en los rollos abiertos de Herculano.
El tinte morado era muy buscado en la antigua Roma y se elaboraba a partir de glándulas de caracoles marinos, por lo que el término podría referirse al color morado, a las túnicas, al rango de personas que podían permitirse el tinte o incluso a los moluscos.
Pero más importante que la palabra individual es leer cualquier cosa, dice Nicolardi.
El avance “nos da potencialmente la posibilidad de recuperar el texto de un pergamino completo“, incluido el título y el autor, para que las obras puedan ser identificadas y fechadas.
Yannis Assael, investigador científico de Google DeepMind en Londres, describe el Vesuvius Challenge como “único e inspirador”.
Pero es parte de un cambio más amplio, señala, en el que la inteligencia artificial (IA) ayuda cada vez más al estudio de textos antiguos.
El año pasado, por ejemplo, Assael y Sommerschield lanzaron una herramienta de inteligencia artificial llamada Ithaca, diseñada para ayudar a los académicos a recopilar la fecha y los orígenes de inscripciones griegas antiguas no identificadas y hacer sugerencias de texto para llenar cualquier vacío.
Ahora recibe cientos de consultas por semana y se están aplicando esfuerzos similares a idiomas desde el coreano hasta el acadio, que se utilizaba en la antigua Mesopotamia.
Seales espera que el aprendizaje automático abra lo que él llama la “biblioteca invisible”.
Esto se refiere a textos que están físicamente presentes, pero que nadie puede ver, incluido el pergamino utilizado en las encuadernaciones de libros medievales; palimpsestos, en los que la escritura posterior oscurece una capa debajo; y cartonaje, en el que se utilizaban restos de papiro antiguo para fabricar máscaras y estuches de momias del antiguo Egipto.
Por ahora, sin embargo, todas las miradas están puestas en el Vesuvius Challenge.
La fecha límite para el gran premio es el 31 de diciembre y Seales describe el ambiente como “optimismo desenfrenado”.
Farritor, por su parte, ya ha ejecutado sus modelos en otros segmentos del pergamino y está viendo aparecer muchos más personajes.
Fuente: Nature