Un algoritmo desarrollado por científicos de computación de la Universidad de Brown permite que los robots usar un lapicero y escribir palabras usando patrones de trazo similares a la escritura humana.
Es un paso, dicen los investigadores, hacia robots que sean capaces de comunicarse más fluidamente con compañeros de trabajo humanos y colaboradores.
“Con solo mirar la imagen de destino de una palabra o boceto, el robot puede reproducir cada trazo como una acción continua”, dijo Atsunobu Kotani, un estudiante universitario de Brown que dirigió el desarrollo del algoritmo.
“Eso hace que sea difícil para las personas distinguir si fue escrito por el robot o si fue escrito por un humano”.
El algoritmo hace uso de redes de aprendizaje profundo que analizan imágenes de palabras escritas a mano o bocetos y pueden deducir la serie probable de trazos de lápiz que los creó.
Luego, el robot puede reproducir las palabras o los bocetos con los trazos del lápiz que aprendió.
Los investigadores demostraron un robot que pudo escribir “hola” en 10 idiomas que emplean diferentes conjuntos de caracteres.
El robot también fue capaz de reproducir bocetos en bruto, incluyendo uno de la Mona Lisa.
Stefanie Tellex, profesora asistente de ciencias de la computación en Brown y asesora de Kotani, dice que lo que hace que este trabajo sea único es la capacidad del robot para aprender desde cero.
“Gran parte del trabajo existente en esta área requiere que el robot tenga información sobre el orden de los trazos de antemano”, dijo Tellex.
“Si quisiera que el robot escribiera algo, alguien tendría que programar las órdenes de los trazos cada vez.
Con lo que Atsu ha hecho, puede dibujar lo que quiera y el robot puede reproducirlo.
No siempre hace el orden perfecto de los trazos. , pero se acerca bastante”.
Otro aspecto notable del trabajo, dice Tellex, es cómo el algoritmo fue capaz de generalizar su capacidad para reproducir trazos.
Kotani entrenó su algoritmo de aprendizaje profundo utilizando un conjunto de caracteres japoneses, y demostró que podía reproducir los caracteres y los trazos que los crearon con aproximadamente el 93 por ciento de precisión.
Pero para gran sorpresa de los investigadores, el algoritmo terminó reproduciendo tipos muy diferentes que nunca había visto antes: letra inglesa y cursiva, por ejemplo.
“Nos hubiera gustado que solo hubiéramos aprendido los caracteres japoneses”, dijo Tellex.
“Pero una vez que comenzó a trabajar en inglés, nos sorprendió. Luego decidimos ver hasta dónde podríamos llegar”.
Tellex y Kotani les pidieron a todos los que trabajan en el laboratorio de Humans to Robots de Tellex que escriban “hola” en sus idiomas nativos, que incluyen griego, hindi, urdu, chino y yiddish, entre otros.
El robot fue capaz de reproducirlos todos con una precisión de trazo razonable.
“Siento que hay algo realmente hermoso en el robot que escribe en tantos idiomas diferentes”, dijo Tellex. “Pensé que eso era realmente genial”.
Pero la obra maestra del sistema puede ser su copia del bosquejo de Mona Lisa de Kotani.
Dibujó su bosquejo en un tablero de borrado en seco en el laboratorio de Tellex y luego permitió que el robot lo copiara con bastante fidelidad en el mismo tablero, justo debajo del original de Kotani.
“Era temprano en la mañana cuando nuestro robot finalmente dibujó a la Mona Lisa en la pizarra”, dijo Kotani.
“Cuando regresé al laboratorio, todos estaban de pie alrededor de la pizarra, mirando a la Mona Lisa y preguntándome si [el robot] dibujaba esto. No podían creerlo”.
Fue un gran momento para Kotani porque “fue el momento en que nuestro robot definió lo que está más allá de la mera impresión”.
Una impresora de inyección de tinta puede recrear una imagen, pero lo hace con un cabezal de impresión que se remonta a la construcción de la imagen línea por línea.
Pero este fue el robot que creó una imagen con trazos parecidos a los humanos, que para Kotani es “algo mucho más humano y expresivo”.
La clave para hacer que el sistema funcione, dice Kotani, es que el algoritmo utiliza dos modelos distintos de la imagen que está tratando de reproducir.
Utilizando un modelo global que considera la imagen como un todo, el algoritmo identifica un punto de partida probable para realizar el primer trazo.
Una vez que el trazo ha comenzado, el algoritmo se acerca, mirando la imagen pixel por pixel para determinar dónde debe ir ese trazo y cuánto tiempo debe durar.
Cuando llega al final del trazo, el algoritmo vuelve a llamar al modelo global para determinar dónde debe comenzar el siguiente trazo, y luego se regresa al modelo ampliado.
Este proceso se repite hasta completar la imagen.
Tanto Kotani como Tellex dicen que el trabajo es un paso hacia una mejor comunicación entre las personas y los robots.
En última instancia, visualizan robots que pueden dejar notas de Post-it, tomar dictados o hacer bocetos para sus compañeros de trabajo y colaboradores humanos.
“Quiero que un robot pueda hacer todo lo que una persona puede hacer”, dijo Tellex.
“Estoy particularmente interesado en un robot que puede usar el lenguaje.
Escribir es una forma en que las personas usan el lenguaje, así que pensamos que deberíamos intentarlo”.
Fuente: Techxplore
Científicos han descubierto un gen que relaciona la sordera con la muerte celular en el…
Un sistema diseñado en el MIT podría permitir que los sensores funcionen en entornos remotos,…
Investigadores de la Universidad de Inteligencia Artificial Mohamed Bin Zayed en Abu Dhabi desarrollaron una…
El material también permite hacer torres más altas y fáciles de transportar. (more…)
Los compuestos de fermiones pesados son una clase de materiales con electrones hasta mil veces…
La apuesta por la IA es un argumento llamativo, pero hay mejoras aún más destacables…