Categorías: Tecnología

El perro robot de Boston Dynamics ahora puede hablar gracias a ChatGPT

Comparta este Artículo en:

Boston Dynamics ha mostrado una versión especial de Spot, su perro robot, que puede hablar a humanos gracias a la API de ChatGPT.

En un video compartido en YouTube, la firma perteneciente a Hyundai mostró cómo convirtió a Spot en una suerte de guía que interactúa con personas y dialoga con ellas mientras les muestra las instalaciones a su alrededor.

Para llevar a cabo estas tareas, Boston Dynamics no solo experimentó con ChatGPT y otras herramientas basadas en inteligencia artificial, sino que realizó modificaciones físicas al perro robot.

Específicamente, le incorporó un micrófono y altavoz para que pueda recibir preguntas o comentarios de los humanos a su alrededor y responder a ellos.

Para conversar con el aparato, se implementó el comando “Hey, Spot“.

Pero eso no es todo. Los ingenieros de Boston Dynamics desarrollaron un método para que la pinza de Spot funcione como “boca“.

Gracias a su habilidad para detectar y seguir objetos en movimiento, el brazo ubicado en la parte superior del robot apunta siempre hacia la persona que le está hablando; en tanto que la pinza se mueve para acompañar la voz.

Para completar el atuendo y hacerlo un poco más cómico, le colocaron ojos de plástico y un pequeño sombrero.

Uno de los puntos más interesantes de esta prueba de concepto de Boston Dynamics es que el perro robot puede utilizarse con distintas personalidades.

Al principio lo vemos usando matices y el tono de voz de un mayordomo británico, pero luego adopta expresiones que emulan a las de una adolescente o un “viajero en el tiempo shakespeariano“, entre otros tipos de identidades o temperamentos.

En este experimento, Boston Dynamics utilizó la API de ChatGPT, primero con GPT-3.5 y luego con GPT-4, así como otros modelos de lenguaje masivos de código abierto.

También se dotó a Spot de software de reconocimiento de imágenes y convertidores de voz a texto y de texto a voz.

Así mismo, los expertos sacaron provecho de lo que se conoce como “ingeniería de prompts” para lograr que el perro robot hable.

“Inspirándonos en un método de Microsoft, solicitamos a ChatGPT que hiciera como si estuviera escribiendo la siguiente línea en un script de Python.

Proporcionamos documentación en inglés al LLM en forma de comentarios.

Luego evaluamos el resultado como si fuera código Python.

El LLM tiene acceso a nuestro SDK de autonomía, un mapa del sitio del recorrido con descripciones de una línea de cada ubicación y la capacidad de decir frases o hacer preguntas”. Dice Boston Dynamics, sobre cómo hicieron “hablar” a su perro robot usando ChatGPT.

Un dato llamativo es que Boston Dynamics le encontró un uso positivo a las problemáticas alucinaciones de ChatGPT.

Es decir, a la capacidad de la IA de inventar sobre la marcha cuando desconoce la respuesta real a una pregunta que se le realiza.

“En este caso, no necesitábamos que el recorrido incluyera hechos precisos, sino que fuera entretenido, interactivo y lleno de matices“, indicaron los expertos en robótica.

En su blog oficial, la compañía ha explicado con detalles más técnicos cómo ha logrado que su perro robot utilice ChatGPT para comunicarse con humanos.

Claro que este es apenas un primer paso de un proyecto que, en un futuro no muy lejano, podría expandirse drásticamente.

“Estamos entusiasmados de seguir explorando la intersección de la inteligencia artificial y la robótica.

Estas dos tecnologías son una gran combinación. Un mundo en el que los robots puedan entender lo que le dices y convertirlo en acciones útiles probablemente no esté tan lejos“, insiste Boston Dynamics.

Por lo pronto, la firma no ha mencionado si planea experimentar algo similar con Atlas, su robot humanoide.

Fuente: Boston Dynamics

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

2 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

2 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

2 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

2 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

2 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

3 days hace
Click to listen highlighted text!