Categorías: Tecnología

Inteligencia artificial puede traducir voz y ajustar su mirada durante una videollamada

Comparta este Artículo en:

Maxine, la inteligencia artificial de NVIDIA, ahora es capaz de mejorar nuestra comunicación por internet.

Para hacerlo, permite traducir voz en tiempo real, y ajustar la mirada de sus ojos directo al lente de la cámara, incluso cuando no lo está viendo.

A día de hoy, es bastante complicado tener una conversación mediante llamadas de voz o video si nuestro interlocutor habla un idioma desconocido para nosotros.

Sin un intérprete, la comunicación se hace casi imposible, haciéndonos depender de terceros para entendernos.

Pues bien, esto está a punto de cambiar, y es que la inteligencia artificial NVIDIA, Maxine, ya puede traducir su voz en tiempo real, entre otras muchas mejoras.

Pero además de esta impresionante tecnología capaz de traducir en tiempo real, NVIDIA Maxine cuenta con otras bondades.

Una de ellas es la capacidad de apuntar la mirada del hablante en dirección a la cámara.

Todo esto, por su puesto, a través de la inteligencia artificial.

De esta forma, siempre parecerá que está viendo a los oyentes, incluso si está mirando hacia otro lado.

NVIDIA asegura que Maxine estará disponible próximamente para todos los usuarios del mundo.

De esta forma, no serán solo unos pocos los que puedan disfrutar de ella.

Desde su presentación oficial, la inteligencia artificial captó la mirada de los entusiastas por la tecnología, y con razón.

NVIDIA Maxine puede ofrecer una mejora sin precedentes a la forma en la que nos comunicamos con otros seres humanos alrededor del mundo.

Las funciones principales de realidad aumentada disponibles en NVIDIA Maxine se dividen entre las siguientes:

Seguimiento facial
Seguimiento de puntos de referencia
Malla facial
Estimación de la pose corporal
Contacto visual
Estimación de la expresión facial

Hasta ahora, quienes han podido probar esta inteligencia artificial, han llegado a una conclusión bastante parecida, y es que se trata de una herramienta más que interesante, pero que todavía le queda mucho por pulir.

Sin embargo, considerando que apenas está en desarrollo y ni siquiera cuenta con un lanzamiento oficial, NVIDIA Maxine es una propuesta bastante sorprendente.

La función denominada como Eye Contact es uno de sus aspectos más llamativos.

Al tenerla activada, su mirada pasará a observar de forma directa, pero natural, a la cámara.

Asimismo, emula pestañeos, posición y forma de los ojos; mientras que permite enfocar los ojos según varíe la posición de la cara.

Mientras todo esto sucede, puede tener su mirada apuntando a cualquier lado, ya que NVIDIA Maxine se encarga de corregirla para el resto de participantes.

El procesamiento de NVIDIA Maxine, eso sí, no estará al alcance de todos.

Según Alex Qi, una de las responsables del equipo de software detrás de esta inteligencia artificial, la herramienta cuenta con algunos requisitos básicos para funcionar.

Uno de ellos es una cámara web, como es lógico, pero también una tarjeta gráfica de la serie RTX de NVIDIA.

Sin embargo, existen formas de ejecutar la herramienta en cualquier computador, gracias a la delegación de la señal de video en otros centros de dato que se encargarán de su procesamiento.

“NVIDIA Maxine es el conjunto de un SDK de IA acelerado en la GPU y microservicios nativos en la nube para implementar funciones de IA que mejoran los efectos de audio, video y realidad aumentada en tiempo real.

Los modelos de última generación de Maxine crean efectos de alta calidad que pueden lograrse con equipos con micrófono y cámara estándar.”

Si bien la función de Eye Contact es la más popular de NVIDIA Maxine, no es la única.

Además, la inteligencia artificial le permite mejorar el audio al eliminar el ruido de fondo y el eco.

Además, también podrá aplicar mejoras a la resolución, establecer un fondo virtual para su imagen, y traducir de forma instantánea entre idiomas como el inglés, francés, español, alemán y otros más.

Tal vez algún día veamos esta misma tecnología integrada en programas como Zoom, Discord, Skype o Teams.

Después de todo, NVIDIA Maxine permitiría llevar más allá la comunicación entre personas, incluso si no hablan el mismo idioma.

Fuente: NVIDIA

Editor PDM

Entradas recientes

Herramienta de detección de sesgos de IA para combatir la discriminación en los modelos

Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…

14 hours hace

NVIDIA presenta su supercomputador compacto de IA generativa

El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…

14 hours hace

Google presenta una IA que genera videos 4K de hasta 2 minutos

Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…

14 hours hace

Whisk, la nueva IA de Google para crear imágenes a partir de otras imágenes

La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…

14 hours hace

El buscador con IA SearchGPT ahora es gratuito y busca competir con el de Google

Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…

14 hours hace

Desarrollan dispositivo que fusiona funciones de detección y computación

En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…

2 days hace
Click to listen highlighted text!