Maxine es la nueva plataforma de Nvidia y llega dispuesta a revolucionar las videollamadas.
Se trata de un nuevo servicio en la nube que Nvidia ofrecerá a otros desarrolladores, donde mediante inteligencia artificial se incorporan una serie de efectos para mejorar las videollamadas.
No hablamos de unos simples filtros de belleza, sino de aplicar el potencial de los deepfakes a las videollamadas para incrementar “significativamente” su calidad, según explica la compañía.
Entre los curiosos efectos que promete Nvidia Maxine se encuentra la superresolución, la cancelación del ruido de fondo, iluminación facial, reducción del ancho de banda y hasta la corrección de la mirada, para que parezca que siempre estamos mirando a cámara.
Nvidia ha anunciado actualizaciones sobre cerca de 80 SDKs de su catálogo.
Otra de las novedades es Maxine, un servicio para videollamadas que está disponible en beta desde esta semana.
Maxine aprovecha las ‘redes generativas antagónicas’, más conocidas sencillamente como GANs, para analizar la imagen de la videollamada y recrearla parcialmente con el objetivo de introducir una mejora.
Una de las primeras herramientas que ofrece Maxine es la de analizar el rostro de la persona y mediante algoritmos identificar los píxeles clave.
Con esto, Maxine promete reducir hasta un 90% el ancho de banda de las videollamadas con el estándar H.264.
Consiste en que en vez de emitir todos los pixeles, el servicio emite únicamente los puntos del rostro más importantes y el resto está recreado.
En vez de intentar transmitir todos y cada uno de los pixeles, que en muchas ocasiones no ofrecen una imagen precisa, solo se transmite lo estrictamente necesario.
No es la primera vez que vemos una inteligencia artificial recreando el rostro de personas, pues en el pasado ya hemos visto a las GANs haciendo representaciones de lo más realistas, incluso partiendo de una base muy poco sólida como un simple garabato.
Otra de las incorporaciones de Nvidia Maxine es la corrección de mirada.
La IA identificar la alineación del rostro y lo ajusta automáticamente recreando las partes faltantes.
Maxine promete incluso ser capaz de simular la mirada aunque la cámara no esté directamente enfrente del usuario.
La nueva plataforma de Nvidia añade otras correcciones como una mejora de la iluminación, reducción del ruido ambiental y en general una mejora de la resolución de las videollamadas.
Por el momento se trata de una primera versión, pero Nvidia anticipa un futuro donde servicios de videollamadas como Google Meet o Zoom permitan automáticamente transmitir una imagen nuestra mejorada, gracias a la interpretación que hagan de nosotros los algoritmos.