Categorías: Tecnología

Utilizan inteligencia artificial para restaurar y mejorar imágenes antiguas

Comparta este Artículo en:

GFP-GAN, o Generative Facial Prior, es una herramienta impulsada por inteligencia artificial que puede restaurar y mejorar imágenes antiguas.

La imagen de origen puede ser de baja calidad y aun así generar resultados impresionantes.

No utiliza simplemente un StyleGAN previamente entrenado y luego lo vuelve a entrenar para orientar la información codificada para su tarea como lo hace PULSE.

Así es, utiliza un modelo StyleGAN-2 previamente entrenado para orientar su propio modelo generativo en múltiples escalas durante la codificación de la imagen, hasta el código latente y hasta la reconstrucción.

En pocas palabras, en lugar de orientar el entrenamiento solo en la imagen generada (falsa) y la imagen esperada (real) utilizando un modelo discriminador de la red GAN, GFP-GAN también tiene dos métricas para preservar la identidad y los componentes faciales.

La pérdida del componente facial es básicamente lo mismo que la pérdida adversaria del discriminador que encontramos en las GAN clásicas, pero se enfoca en características locales importantes de la imagen resultante, como los ojos y la boca.

La pérdida de preservación de la identidad utiliza un modelo de reconocimiento facial previamente entrenado para capturar el rasgos faciales más importantes y compararlos con la imagen real para ver si todavía tenemos a la misma persona en la imagen generada”, dijo Louis Bouchard.

Fuente: Louis Bouchard

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace
Click to listen highlighted text!