Google ha presentado Imagen 3, un nuevo modelo de generación de imágenes realistas junto con Music AI SandBox, para ayudar a la producción musical.
Google ha mostrado al mundo Imagen 3, su nuevo modelo de generación de texto a imagen, que según la compañía, es el de mayor calidad de todos los disponibles hasta el momento.
Imagen 3, con un solo prompt, es capaz de producir imágenes con detalles increíbles, iluminación realista y menos artefactos que distraigan.
Este nuevo modelo de generación de texto a imagen viene de la mano de Google Deepmind, y utiliza toda la potencia de la tecnología multimodal de la compañía de Mountain View para generar las imágenes más realistas posibles, si eso es lo que quiere el usuario.
Y es que Imagen 3 permite generar cualquier tipo de imagen, también cartoon o de cualquier estética que se le ocurra al usuario.
Google también ha confirmado que este modelo es, además, el más potente a la hora de generar imágenes con textos, como por ejemplo los que se usan en publicidad.
Imagen 3 utiliza entradas de texto con lenguaje natural, y, por tanto, es capaz de generar imágenes con entradas sencillas y descripciones básicas, aunque cuanto más detalles ofrezca el usuario, mejor.
Google ha mostrado algunos ejemplos, aquí van unos cuantos:
Prompt: “A photo of a man with short hair and beard smiling at the camera. The background is blurry and it shows trees and buildings in light colors.” [“Una foto de un hombre con cabello corto y barba sonriendo a la cámara. El fondo es borroso y muestra árboles y edificios en colores claros”.]
Prompt: “View from above, panoramic view of stunning river canyon with threes, overlooking water and green mountains. Pastel colors.” [“Vista desde arriba, vista panorámica de un impresionante cañón del río con tres, con vistas al agua y a las montañas verdes. Colores pastel”.]
Prompt: “Detailed illustration of majestic lion roaring proudly in a dream-like jungle, purple white line art background, clipart on light violet paper texture.” [“Ilustración detallada de un majestuoso león rugiendo con orgullo en una jungla de ensueño, fondo de arte lineal blanco púrpura, imágenes prediseñadas sobre textura de papel violeta claro”.]
Imagen 3 estará disponible hoy para probar a través de la suite de ImageFX vía Google Labs, aunque de momento en período de pruebas para los usuarios que se den de alta.
Junto con la generación de imágenes de Image 3, Google también ha presentado Music AI Sandbox, un modelo específico para la generación de sonidos y música. La tecnología, que se ha desarrollado en colaboración con YouTube, ofrece una vuelta de tuerca a la generación de música a través de herramientas para crear sonidos desde cero, cambiar entre estilos de pistas y mucho más.
La compañía no ha dado muchos detalles del funcionamiento de Music AI Sandbox. Tampoco ha ofrecido información sobre si se podrá probar próximamente.
Fuente: DeepMind