Categorías: Tecnología

Nuevas IAs para crear música y fotografías sorprendentes

Comparta este Artículo en:

Google ha presentado Imagen 3, un nuevo modelo de generación de imágenes realistas junto con Music AI SandBox, para ayudar a la producción musical.

Google ha mostrado al mundo Imagen 3, su nuevo modelo de generación de texto a imagen, que según la compañía, es el de mayor calidad de todos los disponibles hasta el momento.

Imagen 3, con un solo prompt, es capaz de producir imágenes con detalles increíbles, iluminación realista y menos artefactos que distraigan.

Este nuevo modelo de generación de texto a imagen viene de la mano de Google Deepmind, y utiliza toda la potencia de la tecnología multimodal de la compañía de Mountain View para generar las imágenes más realistas posibles, si eso es lo que quiere el usuario.

Y es que Imagen 3 permite generar cualquier tipo de imagen, también cartoon o de cualquier estética que se le ocurra al usuario.

Google también ha confirmado que este modelo es, además, el más potente a la hora de generar imágenes con textos, como por ejemplo los que se usan en publicidad.

Imagen 3 utiliza entradas de texto con lenguaje natural, y, por tanto, es capaz de generar imágenes con entradas sencillas y descripciones básicas, aunque cuanto más detalles ofrezca el usuario, mejor.

Google ha mostrado algunos ejemplos, aquí van unos cuantos:

Prompt: “A photo of a man with short hair and beard smiling at the camera. The background is blurry and it shows trees and buildings in light colors.” [“Una foto de un hombre con cabello corto y barba sonriendo a la cámara. El fondo es borroso y muestra árboles y edificios en colores claros”.]

Prompt: “View from above, panoramic view of stunning river canyon with threes, overlooking water and green mountains. Pastel colors.” [“Vista desde arriba, vista panorámica de un impresionante cañón del río con tres, con vistas al agua y a las montañas verdes. Colores pastel”.]

Prompt: “Detailed illustration of majestic lion roaring proudly in a dream-like jungle, purple white line art background, clipart on light violet paper texture.” [“Ilustración detallada de un majestuoso león rugiendo con orgullo en una jungla de ensueño, fondo de arte lineal blanco púrpura, imágenes prediseñadas sobre textura de papel violeta claro”.]

Imagen 3 estará disponible hoy para probar a través de la suite de ImageFX vía Google Labs, aunque de momento en período de pruebas para los usuarios que se den de alta.

Junto con la generación de imágenes de Image 3, Google también ha presentado Music AI Sandbox, un modelo específico para la generación de sonidos y música. La tecnología, que se ha desarrollado en colaboración con YouTube, ofrece una vuelta de tuerca a la generación de música a través de herramientas para crear sonidos desde cero, cambiar entre estilos de pistas y mucho más.

La compañía no ha dado muchos detalles del funcionamiento de Music AI Sandbox. Tampoco ha ofrecido información sobre si se podrá probar próximamente.

Fuente: DeepMind

Editor PDM

Entradas recientes

Crean router cuántico que convierte luz en comandos para cúbits

Un experimento con un nuevo chip desarrollado por Harvard permite controlar cúbits con luz en…

11 hours hace

Desarrollan piel electrónica magnetorreceptiva más ligera e inteligente

Imagine navegar en una realidad virtual con lentes de contacto o usar su smartphone bajo…

11 hours hace

YouTube lanza una IA que genera música gratis para sus videos

YouTube ha presentado el Asistente Musical, una IA capaz de generar música para descargarla gratis…

11 hours hace

Japón despliega una estación de tren impresa en 3D

La West Japan Railway Company (JR West) acaba de anunciar la finalización de una estación…

11 hours hace

Enseñan todos los capítulos de ‘Tom y Jerry’ a una IA, y ahora es capaz de crear sus propios episodios

Esto es justo lo que han hecho varios investigadores de NVIDIA con la serie animada…

11 hours hace

IA Super-Turing consume menos energía al imitar el cerebro humano

La Inteligencia Artificial (IA) puede realizar cálculos complejos y analizar datos con mayor rapidez que…

1 day hace
Click to listen highlighted text!