Categorías: Tecnología

Nuevas IAs para crear música y fotografías sorprendentes

Comparta este Artículo en:

Google ha presentado Imagen 3, un nuevo modelo de generación de imágenes realistas junto con Music AI SandBox, para ayudar a la producción musical.

Google ha mostrado al mundo Imagen 3, su nuevo modelo de generación de texto a imagen, que según la compañía, es el de mayor calidad de todos los disponibles hasta el momento.

Imagen 3, con un solo prompt, es capaz de producir imágenes con detalles increíbles, iluminación realista y menos artefactos que distraigan.

Este nuevo modelo de generación de texto a imagen viene de la mano de Google Deepmind, y utiliza toda la potencia de la tecnología multimodal de la compañía de Mountain View para generar las imágenes más realistas posibles, si eso es lo que quiere el usuario.

Y es que Imagen 3 permite generar cualquier tipo de imagen, también cartoon o de cualquier estética que se le ocurra al usuario.

Google también ha confirmado que este modelo es, además, el más potente a la hora de generar imágenes con textos, como por ejemplo los que se usan en publicidad.

Imagen 3 utiliza entradas de texto con lenguaje natural, y, por tanto, es capaz de generar imágenes con entradas sencillas y descripciones básicas, aunque cuanto más detalles ofrezca el usuario, mejor.

Google ha mostrado algunos ejemplos, aquí van unos cuantos:

Prompt: “A photo of a man with short hair and beard smiling at the camera. The background is blurry and it shows trees and buildings in light colors.” [“Una foto de un hombre con cabello corto y barba sonriendo a la cámara. El fondo es borroso y muestra árboles y edificios en colores claros”.]

Prompt: “View from above, panoramic view of stunning river canyon with threes, overlooking water and green mountains. Pastel colors.” [“Vista desde arriba, vista panorámica de un impresionante cañón del río con tres, con vistas al agua y a las montañas verdes. Colores pastel”.]

Prompt: “Detailed illustration of majestic lion roaring proudly in a dream-like jungle, purple white line art background, clipart on light violet paper texture.” [“Ilustración detallada de un majestuoso león rugiendo con orgullo en una jungla de ensueño, fondo de arte lineal blanco púrpura, imágenes prediseñadas sobre textura de papel violeta claro”.]

Imagen 3 estará disponible hoy para probar a través de la suite de ImageFX vía Google Labs, aunque de momento en período de pruebas para los usuarios que se den de alta.

Junto con la generación de imágenes de Image 3, Google también ha presentado Music AI Sandbox, un modelo específico para la generación de sonidos y música. La tecnología, que se ha desarrollado en colaboración con YouTube, ofrece una vuelta de tuerca a la generación de música a través de herramientas para crear sonidos desde cero, cambiar entre estilos de pistas y mucho más.

La compañía no ha dado muchos detalles del funcionamiento de Music AI Sandbox. Tampoco ha ofrecido información sobre si se podrá probar próximamente.

Fuente: DeepMind

Editor PDM

Entradas recientes

En China patrulla un nuevo robot policía

RT-G es un robot avanzado diseñado para escenarios de confrontación. (more…)

9 hours hace

Técnica reduce el sesgo en los modelos de IA y al mismo tiempo preserva o mejora la precisión

Los modelos de aprendizaje automático pueden fallar cuando intentan hacer predicciones para individuos que estaban…

9 hours hace

Curso de humanidades en universidad norteamericana utilizará un libro de texto generado por IA

La IA ha llegado a un mercado que estaba maduro para la disrupción: los libros…

9 hours hace

IA resuelve problemas complejos de ingeniería más rápido que las supercomputadoras

Modelar cómo se deforman los automóviles en un choque, cómo responden las naves espaciales a…

9 hours hace

Diseñan celdas que generan electricidad a oscuras

Investigadores chinos han afirmado que su unidad generó una producción de electricidad estable durante 160…

9 hours hace

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace
Click to listen highlighted text!