Categorías: Tecnología

Inteligencia artificial de Google crea imágenes ultrarrealistas con solo una breve descripción de texto

Comparta este Artículo en:
FacebookFacebookTwitterTwitterEmailEmailWhatsAppWhatsAppShareShare

DALL-E 2 ha sido lo más llamativo en el campo de la inteligencia artificial de los últimos meses. Pero Google no ha dicho su última palabra.

Han decidido presentar IMAGEN, su nueva IA capaz de crear imágenes ultrarrealistas a partir de una breve descripción.

Una alternativa a la herramienta de OpenAI que, según las pruebas y las investigaciones de Google, consigue unos resultados más precisos.

Al contrario que DALL-E 2, que este verano ha prometido liberar su herramienta a más usuarios, Google ha presentado IMAGEN como una investigación, argumentando que por motivos éticos es mejor que siga sin ser un producto comercial y se mantenga como una herramienta para académicos y expertos.

El funcionamiento de IMAGEN es similar al de DALL-E 2.

La IA convierte un pequeño texto en una imagen con todo lujo de detalles que coincide con lo descrito.

Las combinaciones son casi ilimitadas y en la mayoría de ocasiones, DALL-E 2 conseguía ofrecernos una imagen muy parecida a lo que le pedimos.

Ahora Google asegura que ha resuelto algunas de las lagunas de la herramienta de OpenAI y ha logrado generar imágenes que los humanos prefieren.

IMAGEN se basa en el modelo Transformer T5, presentado en 2020.

Originalmente la IA produce imágenes de 64 x 64 pixeles, pero luego son escaladas a 1.024 x 1.024 pixeles.

La misma resolución que DALL-E 2.

Esta idea de escalado es la que permite aliviar la potencia de cálculo y permitir la generación de imágenes en pocos segundos.

Para comprobar qué IA es la que logra producir mejores imágenes, desde Google han creado el benchmark ‘DrawBench’.

Según los resultados mostrados, la IA de Google cometió menos errores de comprensión a la hora de construir la imagen.

Un ejemplo lo ponen con “Un panda haciendo latte art“.

La IA de Google entendió que era el animal quien debía realizar la acción, mientras que DALL-E 2 puso directamente un café con la cara de un panda.

Jeff Dean, VP de Google AI, ha publicado en su perfil de Twitter varios ejemplos de lo que es capaz IMAGEN.

Adicionalmente, los usuarios tenemos una pequeña demo interactiva de cómo funciona esta IA, pudiendo intercambiar entre distintos animales, ropa, vehículo y fondo.

Lamentablemente Google sigue preocupada por los malos usos de esta IA, algo que también ocurre con DALL-E 2, y por ello ha decidido no ponerla a disposición de los usuarios, por el momento.

Fuente: IMAGEN

Editor PDM

Entradas recientes

Transforman conjuntos robóticos en materiales inteligentes que imitan la vida

Investigadores han diseñado grupos de robots que se comportan como materiales inteligentes con forma y…

2 days hace

Nuevo lenguaje de programación para computación de alto rendimiento

Muchas empresas invierten grandes cantidades en la contratación de talento para crear el código de…

2 days hace

Avance hacia automóviles eléctricos más seguros y con más autonomía

El níquel parece tener un futuro brillante en las baterías de vehículos eléctricos: Es más…

2 days hace

Primer sistema operativo para redes cuánticas

Cuando la computación cuántica despegue definitivamente, hará viables tareas que hoy resultan inabordables incluso para…

2 days hace

Nuevo Huawei Pura X, teléfono plegable con sistema HarmonyOS

El nuevo Huawei Pura X es diferente a todo lo que ha visto hasta ahora.…

2 days hace

NVIDIA presenta DGX Spark y DGX Station: los supercomputadores de IA personal

NVIDIA presentó sus nuevos supercomputadores DGX Spark y DGX Station diseñados para el desarrollo de…

3 days hace
Click to listen highlighted text!