La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad de una descripción de texto; simplemente utilizando otras imágenes.
Google tiene una nueva IA que va a facilitar aún más la creación de imágenes.
La compañía ha lanzado Whisk, un nuevo modelo que prescinde de los característicos prompts y que simplemente hace uso de otras imágenes para obtener indicaciones de lo que debe generar.
Whisk funciona de una manera muy sencilla.
Para crear una imagen, el usuario solo debe añadir una que funcione como sujeto (es decir, el tema principal de la imagen); ya sea un animal, persona, objeto o cualquier otro elemento.
También es necesario añadir otra imagen que funcione de fondo, por ejemplo, un paisaje, así como una tercera que sirva como inspiración de estilo.
En este caso, es posible incluir, por ejemplo, una escena de anime para que genere la imagen con esta misma estética.
La nueva IA de Google, además, permite introducir una muy breve descripción de texto para que la imagen sea mucho más precisa a lo que la persona quiere crear.
Por ejemplo, si el usuario ha añadido una imagen de un perro, un fondo del espacio y un estilo de caricatura, simplemente puede poner en la descripción “que el sujeto esté montado en una bicicleta”.
Google hace uso de Gemini, su potente modelo de lenguaje, para obtener una descripción a texto de las imágenes adjuntadas y las envía a Imagen 3, el modelo de generación de imágenes de la compañía, que es el que se encarga de generar el diseño.
Si bien es una forma mucho más intuitiva de crear imágenes, Google es consciente de que este método puede no ser tan precisa como introducir un prompt.
Es por eso que la compañía ofrece opciones adicionales, como la posibilidad de ver y editar indicaciones en cualquier momento, incluso después de generar la fotografía.
La compañía, además, deja claro que Whisk está diseñada para ser usada como una “herramienta creativa”, y no como un editor de imágenes tradicional.
“Lo hemos desarrollado para una rápida exploración visual, no para ediciones perfectas para pixeles.
Se trata de explorar ideas de maneras nuevas y creativas, que permitan trabajar a través de docenas de opciones y descargar la que más te gusten”, afirma Google en una publicación en su blog.
La nueva IA de Google que permite generar imágenes a través de otras imágenes, eso sí, solo está disponible en Estados Unidos.
Los usuarios pueden probarla a través de la web de Labs de la compañía. Por el momento, se desconoce si estará disponible en otros mercados.
Fuente: Google
Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…
El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…
Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…
Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…
En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…
Se ha demostrado que el NanoGripper, hecho a partir de una sola pieza de ADN…