Parti, la nueva inteligencia artificial de Google para crear imágenes fotorrealistas

Comparta este Artículo en:

Antes hablábamos de las enormes posibilidades de DALL-E 2, una IA capaz de generar imágenes a partir de un texto. Más tarde llegaba DALL-E Mini, un generador que nos sorprendía con sus delirantes creaciones.

Ahora es el turno de Parti, una alternativa que apuesta por un nuevo y prometedor modelo para generar imágenes fotorrealistas.

A diferencia de DALL-E y sus variantes, que utilizan un modelo de generación de imágenes desde texto de “difusión“, Parti (Pathways Autoregressive Text-to-Image) apuesta por un modelo autorregresivo que permite entradas de texto más extensas y es capaz de hacer composiciones complejas.

Los resultados de Parti se parecen más a una obra de arte que a las figuras amorfas como las que nos ofrece DALL-E Mini (imagen siguiente).

Los investigadores de Google pusieron a prueba a Parti en cuatro escalas (350M, 750M, 3B y 20B) bajo los mismos parámetros, es decir, con las mismas entradas de texto.

Tras la prueba, descubrieron que la última escala sobresale especialmente en indicaciones que son abstractas, requieren conocimiento del mundo, perspectivas específicas y representación de símbolos.

En uno de los intentos, utilizaron el siguiente texto de entrada:

“A map of the United States made out of sushi. It is on a table next to a glass of red wine (Un mapa de Estados Unidos hecho con sushi. Está en una mesa al lado de una copa de vino tinto)”.

La escala 350M presenta una confusa representación, las cosas mejoran en la 750M, presentan “creatividad” en la 3B y un asombroso resultado en la 20B.

También podemos ver una prueba en la que los investigadores evaluaron el trabajo de Parti en diferentes escenarios complejos.

Ingresaron el texto “Portrait of a tiger wearing a train conductor’s hat and holding a skateboard that has a yin-yang symbol on it (Retrato de un tigre con un sombrero de conductor de tren sosteniendo una patineta con un símbolo de yin-yang)“.

Y pidieron variantes en fotografía, ilustración de historietas, pintura al óleo, estatua de mármol, entre otros.

Sorprendentemente, la IA demostró su capacidad para adherirse a formatos y estilos de imagen específicos, aunque no siempre con tan buenos resultados.

“Si bien Parti produce resultados de alta calidad para una amplia gama de indicaciones, el modelo, sin embargo, tiene muchas limitaciones“, indican desde Google.

El gigante de Mountain View seguirá entrenando y mejorando sus modelos de inteligencia artificial para “mejorar la creatividad y la productividad humana”.

Cabe señalar que por razones de seguridad (Google quiere evitar malos usos), Parti no está disponible para el público, como sí lo está DALL-E Mini, por lo que no podremos crear nuestras propias imágenes a partir de texto.

No obstante, nos queda la alternativa de ver una gran cantidad de ejemplos en la página del proyecto y consultar la investigación completa.

Fuente: Parti

Editor PDM

Siguiente Maravillas de iluminación para rodear a su computador »

Anterior « Forma nueva y mejorada de hacer levitar objetos usando solo ondas de sonido

Deja un comentario

Publicado por

Editor PDM

Etiquetas: inteligencia artificialParti

2 years hace

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Tecnología

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Tecnología

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Tecnología

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Tecnología

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

Tecnología

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace

Parti, la nueva inteligencia artificial de Google para crear imágenes fotorrealistas

Artículos relacionados:

Entrada Relacionada

Entradas recientes

Mano robótica capaz de manipular objetos

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Google lanza una versión de Gemini 2.0 capaz de razonar

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea