Categorías: Tecnología

La nueva versión de la inteligencia artificial Midjourney hace difícil diferenciar una foto real de una generada

Comparta este Artículo en:

El lanzamiento de Midjourney V5, presenta una versión aún más potente de este motor de IA generativa de imágenes.

El nuevo motor cuenta según sus creadores con “mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio“, entre otras mejoras.

Los detalles tienen más probabilidad de ser correctos y habrá menos texto no deseado.

Los creadores de Midjourney revelan que la nueva versión es especialmente sensible a las entradas de texto, así que más que nunca lo importante es ser muy específico con lo que queremos y dar el máximo detalle posible para no encontrarnos con decepciones.

Los prompts cortos pueden no funcionar tan bien como antes debido a esto.

Midjourney V5 es el segundo modelo entrenado con el supercluster de IA de sus creadores y lleva en desarrollo cinco meses.

Sus responsables afirman que usa arquitecturas de redes neuronales “significativamente diferentes” y nuevas técnicas estéticas.

Otro de los avances que se parece haber logrado, aunque los responsables no lo mencionan específicamente, es el de las manos que aparecen en las imágenes generadas, y que mejoran mucho: suelen contar con los cinco dedos bien representados, por ejemplo.

Es cierto que Midjourney V5 sigue cometiendo fallos en algunas imágenes desafiantes, pero desde luego el avance es notable en este sentido.

Aún así, destacan, “este no es el paso final“.

Eso deja claro que la evolución de Midjourney sigue su marcha imparable junto al de otras plataformas como Stable Diffusion o DALL-E 2.

Fuente: Hipertextual

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace
Click to listen highlighted text!