OpenAI ha anunciado la tercera versión de DALL-E, su IA para generar imágenes a partir de texto, que ahora se integra de forma nativa en ChatGPT.
La tecnología ahora se integra de forma nativa en ChatGPT, permitiendo a los usuarios crear mejores prompts directamente desde el chatbot.
DALL-E 3 evoluciona considerablemente en comparación con su predecesor a la hora de interpretar las solicitudes de los usuarios.
Al producir una imagen, será posible pedirle al chatbot que la genere directamente, o que cree el prompt en cuestión.
ChatGPT brindará una indicación más extensa y detallada que permitirá que DALL-E 3 la interprete mejor y ofrezca resultados más precisos.
“Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería de prompts.
DALL·E 3 representa una evolución en nuestra capacidad de generar imágenes que se adhieran exactamente al texto que proporcionas”, afirma OpenAI.
OpenAI ha dejado en claro que el salto cualitativo en las imágenes generadas con DALL-E 3 es considerable.
La nueva tecnología, afirma la compañía, comprende mejor cómo debe componer una escena y cuál es la vinculación entre los elementos que forman parte de la misma.
DALL-E 3 promete mejores resultados al incluir texto dentro de los dibujos, como también al lidiar con partes del cuerpo humano que antes fallaba en interpretar correctamente. Por ejemplo, las manos.
Este era uno de los puntos más flacos de la IA al comparar sus creaciones con las de otras plataformas, como Midjourney.
No obstante, los desarrolladores no han enfocado DALL-E 3 solo en mejorar la calidad de las creaciones o en ofrecer una mejor interpretación de los prompts.
También han implementado medidas de seguridad más robustas con el fin de mitigar los sesgos e impedir el uso de la herramienta para crear contenidos potencialmente dañinos como deepfakes.
Es por ello que DALL-E 3 se negará a crear imágenes de figuras públicas a partir de su nombre.
Y debido a la creciente preocupación por la divulgación de contenidos falsificados, tampoco ofrecerá resultados basados en el estilo de artistas vivos.
Es más, los creadores podrán solicitar que sus trabajos no se utilicen para entrenar al modelo de inteligencia artificial que potencia a esta herramienta.
Aunque los cambios se verían aplicados en versiones futuras de la plataforma.
Están investigando cómo ayudar a las personas a detectar imágenes creadas con inteligencia artificial.
La empresa ya está probando una herramienta interna, pero no se ha mencionado si planea lanzarla públicamente.
La nueva versión de la IA generativa llegará en octubre a los suscriptores de ChatGPT Plus y Enterprise a través de su API.
Por lo pronto, desde OpenAI no han anunciado cuándo podría estar disponible para el público general.
Fuente: OpenAI
Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)
Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…
El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…
Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…
Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…
Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…