Puede que no haya oído hablar de StableDiffusion, pero se trata de un modelo de difusión capaz de generar imágenes fotorrealistas a partir de cualquier texto desarrollado por una startup llamada Stability AI junto a investigadores de la Universidad de Heidelberg (Alemania).
Las imágenes que genera esta alternativa tienen un nivel de detalle impresionante, y se asemejan más a DALL-E 2 que a otras propuestas como Midjourney, cuya esencia es más artística y menos realista.
Al igual que otras propuestas, StableDiffusion fue entrenada con datos provenientes de Internet.
En este caso se utilizó LAION-Aesthetics, un conjunto con millones de imágenes filtradas y clasificadas por IA con el que le enseñaron al modelo a aprender las asociaciones entre conceptos escritos e imágenes.
Desde la compañía afirman que si bien esta técnica es muy efectiva, está expuesta a “los sesgos sociales y el contenido no seguro disponible en la red“, por lo que piden que sea usada responsablemente.
Después de estar disponible inicialmente para colaboradores del proyecto e investigadores seleccionados, ahora todos pueden acceder a StableDiffusion.
La versión estable está disponible a través de DreamStudio, un front-end y una API de pago.
La buena noticia es que el registro es gratuito, y al iniciar sesión recibe 200 créditos para la generación de imágenes.
Aunque, eso sí, 1 crédito no siempre equivale a una imagen.
Al ingresar a DreamStudio encontrará una interfaz sencilla y amigable.
Para generar una imagen simplemente debe introducir el texto deseado (en inglés) en el cuadro con la leyenda “I want to dram of…” y ajustar el ancho de la imagen, la altura, y otros parámetros de generación.
A medida que mueve los controles aumentará o disminuirá la cantidad de créditos que tendrá que pagar.
La compañía también ha liberado públicamente una demostración que es mucho más fácil de utilizar.
En este caso solo debe introducir el texto y hacer clic en Generate image.
Se trata de una herramienta más para dar rienda suelta a nuestra creatividad y evaluar el progreso de estos sistemas.
Cabe señalar que los creadores de StableDiffusion aseguran que seguirán trabajando para mejorar las capacidades del modelo, entre ellas las capacidades para eliminar resultados no deseados.
Más adelante lanzarán una versión que podrá ejecutarse de manera local.
Aunque eso sí, necesitará como mínimo tarjetas gráficas como la Nvidia GeForce GTX 1660.
Fuente: Stability AI
Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…
El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…
Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…
La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…
Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…
En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…