Inmediatamente después del lanzamiento de DALL-E 3 por parte de OpenAI y Bing Image Creator de Microsoft, SGE de Google ahora tiene su propia herramienta de generación de imágenes de IA.
Gracias a los modelos de difusión de texto a imagen de Imagen de Google, los usuarios con acceso a SGE pueden describir la imagen que deseen y, en cuestión de segundos, SGE les ofrecerá cuatro variedades para elegir.
Desde allí, los usuarios pueden editar aún más la descripción para modificar la imagen que desean ver.
En el ejemplo de Google, la solicitud original es una imagen caprichosa de un capibara con gorro de chef y cocinando tocino. Los usuarios pueden editar la descripción para hacer que el capibara cocine croquetas de patata.
La multimodalidad se refiere a la capacidad de un modelo de IA para comprender y procesar diferentes tipos de medios, incluidos imágenes y audio.
Un chatbot de IA que conversa con los usuarios es una cosa, pero “ver”, “oír” y producir resultados creativos es un nivel completamente nuevo de sofisticación de la IA.
OpenAI lanzó recientemente la última versión de su herramienta de generación de imágenes DALL-E 3.
Microsoft, que es un inversor de OpenAI, ahora usa DALL-E 3 para Bing Image Creator.
Y ahora, Google trae su propia versión a SGE.
El acceso generalizado a herramientas de generación de imágenes de IA no está exento de grandes preocupaciones, incluida la difusión de información errónea y violaciones de derechos de autor.
SGE ha sido capacitado para bloquear contenido dañino o engañoso que viole la política de inteligencia artificial generativa de Google y no generará imágenes que contengan rostros humanos fotorrealistas.
Además, las figuras públicas destacadas (es decir, las celebridades) no podrán acceder a los resultados de generación de imágenes, lo que evitará posibles deepfakes.
Como precaución adicional, la herramienta es para usuarios mayores de 18 años.
Las imágenes creadas por SGE tendrán metadatos y marcas de agua integradas para indicar que fueron generadas por IA.
Además, los modelos Imagen de Google fueron entrenados en contenido disponible públicamente.
Otra novedad de SGE es la capacidad de redactar contenidos escritos.
Esta es la misma función disponible en Bard, el chatbot de inteligencia artificial de Google, pero ahora se puede acceder a ella directamente desde la función de búsqueda de SGE, lo que ahorra tiempo de alternar entre ventanas.
La generación de imágenes y la redacción de mensajes dentro de SGE se presentan hoy en inglés para los usuarios de EE. UU.
Fuente: Mashable
Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…
El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…
Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…
La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…
Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…
En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…