Inmediatamente después del lanzamiento de DALL-E 3 por parte de OpenAI y Bing Image Creator de Microsoft, SGE de Google ahora tiene su propia herramienta de generación de imágenes de IA.
Gracias a los modelos de difusión de texto a imagen de Imagen de Google, los usuarios con acceso a SGE pueden describir la imagen que deseen y, en cuestión de segundos, SGE les ofrecerá cuatro variedades para elegir.
Desde allí, los usuarios pueden editar aún más la descripción para modificar la imagen que desean ver.
En el ejemplo de Google, la solicitud original es una imagen caprichosa de un capibara con gorro de chef y cocinando tocino. Los usuarios pueden editar la descripción para hacer que el capibara cocine croquetas de patata.
La multimodalidad se refiere a la capacidad de un modelo de IA para comprender y procesar diferentes tipos de medios, incluidos imágenes y audio.
Un chatbot de IA que conversa con los usuarios es una cosa, pero “ver”, “oír” y producir resultados creativos es un nivel completamente nuevo de sofisticación de la IA.
OpenAI lanzó recientemente la última versión de su herramienta de generación de imágenes DALL-E 3.
Microsoft, que es un inversor de OpenAI, ahora usa DALL-E 3 para Bing Image Creator.
Y ahora, Google trae su propia versión a SGE.
El acceso generalizado a herramientas de generación de imágenes de IA no está exento de grandes preocupaciones, incluida la difusión de información errónea y violaciones de derechos de autor.
SGE ha sido capacitado para bloquear contenido dañino o engañoso que viole la política de inteligencia artificial generativa de Google y no generará imágenes que contengan rostros humanos fotorrealistas.
Además, las figuras públicas destacadas (es decir, las celebridades) no podrán acceder a los resultados de generación de imágenes, lo que evitará posibles deepfakes.
Como precaución adicional, la herramienta es para usuarios mayores de 18 años.
Las imágenes creadas por SGE tendrán metadatos y marcas de agua integradas para indicar que fueron generadas por IA.
Además, los modelos Imagen de Google fueron entrenados en contenido disponible públicamente.
Otra novedad de SGE es la capacidad de redactar contenidos escritos.
Esta es la misma función disponible en Bard, el chatbot de inteligencia artificial de Google, pero ahora se puede acceder a ella directamente desde la función de búsqueda de SGE, lo que ahorra tiempo de alternar entre ventanas.
La generación de imágenes y la redacción de mensajes dentro de SGE se presentan hoy en inglés para los usuarios de EE. UU.
Fuente: Mashable
Apple ha presentado la nueva generación de sus portátiles para profesionales que llevan en su…
El nuevo Apple iMac (2023) se renueva a lo grande con el chip M3: el…
Investigadores han construido una cámara superconductora de 400.000 pixeles, que es tan sensible que puede…
Los guantes hápticos Fluid Reality se pueden usar para tocar cosas en realidad virtual. (more…)
El robot CUREE impulsado por NVIDIA Jetson, desarrollado por investigadores del Laboratorio Autónomo de Percepción…
Investigadores de la Universidad Tecnológica de Sydney (Australia) han desarrollado una tecnología táctil acústica que…