Un equipo de la Universidad de Osaka, en Japón, desarrolló un método que incluye el uso de Stable Diffusion, la herramienta de IA generativa de imágenes.
Una nueva tecnología impulsada por inteligencia artificial puede leer la mente.
Para ser más precisos: puede leer sus ondas cerebrales, identificar qué está pensando y traducirlo en una imagen de altísima resolución.
Es tan exacta que, incluso, puede captar formas y colores.
Los investigadores de la Graduate School of Frontier Biosciences de la Universidad de Osaka, de Japón, utilizaron Stable Diffusion, uno de los sistemas de IA generativa de imágenes más famosos.
El estudio consistió, a grandes rasgos, en mostrarles varias imágenes a un grupo de voluntarios.
Estas imágenes generaban estímulos en la actividad cerebral, que los científicos podían captar gracias a escaneos por resonancia magnética.
La información obtenida fue traducida a través de decodificadores semánticos y, finalmente, fue usada como entrada para generar una imagen final con Stable Diffusion.
El equipo de investigadores asegura que es la primera vez que se usa una herramienta de inteligencia artificial generativa como Stable Diffusion, en un experimento para «leer» la mente y generar recreaciones visuales de la actividad cerebral.
El equipo de la Universidad de Osaka incluyó en la publicación de su estudio un comparativo entre las imágenes que les mostraron a los voluntarios y las generadas finalmente con Stable Diffussion.
Las imágenes resultantes no son exactamente igual a las originales, pero reproducen la mayoría de los elementos esenciales.
Por ejemplo, las formas, los colores y la perspectiva.
Las imágenes finales también variaron entre los participantes, pero esto tiene que ver con que cada una de las personas tiene su propia forma de interpretar la realidad.
El equipo japonés logró «leer» la mente de los voluntarios no solo gracias a la inteligencia artificial de Stable Diffusion.
El estudio involucró otros procesos clave para transformar la actividad cerebral en datos, para que de esta forma pudieran ser leídos y utilizados por esta herramienta.
Stable Diffusion sí tiene el mérito de haber simplificado la creación de representaciones gráficas de altísima resolución y fidelidad semántica.
Los investigadores reconocieron que algunos estudios anteriores habían logrado generar imágenes de alta resolución.
Explicaron, sin embargo, que esto fue posible luego de todo un proceso de «entrenamiento y ajuste» de modelos generativos, una tarea de altísima complejidad.
La Universidad de Radboud en los Países Bajos, por ejemplo, publicó en 2022 que habían logrado entrenar a un modelo de IA para «leer» la mente.
El método fue parecido.
Mostraron a varios participantes fotos de personas, generaron información gracias a escaneos con resonancia magnética y generaron nuevas imágenes con su modelo de IA.
La inteligencia artificial para «leer» la mente de la Universidad de Radboud tuvo alta coincidencia en el género, la edad y la pose de las personas de las fotos.
Pero, de nuevo, necesitó del proceso de «entrenamiento» que el equipo japonés se evitó gracias a Stable Diffusion, plataforma creada por la empresa Stability AI.
Stable Diffusion diseña imágenes a partir de texto.
Es de código abierto, a diferencia de herramientas similares como DALL-E.
Tiene, además, una lógica de aprendizaje automático: ofrece resultados cada vez más precisos en la medida que es usada.
Un trío de artistas realizó una demanda contra la empresa en enero pasado por haber violado los derechos de autor de «millones de artistas».
Getty Images, la agencia de fotografía estadounidense, hizo lo mismo en febrero.
Aseguró que Stable Diffusion utilizó millones de fotos sin permiso de la agencia para generar sus imágenes.
Fuente: Biorxiv