El gran avance en el entrenamiento de redes generativas de confrontación podría abrir la inteligencia artificial a más campos.
NVIDIA ha desarrollado un nuevo enfoque para entrenar redes generativas adversarias (GAN) que algún día podría hacerlas adecuadas para una mayor variedad de tareas.
Antes de entrar en el trabajo de NVIDIA, es útil saber un poco sobre cómo funcionan las GAN.
Cada GAN consta de dos redes neuronales en competencia: un generador y un discriminador.
El objetivo del algoritmo del generador es crear nuevas imágenes, el discriminador examina miles de imágenes de muestra.
Luego utiliza esos datos para “entrenar” a su contraparte.
Para crear resultados consistentemente creíbles, las GAN tradicionales necesitan un rango de 50.000 a 100.000 imágenes de entrenamiento.
Con muy pocos, tienden a encontrarse con un problema llamado sobreajuste.
En esos casos, el discriminador no tiene suficiente base para entrenar eficazmente al generador.
En el pasado, una de las formas en que los investigadores de inteligencia artificial han tratado de solucionar este problema es utilizar un enfoque llamado aumento de datos.
Utilizando un algoritmo de imagen como ejemplo nuevamente, en los casos en que no hay mucho material con el que trabajar, intentarán solucionar ese problema creando copias “distorsionadas” de lo que está disponible.
Distorsionar, en este caso, podría significar recortar una imagen, rotarla o voltearla.
La idea aquí es que la red nunca ve exactamente la misma imagen dos veces.
El problema con ese enfoque es que conduciría a una situación en la que la GAN aprendería a imitar esas distorsiones, en lugar de crear algo nuevo.
El nuevo enfoque de aumento de discriminador adaptativo (ADA) de NVIDIA todavía utiliza el aumento de datos, pero lo hace de forma adaptativa.
En lugar de distorsionar las imágenes durante todo el proceso de entrenamiento, lo hace de manera selectiva y lo suficiente para que el GAN evite el sobreajuste.
El resultado potencial del enfoque de NVIDIA es más significativo de lo que cree.
Entrenar a una IA para escribir un nuevo juego de aventuras basado en texto es fácil porque hay mucho material con el que trabajar el algoritmo.
No ocurre lo mismo con muchas otras tareas que los investigadores podrían recurrir a las GAN en busca de ayuda.
Por ejemplo, entrenar un algoritmo para detectar un trastorno neurológico cerebral raro es difícil precisamente debido a su rareza.
Sin embargo, un GAN capacitado con el enfoque ADA de NVIDIA podría solucionar ese problema.
Como beneficio adicional, los médicos y los investigadores podrían compartir sus hallazgos con mayor facilidad, ya que trabajan a partir de una base de imágenes creadas por una IA, no pacientes en el mundo real.
Fuente: Engadget