Los modelos de inteligencia artificial (IA) como ChatGPT se ejecutan en algoritmos y tienen un gran apetito por los datos, que procesan a través del aprendizaje automático, pero ¿qué pasa con los límites de sus capacidades de procesamiento de datos?
Investigadores dirigidos por el profesor Sun Zhong de la Escuela de Circuitos Integrados y el Instituto de Inteligencia Artificial de la Universidad de Pekín se propusieron resolver el cuello de botella de von Neumann que limita el procesamiento de datos.
El equipo desarrolló el esquema dual-IMC (in-memory computing), que no solo acelera el proceso de aprendizaje automático, sino que también mejora la eficiencia energética de las operaciones de datos tradicionales.
Al seleccionar algoritmos, los ingenieros de software y los científicos informáticos se basan en operaciones de datos conocidas como multiplicación de matriz-vector (MVM), que respalda las redes neuronales.
Una red neuronal es una arquitectura informática que se encuentra a menudo en los modelos de IA y que imita la función y la estructura de un cerebro humano.
A medida que la escala de los conjuntos de datos crece rápidamente, el rendimiento informático suele verse limitado por el movimiento de datos y la falta de coincidencia de velocidad entre el procesamiento y la transferencia de datos.
Esto se conoce como el cuello de botella de von Neumann.
La solución convencional es un esquema de computación en memoria única (IMC única), en el que los pesos de la red neuronal se almacenan en el chip de memoria mientras que la entrada (como imágenes) se proporciona externamente.
Sin embargo, la salvedad del IMC único es el cambio entre el transporte de datos en el chip y fuera del chip, así como el uso de convertidores de digital a analógico (DAC), que causan una gran huella de circuito y un alto consumo de energía.
Para aprovechar al máximo el potencial del principio IMC, el equipo desarrolló un esquema IMC dual que almacena tanto el peso como la entrada de una red neuronal en la matriz de memoria, realizando así operaciones de datos de una manera completamente en memoria.
Luego, el equipo probó el IMC dual en dispositivos de memoria de acceso aleatorio resistiva (RRAM) para la recuperación de señales y el procesamiento de imágenes.
Estos son algunos de los beneficios del esquema de doble IMC cuando se aplica a las operaciones MVM:
Se logra una mayor eficiencia debido a los cálculos completamente en memoria, lo que ahorra tiempo y energía causados por la memoria de acceso aleatorio dinámica (DRAM) fuera del chip y la memoria de acceso aleatorio estática (SRAM) en el chip.
El rendimiento de la computación se optimiza ya que el movimiento de datos, que era un factor limitante, se elimina a través de un método completamente en memoria.
Menor costo de producción debido a la eliminación de los DAC, que son necesarios en el esquema de IMC único.
Esto también significa ahorro en área de chip, latencia de computación y requisitos de energía.
Con una demanda de procesamiento de datos en rápido crecimiento en la era digital actual, los descubrimientos realizados en esta investigación podrían generar nuevos avances en la arquitectura informática y la inteligencia artificial.
Fuente: Cell
Científicos descubren que el cáncer pervierte a los astrocitos, un tipo de células cerebrales, y…
Para obtener imágenes microscópicas es necesario capturar múltiples mediciones secuenciales y, a continuación, utilizar algoritmos…
Un equipo combinado de investigadores biológicos y especialistas en robótica del Hospital Brigham and Women's,…
El robot humanoide Fourier GR-2 recibió algunas mejoras incluidas manos diestras de 12 grados de…
NVIDIA ya es la reina en hardware de IA. Ahora va a por GPT-4 y…
Plantear la compra de una impresora 3D es muy interesante si tienes el dinero, las…