Un desarrollo innovador de un equipo dirigido por el MIT podría revolucionar potencialmente los programas de aprendizaje automático, haciéndolos varios órdenes de magnitud más poderosos que los modelos actuales como ChatGPT.
El sistema del equipo funciona utilizando cálculos basados en la luz en lugar de la electrónica tradicional, lo que da como resultado una eficiencia energética y una densidad de cómputo significativamente mejoradas.
Los investigadores informaron sobre su primera demostración experimental del nuevo sistema.
En lugar de depender de los electrones, su método aprovecha el movimiento de la luz utilizando cientos de láseres de escala micrométrica.
Este enfoque innovador trae mejoras notables, con una mejora de más de 100 veces en la eficiencia energética y una mejora de 25 veces en la densidad de cómputo en comparación con las computadoras digitales de última generación utilizadas para aprendizaje automático.
El potencial de avance del sistema es asombroso, y el equipo proyecta “sustancialmente varios órdenes de magnitud más para futuras mejoras”.
Este avance tiene el potencial de allanar el camino para los procesadores optoelectrónicos a gran escala que podrían acelerar las tareas de aprendizaje automático en una variedad de dispositivos, desde centros de datos hasta dispositivos periféricos pequeños y descentralizados, como teléfonos celulares.
Actualmente, los modelos de aprendizaje automático, como ChatGPT, enfrentan limitaciones de tamaño debido a las limitaciones de las supercomputadoras actuales.
Entrenar modelos más grandes se vuelve económicamente inviable.
Sin embargo, la tecnología recientemente desarrollada podría proporcionar un gran avance, haciendo posible la exploración de modelos de aprendizaje automático que antes estaban fuera de alcance.
Con un modelo de aprendizaje automático que es 100 veces más poderoso, las capacidades de ChatGPT de próxima generación se convierten en un reino de posibilidades emocionantes.
Los investigadores pueden desbloquear descubrimientos e innovaciones que antes eran inimaginables.
Este logro es el último de una serie de logros notables del equipo dirigido por el MIT.
Sobre la base del trabajo teórico en 2019, ahora han realizado la primera demostración experimental de su sistema basado en la luz.
La colaboración y las contribuciones de expertos de diferentes instituciones han jugado un papel crucial en este avance.
El uso de luz en lugar de electrones para los cálculos de DNN (Deep neural networks) tiene un enorme potencial para superar los cuellos de botella actuales.
Los cálculos basados en la óptica tienen la ventaja de consumir mucha menos energía en comparación con los sistemas basados en la electrónica.
Además, la óptica permite anchos de banda mucho más grandes, lo que significa que se puede transferir más información en áreas más pequeñas.
Sin embargo, las redes neuronales ópticas (ONN) anteriores enfrentaron desafíos importantes, como la ineficiencia energética y los componentes voluminosos.
La nueva arquitectura compacta desarrollada por los investigadores supera con éxito estos problemas.
Su enfoque, basado en láseres emisores de superficie verticales (VCSEL) de última generación, resuelve todos los desafíos anteriores y más.
Si bien aún queda mucho por hacer antes de que se puedan realizar dispositivos prácticos, a gran escala y rentables, los investigadores son optimistas sobre el potencial de los sistemas basados en arreglos VCSEL modulados.
La eficiencia y la velocidad de las redes neuronales ópticas como la desarrollada por el equipo dirigido por el MIT podrían acelerar significativamente los sistemas de inteligencia artificial a gran escala utilizados en modelos textuales populares como ChatGPT.
El futuro parece prometedor para la integración de la informática basada en la luz en el mundo del aprendizaje automático.
A medida que esta tecnología continúa avanzando, podría revolucionar las capacidades de los sistemas de IA y abrir nuevas fronteras de descubrimiento e innovación.
Fuente: Nature