Esta máquina aglutina nada menos que 576 plataformas DGX H100, y cada una de ellas incorpora ocho GPU H100.
Eos es uno de los supercomputadores más capaces del planeta en el ámbito de la inteligencia artificial (IA) generativa.
Lo ha diseñado y construido NVIDIA presumiblemente para uso propio, aunque con toda probabilidad uno de sus propósitos es actuar como máquina de referencia que puede ser clonada por NVIDIA para otras compañías que necesitan una infraestructura de supercomputación especializada en IA.
Las cifras que reflejan el rendimiento de este supercomputador son impactantes.
Sus 121,40 PFlop/s (Rmax) y 188,65 PFlop/s (Rpeak) lo colocan como el noveno supercomputador más potente del mundo por detrás de máquinas como Frontier, Aurora, Eagle o Fugaku.
Según NVIDIA Eos entrega una potencia de 18,4 exaflops en aplicaciones de inteligencia artificial.
Es una auténtica barbaridad.
No es fácil poner en contexto esta cifra, pero puede ayudarnos reparar en que esta máquina aglutina nada menos que 576 plataformas DGX H100, y cada una de ellas incorpora ocho GPU H100, por lo que Eos tiene un total de 4.608 chips H100 de NVIDIA.
Esta mastodóntica GPU con microarquitectura Hopper está fabricada por TSMC en su nodo de 4 nm y condensa nada menos que 80.000 millones de transistores.
No obstante, aunque esta GPU de NVIDIA es la auténtica protagonista de este supercomputador si nos ceñimos a sus especificaciones es importante que no pasemos por alto que en esta máquina trabaja codo con codo con 1.152 procesadores Intel Xeon Platinum 8480C.
Cada una de estas CPU de propósito general tiene 56 núcleos y contribuye de una forma decisiva a la espectacular productividad que arroja esta máquina en el ámbito de la computación de alto rendimiento.
En cualquier caso, en la receta utilizada por NVIDIA para poner a punto este supercomputador aparecen dos ingredientes más que merece la pena que no pasemos por alto.
El primero de ellos es la arquitectura DGX SuperPOD, una plataforma diseñada expresamente para simplificar la puesta a punto de infraestructuras para centros de datos que sean fácilmente escalables.
En teoría para NVIDIA sería sencillo poner a punto un supercomputador similar a Eos pero integrado por una cantidad mayor de sistemas DGX H100.
El último ingrediente de la receta que ha dado lugar a Eos en el que merece la pena que nos detengamos es la tecnología Mellanox Quantum-2 InfiniBand de NVIDIA.
Se trata de una arquitectura de comunicaciones en red de alto rendimiento diseñada para optimizar la transferencia de datos entre los nodos de una red, y no cabe duda de que es en cierta medida responsable del rendimiento.
Fuente: YouTube