Categorías: Tecnología

Amazon presenta nuevos chips para entrenamiento de inteligencias artificiales

Comparta este Artículo en:

Amazon no quiere ceder espacio a Microsoft y anunció dos procesadores pensados para cómputo de alto rendimiento y entrenamiento de modelos de aprendizaje automático.

En el marco de su evento re:Invent, el gigante tecnológico anunció las novedades que llegarán al segmento empresarial a través de Amazon Web Services (AWS).

Una de ellas es el despliegue de sus procesadores Trainium2 y Graviton4, desarrollados para escenarios de aprendizaje automático y ejecución de aplicaciones basadas en IA.

Con el anuncio de sus nuevos chips, Amazon busca competir de frente con Microsoft y sus recién anunciados Maia 100 y Cobalt 100, dos procesadores para centros de datos.

AWS sigue un camino similar y ofrece soluciones basadas en arquitectura ARM.

El primero de ellos es Trainium2, un chip de aprendizaje automático diseñado para entrenar modelos de inteligencia artificial generativa.

De acuerdo con Amazon, el Trainium2 es cuatro veces más rápido que su predecesor, ofreciendo hasta 200 teraflops de rendimiento.

Estos procesadores están planeados para implementarse en instancias EC2 UltraClusters de próxima generación escalables hasta 100.000 chips.

Amazon reveló que un arreglo de este tipo puede entrenar un modelo de lenguaje extenso con 300.000 millones de parámetros en semanas.

Las empresas ahorrarán un 50 % en costos de implementación y hasta un 29 % en consumo energético.

Trainium2 es la evolución de la primera generación de chips de aprendizaje automático, presentada a finales de 2020 como una estrategia para aumentar el rendimiento y reducir la dependencia a las instancias basadas en GPU.

Uno de los principales beneficiados por la llegada de estos chips será Anthropic, la compañía de inteligencia artificial fundada por ex empleados de OpenAI.

Hace unos días, la empresa anunció Claude 2.1, la nueva versión de su modelo de lenguaje capaz de procesar hasta 150.000 palabras por entrada.

El segundo en la lista es Graviton4, un procesador de alto rendimiento pensado para servidores de aplicaciones, bases de dato de código abierto y computación de alto rendimiento.

El chip está conformado por 96 núcleos Neoverse V2, 2 MB de caché L2 por núcleo y 12 canales de memoria DDR5-5600.

Esto se traduce en un 30 % de mejora en el rendimiento y hasta un 75 % más de ancho de banda de memoria.

En términos de seguridad, los procesadores Graviton4 cuentan con cifrado de memoria siempre activo, caches dedicados para cada vCPU y compatibilidad con autenticación de puntero.

Amazon confirmó que el chip encripta todas las interfaces físicas de hardware de alta velocidad.

Graviton4 marca la cuarta generación que hemos entregado en solo cinco años y es el chip más potente y energéticamente eficiente que jamás hayamos construido”, declaró David Brown, director de Computación y Redes de AWS.

“Con el aumento del interés en la IA generativa, Trainium2 ayudará a los clientes a entrenar sus modelos de ML más rápido, a menor costo y con mejor eficiencia energética”.

Graviton4 estará disponible en instancias EC2 R8g con memoria optimizada y contará con el respaldo de otros servicios de AWS, como Aurora, ElastiCache, EMR, MemoryDB, OpenSearch y más.

Amazon ofrecerá acceso a una versión preliminar a partir de hoy, con un lanzamiento global previsto para los próximos meses.

Fuente: Businesswire

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace
Click to listen highlighted text!