Madrid, 29 Nov (Portaltic/EP) -.
Amazon ha anunciado una nueva generación de chips Graviton4 y Trainium2 desarrollados por Amazon Web Services (AWS).Los chips Graviton4 y Trainium2 están diseñados para cargas de trabajo de modelado de aprendizaje automático (ML) y aplicaciones de inteligencia artificial generativa (AI) que mejoran el rendimiento y la eficiencia energética.
En la conferencia AWS re:Invent celebrada en Las Vegas, AWS anunció su intención de continuar sus esfuerzos para ofrecer a los clientes la oportunidad de ejecutar cualquier aplicación o carga de trabajo en Amazon Elastic Compute Cloud (Amazon EC2).
En este sentido, AWS lanzó su última generación de chips de IA, Graviton4 y Trainium2, diseñados para mejorar el rendimiento y la eficiencia de las cargas de trabajo de los clientes y proporcionar una infraestructura en la nube de última generación.
Según la compañía tecnológica, el procesador Graviton4 ofrece hasta un 30% más de rendimiento computacional, un 50% más de núcleos y un 75% más de ancho de banda de memoria que la anterior generación de procesadores Graviton3.
En concreto, según explica la compañía en un comunicado, el procesador está enfocado a soportar una amplia gama de cargas de trabajo y, según David Brown, vicepresidente de Computación y Redes de AWS, de todos los chips que Amazon ha desarrollado hasta la fecha para estas cargas de trabajo Los más potentes y eficientes energéticamente, dijo.
En la actualidad, Amazon ofrece más de 150 instancias de nube EC2 alimentadas con Graviton en todo el mundo. Estas instancias son utilizadas por más de 50.000 clientes, entre ellos DirecTV, Fórmula 1 (F1) y Pinterest, para mejorar el rendimiento de cargas de trabajo como bases de datos, análisis, procesamiento por lotes y publicación de anuncios.
A medida que los clientes aumentan sus cargas de trabajo, necesitan mejorar la computación, la memoria y el almacenamiento. Esto requiere un mayor rendimiento, una mayor eficiencia energética y mayores tamaños de instancia, que Amazon garantiza con Graviton4.
La compañía también destaca que el procesador puede proporcionar un alto nivel de seguridad, ya que todas las interfaces físicas de hardware de alta velocidad pueden cifrarse.
En concreto, Amazon especifica que el procesador Graviton4 está disponible en instancias Amazon EC2 R8g con memoria optimizada. Esto mejorará el rendimiento de las bases de datos de alto rendimiento, cachés en memoria y análisis de big data de los usuarios.
Las instancias R8g son más grandes que la generación actual de instancias R7g, con hasta tres veces más vCPUs y tres veces más memoria. También están disponibles versiones preliminares.
El chip Trainium2 está diseñado para entrenar modelos lingüísticos hasta cuatro veces más rápido que el chip Trainium de primera generación y es el doble de eficiente desde el punto de vista energético.
El nuevo modelo está listo para que los usuarios lo desplieguen en Amazon EC2 a través de UltraClusters de hasta 100.000 chips. Esto permitirá entrenar modelos básicos (FM) y modelos lingüísticos a gran escala (LLM) con miles de millones de parámetros en una fracción del tiempo. Además, triplica la capacidad de memoria de la primera generación de Trainium.
Como resultado, explica Brown, Tranium2 ayudará a los clientes a entrenar modelos ML más rápidamente, a menor coste y con mayor eficiencia energética.
En concreto, el procesador se utilizará en instancias Amazon EC2 Trn2 y, según Amazon, cada instancia contendrá 16 chips Trainium. Como resultado, los clientes podrán entrenar LLM de 300.000 millones de parámetros en semanas en lugar de meses.Las instancias Trn2 ayudarán a los clientes a desencadenar y acelerar la próxima ola de avances en IA generativa, según la compañía tecnológica.
No obstante, Amazon ha anunciado que está trabajando con Anthropic, la empresa de IA generativa que lanzó recientemente el chatbot Claude, para desarrollar futuros modelos centrales utilizando el chip Trainium.
Tom Brown, cofundador de Anthropic, ha declarado: «Trainium2 nos ayudará a construir y entrenar modelos muy grandes y esperamos que sea al menos cuatro veces más rápido que el chip Trainium de primera generación para algunas de nuestras cargas de trabajo clave». añadió.