Intel anunció su nuevo acelerador de IA, Gaudi 3. Compitiendo con el H100 de Nvidia, Gaudi 3 ofrece un rendimiento de entrenamiento 1,7 veces mayor, una inferencia un 50 % mejor y una eficiencia un 40 % mayor que su rival.
Intel anunció sus nuevos procesadores aceleradores de inteligencia artificial Gaudi 3 en el evento Vision 2024. Compitiendo con los aceleradores H100 de Nvidia, Gaudi 3 ofrece un rendimiento de entrenamiento 1,7 veces mayor, una inferencia un 50 % mejor y una eficiencia un 40 % mayor que su rival.
En su lucha por alcanzar a su rival en el campo de la inteligencia artificial, donde Nvidia es el líder indiscutible del mercado, Intel afirma que Gaudi 3 ofrece un rendimiento mucho mejor que el acelerador H100 de la generación anterior de Nvidia. La compañía también está trabajando en la creación de una red de software empresarial que servirá como alternativa a CUDA de Nvidia para crear un ecosistema para los sistemas Gaudi 3.
El Gaudi 3 de Intel representa la tercera generación del acelerador Gaudí, fruto de la adquisición de Habana Labs por 2.000 millones de dólares por parte de la empresa en 2019. Los aceleradores Gaudí entrarán en producción en gran volumen en el tercer trimestre de 2024 y comenzarán a estar disponibles para los fabricantes de equipos originales.
Características de Intel Gaudí 3
Gaudí vendrá en dos factores de forma. El primero es el OAM (módulo acelerador OCP) HL-325L, factor de forma Mezzanine que se encuentra en sistemas basados en GPU de alto rendimiento. Este acelerador tendrá 128 GB de memoria HBM2e y 900W TDP que proporcionarán un ancho de banda de 3,7 TB/s. El acelerador podrá ofrecer un rendimiento de 1.835 TFLOPS en el 8PM. Los OAM se implementarán en grupos de 8 por nodo de servidor y pueden escalarse hasta 1024 nodos. El otro factor de forma será el Gaudi 3 HL-338 con refrigeración pasiva en forma de tarjeta PCIe y un TDP de 600W.
Intel afirma que Gaudi 3 proporciona un rendimiento FP8 2 veces mayor y un rendimiento BF16 4 veces mayor que la generación anterior, así como 2 veces más ancho de banda de red y 1,5 veces mayor ancho de banda de memoria.