A AMD apresentou seu mais recente chip, o Instinct MI325X, um acelerador de inteligência artificial projetado especificamente para competir diretamente com a NVIDIA no mercado de data center voltado para IA. Esse novo componente, baseado na arquitetura CDNA 3, está posicionado como uma alternativa de alto desempenho aos produtos mais avançados de sua concorrente. De acordo com a AMD, o MI325X supera o modelo H200 da NVIDIA em até 30% em tarefas intensivas de IA.

A Instinct MI325X foi projetada para oferecer desempenho e eficiência excepcionais em aplicativos de inteligência artificial, incluindo treinamento, otimização e inferência de modelos. A GPU tem 304 unidades de computação (CUs) e suporta até 256 GB de memória HBM3E com largura de banda de 6,0 TB/s, posicionando-a como uma ferramenta formidável para aceleração de modelos de IA em data centers de grande escala.

Em termos de desempenho teórico, o MI325X atinge uma precisão máxima de 1307,4 TFLOPS em FP16 e BF16, e 2614,9 TFLOPS em FP8, enquanto em números inteiros (INT8) ele atinge 1.978,9 TOPS. Além disso, benchmarks como Mistral 7B, Llama 3.1 70B e Mixtral 8x7B indicam que o MI325X supera significativamente o H200 da NVIDIA, reforçando as afirmações da AMD sobre a superioridade de seu chip em tarefas de inferência.

Disponibilidade

Durante a apresentação do novo chip, a AMD também confirmou que a produção do MI325X começará antes do final de 2024. Paralelamente, a empresa garantiu parcerias com os principais fabricantes, como Dell, Gigabyte, HP Enterprise, Lenovo, SuperMicro e Eviden, com o objetivo de integrar o acelerador em seus sistemas de data center. Espera-se que o MI325X esteja disponível comercialmente durante o primeiro trimestre de 2025.

O lançamento do Instinct MI325X foi acompanhado por um roteiro claro para os próximos lançamentos da AMD. A empresa planeja introduzir a série MI350, baseada na arquitetura CDNA 4, durante o segundo semestre de 2025, seguida pela série MI400, que usará uma arquitetura de próxima geração em 2026. A AMD disse que a linha de aceleradores de IA se tornou a categoria de produtos de crescimento mais rápido na história da empresa.

O MI350 está se moldando para ser uma evolução significativa em relação ao MI325X, oferecendo uma melhoria de 35x no desempenho de inferência e até 288GB de memória HBM3E por acelerador. Esses aprimoramentos têm o objetivo de fortalecer a presença da AMD no competitivo mercado de IA.

Perspectivas

A AMD também está empenhada em fortalecer o suporte de seus aceleradores para as principais bibliotecas e modelos de IA, como o Meta's Llama 3.2 e o Stable Diffusion 3. Além disso, os aceleradores Instinct já suportam mais de um milhão de modelos de linguagem na plataforma Hugging Face, ressaltando o esforço da AMD para fornecer um ambiente robusto e eficiente para os desenvolvedores.

A estratégia da AMD não é apenas competir com a NVIDIA em termos de desempenho, mas também oferecer uma vantagem de custo total de propriedade ao proporcionar uma relação custo-desempenho favorável. Isso pode se traduzir em desempenho superior com o mesmo preço da concorrência, ou capacidade equivalente a um custo menor. No entanto, a AMD ainda não divulgou o preço do MI325X, embora se espere que ele seja inferior ao preço de US$ 28.900 (aproximadamente 26.428 euros) do H200 da NVIDIA, reforçando seu foco na competitividade.