sxs112.tw 發表於 2023-12-7 08:22:26

AMD Instinct MI300A APU進入量產:HPC速度比NVIDIA H100快4倍,效率提高一倍

除了以AI為導向的MI300X之外,AMD也宣布其Instinct MI300A APU已進入量產,預計明年推出時將提供全球最快的HPC效能。

我們多年來一直等待AMD最終兌現Exascale級APU的承諾,隨著Instinct MI300A的推出,這一天也越來越近了。今天AMD證實MI300A APU本季已進入量產,並有望在2024年上市時成為全球最快的HPC解決方案。



AMD Instinct MI300A APU結合了多種架構和互連技術,其中最前端的是Zen 4、CDNA 3和第四代Infinity架構。MI300A APU的一些亮點包括:

[*]高達61 TFLOPS FP64計算
[*]高達122 TFLOPS FP32計算
[*]高達128 GB HBM3
[*]高達5.3TB/s的記憶體頻寬
[*]1460億個電晶體


MI300A的設計與MI300X非常相似,只是它使用了TCO優化的記憶體容量和Zen 4核心。因此讓我們詳細了解下一代HPC和AI資料中心的Exascale計算能力。

AMD Instinct MI300A 加速器。
其中一個主動晶片有兩個CDNA 3 GCD,被切掉並替換為三個Zen 4 CCD,這些CCD提供獨立的快取和核心IP。每個CCD有8個核心和16個線程,因此活動晶片上總共有24個核心和48個線程。還有24MB的L2(每個核心1MB)和一個單獨的快取(每個CCD 32MB)。CDNA 3 GCD還有獨立的L2快取。

在GPU方面,AMD採用CDNA 3架構總共啟用了228個運算單元,相當於14,592個核心。也就是說每個GPU小晶片有38個運算單元。總結AMD Instinct MI300 加速器的一些突出功能有:

[*]首款整合CPU+GPU封裝
[*]瞄準Exascale超級電腦市場
[*]AMD MI300A(整合CPU+GPU)
[*]1460億個電晶體
[*]多達24個Zen 4核心
[*]CDNA 3 GPU架構
[*]228個計算單元(14,592個核心)
[*]高達128GB HBM3記憶體
[*]多達8個Chiplet+8個記憶體堆疊(5nm+6nm製程)




談到效能數據,AMD再次將MI300A與H100進行比較,但這次是針對HPC特定的工作負載。在OpenFOAM中Instinct MI300A APU可提供高達4倍的效能提升,這主要來自於統一的記憶體設計、GPU效能以及整體記憶體容量和頻寬。與NVIDIA的Grace Hopper Superchips相比,該系統的每W效能提高了2倍。

AMD也確認Instinct MI300A APU現已出貨,也將用於為新一代El-Capitan超級電腦提供動力,預計可提供高達2 Exaflops的運算能力。值得一提的是AMD是唯一一家透過Frontier超級電腦突破1 Exaflop障礙的公司,也是地球上最高效的系統。

消息來源
頁: [1]
查看完整版本: AMD Instinct MI300A APU進入量產:HPC速度比NVIDIA H100快4倍,效率提高一倍