除了以AI為導向的MI300X之外,AMD也宣布其Instinct MI300A APU已進入量產,預計明年推出時將提供全球最快的HPC效能。
我們多年來一直等待AMD最終兌現Exascale級APU的承諾,隨著Instinct MI300A的推出,這一天也越來越近了。今天AMD證實MI300A APU本季已進入量產,並有望在2024年上市時成為全球最快的HPC解決方案。
AMD Instinct MI300A APU結合了多種架構和互連技術,其中最前端的是Zen 4、CDNA 3和第四代Infinity架構。MI300A APU的一些亮點包括:
- 高達61 TFLOPS FP64計算
- 高達122 TFLOPS FP32計算
- 高達128 GB HBM3
- 高達5.3TB/s的記憶體頻寬
- 1460億個電晶體
MI300A的設計與MI300X非常相似,只是它使用了TCO優化的記憶體容量和Zen 4核心。因此讓我們詳細了解下一代HPC和AI資料中心的Exascale計算能力。
AMD Instinct MI300A 加速器。
其中一個主動晶片有兩個CDNA 3 GCD,被切掉並替換為三個Zen 4 CCD,這些CCD提供獨立的快取和核心IP。每個CCD有8個核心和16個線程,因此活動晶片上總共有24個核心和48個線程。還有24MB的L2(每個核心1MB)和一個單獨的快取(每個CCD 32MB)。CDNA 3 GCD還有獨立的L2快取。
在GPU方面,AMD採用CDNA 3架構總共啟用了228個運算單元,相當於14,592個核心。也就是說每個GPU小晶片有38個運算單元。總結AMD Instinct MI300 加速器的一些突出功能有:
- 首款整合CPU+GPU封裝
- 瞄準Exascale超級電腦市場
- AMD MI300A(整合CPU+GPU)
- 1460億個電晶體
- 多達24個Zen 4核心
- CDNA 3 GPU架構
- 228個計算單元(14,592個核心)
- 高達128GB HBM3記憶體
- 多達8個Chiplet+8個記憶體堆疊(5nm+6nm製程)
談到效能數據,AMD再次將MI300A與H100進行比較,但這次是針對HPC特定的工作負載。在OpenFOAM中Instinct MI300A APU可提供高達4倍的效能提升,這主要來自於統一的記憶體設計、GPU效能以及整體記憶體容量和頻寬。與NVIDIA的Grace Hopper Superchips相比,該系統的每W效能提高了2倍。
AMD也確認Instinct MI300A APU現已出貨,也將用於為新一代El-Capitan超級電腦提供動力,預計可提供高達2 Exaflops的運算能力。值得一提的是AMD是唯一一家透過Frontier超級電腦突破1 Exaflop障礙的公司,也是地球上最高效的系統。
消息來源 |