AMD正式發布了代號為Aldebaran的下一代MI200 HPC GPU,該GPU使用6nm CDNA 2架構提供瘋狂的計算性能。
AMD正式率先採用MCM技術,他們正在推出一款代號為Aldebaran的Instinct MI200產品。AMD Aldebaran GPU有多種形式和尺寸,但它們都採用全新的CDNA2 架構。
- AMD CDNA2架構——第二代矩陣核心可加速FP64和FP32矩陣運算,與AMD上一代GPU相比FP64理論峰值性能最高可達4倍。
- 領先的封裝技術– 採用2.5D Elevated Fanout Bridge (EFB) 技術的行業首創多晶片GPU設計,與AMD上一代GPU相比,核心數量增加了1.8倍,記憶體頻寬增加了2.7倍,提供了業界最佳的聚合峰值理論記憶體頻寬每秒3.2TB。
- 第三代AMD Infinity Fabric技術——多達8個Infinity Fabric鏈路將AMD Instinct MI200與節點中的第三代EPYC CPU和其他GPU連接起來,以實現統一的 CPU/GPU記憶體一致性並最大限度地提高系統吞吐量,從而使CPU代碼來挖掘加速器的力量。
AMD Instinct MI200內部是一個Aldebaran GPU,有兩個晶片,每個晶片由8個著色器引擎組成,總共16個SE。每個著色器引擎包含16個擁有全速率FP64、FP32和第二代矩陣引擎的CU,用於FP16和BF16操作。因此每個晶片由128個計算單元或8192個處理器組成。整個晶片總共有220個計算單元或14,080個處理器。Aldebaran GPU還由新的XGMI interconnect提供支援。每個小晶片都擁有VCN 2.6引擎和主I/O控制器。
在性能方面AMD在HPC領域比NVIDIA的A100解決方案取得了多項記錄,AMG的性能提高了3倍。
至於DRAM,AMD已經採用了由1024位元組成的8通道,所以有用於8192位元記憶體頻寬。每個匯流排可支援2GB HBM2e DRAM。這應該可為每個堆棧提供高達16GB的HBM2e容量,並且由於總共有8個堆棧,總容量將高達128GB。這比裝有80GB HBM2e的A100多48 GB。記憶體將以3.2Gbps的瘋狂速度提供,以實現 3.2TB/s的全頻寬。這比擁有2TB/s的A100 80GB多1.2TB/s的頻寬。
Aldebaran MI200 GPU將提供三種配置,僅OAM的MI250和MI250X以及雙插槽PCIe MI210。AMD僅分享了其MI250 HPC GPU的完整規格和性能數據。MI250X有完整的14,080配置並提供47.9、95.7、383 TFLOPs的FP64/FP32/FP16,而MI250有13,312個核心,有45.3,90.5,362.1 TFLOPs的FP64/FP162性能。兩種GPU之間的記憶體配置保持不變。
消息來源
|