AMD對其CDNA 2 Aldebaran GPU驅動的Instinct MI200系列提供了一些進一步的見解,該系列是第一個採用MCM設計的產品。AMD架構師Alan Smith和Norman James在Hot Chips 34期間詳細介紹了Instinct MI200 GPU。
AMD正式成為第一個採用MCM技術的公司,他們正在使用代號為Aldebaran的Instinct MI200來實現這一目標。AMD Aldebaran GPU將有各種形式和尺寸,但它都採用全新的CDNA2架構,這是Vega最精緻的版本。
AMD Instinct MI200內部是一個Aldebaran GPU,擁有兩個晶片,一個輔助晶片和一個主晶片。它有兩個模具,每個模具由8個著色器引擎組成,總共16個SE。每個著色器引擎包含14個CU,擁有全速率FP64、FP32和用於FP16和BF16操作的第二代矩陣引擎。整個GPU採用台積電的6nm製程打造造,共有580億個電晶體管。
因此每個晶片由112個計算單元(7,168個處理器)組成。整個晶片總共有224個計算單元(14,336個處理器)。Aldebaran GPU也由新的XGMI互連提供支援。每個小晶片都有VCN 2.6引擎和主I/O控制器。每個GPU小晶片都有四個用於HBM2e的1024位元記憶體控制器。
至於快取,每個GPU小晶片共有8MB的L2容量,被物理劃分為32個切片。每個slice提供128B/CLK,有增強的排隊和仲裁以及增強的原子操作。每個GCD記憶體系統包括每個小晶片64GB的HBM2e,每個GCD的總頻寬為1.6TB/s,它被劃分為32個通道,有64B/CLK以實現高效工作電壓。封裝內互連包括跨兩個GCD的400 GB/s雙向頻寬。
共有8個Infinity Fabric互連,每個GPU上的一個可用於PCI-Express互連。互連的額定CPU-GPU傳輸速率為144GB/s。您可以使用帶有總共四個MI200系列GPU 的外部Infinity Fabric連接擴展至500GB/s或者使用PCIe Gen 4 ESM AIC橫向擴展至100GB/s頻寬。
在性能方面AMD吹捧在HPC領域的多項創紀錄勝利,超過了NVIDIA的A100解決方案,AMG的性能提升高達3倍。至於DRAM,AMD採用了由1024位元組成的8 通道,用於8192位元頻寬的匯流排。每個匯流排可支援2GB HBM2e DRAM。這應該為每個堆棧提供高達16GB的HBM2e容量,並且由於總共有8個堆棧,總容量將高達128GB。這比裝有80GB HBM2e的A100多48GB。記憶體將以3.2Gbps的驚人速度進入,全頻寬為3.2TB/s。這比有2TB/s的A100 80GB多出1.2TB/s的頻寬。
AMD Instinct MI200 CDNA 2 Aldebaran GPU已經為世界上最快的超級電腦Frontier提供動力,這也是世界上第一台Exascale機器,提供1.1 ExaFLOPs的計算能力,目前在TOP500和Green500列表中名列前茅. AMD還公佈了Instinct MI300 APU系列的未來計劃,該系列將進一步利用小晶片架構並將事情提升到一個新的水平。
消息來源
|