NVIDIA宣布推出最新的DGX和Superchip平台,配備全新Blackwell B200 GPU和 Grace CPU。
NVIDIA的Superchip被設計為AI和HPC工作負載的典型平台。正如我們之前所看到的,該平台有兩種配置:僅CPU和CPU+GPU版本。這些Superchip產品首次發佈時配備了Hopper H100 GPU以及第一代採用Arm的Grace CPU。今天NVIDIA即將推出Superchip的新篇章。
該公司發布了兩款新解決方案,GB200,它是Grace CPU與Blackwell B100 GPU的組合。該解決方案計劃於2024年推出,並將採用相同的192GB HBM3e記憶體容量,功率高達2700W。因此讓我們深入了解一下規格。您還可以獲得PCIe 6.0 (2x 256 GB/s) 的最新協定支援。Blackwell B200 GPU將與現有的Hopper平台和資料中心製造商的最新解決方案相容。
每個GB200 Grace Blackwell Superchip將配備兩個B200 AI GPU和一個有72個相同ARM Neoverse V2核心的Grace CPU。該平台將提供40 PetaFlops的運算效能 (INT8),並提供864GB的海量記憶體,僅HBM即可提供16TB/s的記憶體頻寬。這些晶片將使用快速的3.6TB/s NVLINK頻寬進行互連。
其中兩個GB200 Grace Blackwell Superchip平台將整合到Blackwell運算節點中,提供高達80 PetaFLOPs的AI效能、1.7TB的HBM3e記憶體、32TB/s的記憶體頻寬,並且全部採用水冷MGX封裝。
這些晶片將封裝在全新的GB200 NVL72運算平台中,每個平台在機架中配備18個運算托盤,最多可容納36個Grace CPU和72個Blackwell GPU。每個機架都配備 ConnectX-800G Infiniband SuperNIC和Bluefield-3 DPU(80GB/s記憶體頻寬),用於網路內運算。該公司還配備了最新的NVLINK交換機,該交換機有8個孔,速率為1.8TB/s,聚合頻寬高達14.4TB/s。
我們必須多談談NVLink交換器本身,因為它是一個500億個電晶體的龐然大物,也是在同一TSMC 4NP製程上製造的,擁有72埠雙200GB/s SerDes、4個1.8TB/s 的NVLINK 、7.2TB/s的全雙工頻寬和3.6 TFLOPs 的SHARP網路內運算能力。
在效能方面,GB200 Grace Blackwell Superchip平台的AI效能將比H200 Grace Hopper平台提升30倍。NVIDIA Blackwell GB200將於今年稍晚在DGX Cloud 上提供,Dell, Cisco, HPE, Lenovo, Supermicro, Aivres, ASRock Rack, ASUS, Eviden, Foxconn, Gigabyte, Inventec, Pegatron, QCT, Wistron, Wiwynn & ZT System等OEM廠商也將在未來推出採用NVIDIA Blackwell GB200的自家解決方案。
消息來源 |