除了Hopper GH100 GPU之外,NVIDIA還推出了其下一代Grace CPU設計,該設計將由兩個全新的Superchip平台提供支援。其中包括專為HPC和AI生態系統設計的Grace CPU和Grace Hopper平台。
NVIDIA制定了一個3晶片數據中心戰略,它希望其Hopper GPU、Grace CPU及其兩個IP的組合能夠利用整個AI和數據中心生態系統。對於更非傳統的工作負載,NVIDIA提供了兩個平台。這些被標記為SUPERCHIPS,將在僅CPU和GPU+CPU組合中提供。
首先NVIDIA擁有Grace Hopper Superchip,這是一個專為大規模AI和HPC使用而設計的平台。這個Grace CPU和Hopper GPU組合堆疊有600GB的GPU記憶體、每秒900GB的NVLINK接口,並執行NVIDIA計算堆棧軟體套件。所有這些都為配備SUPERCHIP產品的伺服器中的GPU提供了30倍的系統記憶體頻寬,並提供了巨大的性能提升。Grace Hopper Superchip平台預計將於2023年上半年上市。
第二個Superchip平台是Grace CPU,它擁有針對HPC和AI基礎設施的高性能Grace ARM CPU核心。該計算平台由144個採用ARM Neoverse架構的核心組成,可提供740 SPECrate@2017_int_base的性能(估計)。在相同的性能指標中(之前的估計是300),這次發布增加了近2.5倍。
它也是第一個採用LPDRR5X記憶體並支援ECC的平台,提供高達1TB/s的記憶體頻寬。該平台還執行在NVIDIA的計算堆棧軟體套件上,每W性能比Intel和AMD的傳統伺服器高出2倍。該平台也預計將於2023年1H推出。Grace SUPERCHIP的額定功率預計為500W。
NVIDIA表示其Grace是一款高度專業化的處理器,目標是訓練擁有超過1兆個參數的下一代NLP模型等工作負載。當與NVIDIA GPU緊密結合時,採用Grace CPU 的系統將提供比當今最先進的NVIDIA DGX的系統(在x86 CPU上執行)快10倍的性能。
NVIDIA利用Arm數據中心架構的驚人靈活性打造了Grace。透過導入新的伺服器等級CPU,NVIDIA正在推進AI和HPC社區的技術多樣性目標。
消息來源
|