NVIDIA公佈了即將推出採用Arm的Grace GPU的新測試,該GPU將為下一代數據中心和伺服器提供動力。
Grace CPU由Arm Neoverse N2核心提供支援,將用於NVIDIA的Superchip,有CPU+CPU和CPU+GPU兩種類型。NVIDIA最近宣布了其用於人工智慧和計算工作負載的最強大GPU GH200,它還配備了世界上最快的HBM3e,並將被Grace Hopper Superchip採用。
Grace的一些主要亮點包括:
- 適用於HPC和雲端計算的高性能CPU
- Superchip設計,多達144個Arm v9 CPU核心
- 全球首款帶ECC記憶體的LPDDR5x,總頻寬1TB/s
- SPECrate2017_int_base超過 740(估計)
- 900GB/s匯流排,比PCIe Gen 5快7倍
- 封裝密度是採用DIMM的解決方案的2倍
- 每W性能是當今領先CPU的2倍
- 可執行所有NVIDIA軟體和平台,包括RTX、HPC、AI和Omniverse
在Hot Chips 2023展示中NVIDIA首席科學家Bill Dally介紹了NVIDIA Grace Superchip與其競爭對手的雙路x86解決方案之間的性能比較。其中包括AMD的EPYC 9654,它是最快的96核和192線程解決方案,還有Intel的旗艦產品Xeon Platinum 8480+,它有56核和112線程。由於解決方案在雙插槽配置上運行,因此AMD 平台共有192個核心,Intel平台共有112個核心。
從NVIDIA Grace CPU官方規格中我們得知,Grace Superchip總共提供144個(每個晶片72個Arm Neoverse V2)核心,支援高達960GB的LPDDR5X和高達1TB/s的原始頻寬,並有綜合功耗為500W。其他規格包括117MB L3和58個Gen5通道,同時使用TSMC 4N製程。
NVIDIA選擇的測試涵蓋了廣泛的伺服器應用,例如Weather WRF、MD CP2K、Climate NEMO、CFD OpenFOAM和 raph Analytics GapBS BFS。在所有測試中NVIDIA的Grace Superchip CPU的性能比AMD的Genoa CPU高出40%,同時遠遠領先於Intel的Sapphire Rapids CPU。大多數測試與Genoa相當,這對 Grace來說也很好,因為其中兩個晶片的總TDP為640W(每個EPYC 9654為320W),而Grace Superchip的功率為500W。
然而與實際的大型數據中心應用相比,性能比較變得更加有趣。5MW數據中心吞吐量測試表明,NVIDIA的Grace Superchips可以提供高達2.5倍的性能,同時在相同測試中效率極高。對於投資於這些工作負載的數據中心和伺服器客戶來說,Grace CPU可以成為一個重大的遊戲規則改變者,就像NVIDIA的Tensor Core GPU主導了HPC和AI領域一樣。
消息來源 |