找回密碼註冊
作者: sxs112.tw
查看: 7771
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

打印 上一主題 下一主題

[處理器 主機板] 與AMD EPYC Milan CPU相比,NVIDIA Grace CPU Superchip測試顯示性能提升2.5倍,效率提升3.5倍

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2023-1-20 22:40:18 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
NVIDIA最近發布了其下一代Grace CPU Superchip的深入介紹,該晶片的性能比AMD EPYC CPU高出2.5倍。
NVIDIA-Grace-CPU-Superchip-gigap.jpg

NVIDIA在GTC 2022上首次公佈了其Grace CPU和各自的Superchip設計。Grace CPU是NVIDIA首款採用定制Arm架構的處理器,將瞄準伺服器/HPC領域。該CPU 有兩種Superchip配置,一種是帶有兩個Grace CPU的Grace Superchip模組,另一種是帶有一個連接到Hopper H100 GPU的Grace CPU的Grace+Hopper Superchip。
NVIDIA-Grace-CPU-Superchips-_-Hot-Chips-34-_2.png

Grace 的一些主要亮點包括:

  • 用於HPC和雲端計算的高性能CPU
  • Superchip設計,多達144個Arm v9 CPU核心
  • 全球首款帶ECC的LPDDR5x,1TB/s總頻寬
  • SPECrate2017_int_base超過740(估計)
  • 900GB/s一致匯流排,比PCIe Gen5快7倍
  • 封裝密度是採用DIMM的解決方案的2倍
  • 是當今領先CPU的每W性能的2倍
  • 可執行所有NVIDIA軟體堆棧和平台,包括RTX、HPC、AI和Omniverse


作為NVIDIA的第一款伺服器CPU,Grace有72個Arm v9.0核心,支援SVE2和各種虛擬化擴展,例如嵌套虛擬化和S-EL2。該CPU採用TSMC的4N製程製造,這是專為NVIDIA製造的5nm製程的優化版本。新架構可提供高達7.1TFLOPs的峰值FP64性能。
NVIDIA-Grace-CPU-Superchips-_-Hot-Chips-34-_1.png


Grace旨在配對,因此設計中最關鍵的方面之一是其C2C(晶片到晶片)互連。Grace透過用於製造Superchip的NVLINK實現了這一點,並消除了與典型交叉插槽配置相關的所有瓶頸。
NVIDIA-NVLINK-Hot-Chips-34.jpg


C2C NVLINK互連提供900GB/s的原始雙向頻寬(與Hopper上的GPU到GPU NVLINK的頻寬相同),同時以僅1.3pJ/bit的極低功耗介面執行。
NVIDIA-Grace-CPU-Superchips-_-Ho.jpg


NVIDIA Grace CPU有可擴展的一致性結構和分佈式快取設計。該晶片有高達3.225TB/s的對分頻寬,可擴展到超過72個核心(在Superchip上為144個),每個核心整合117MB L3或每個Superchip 234MB,並支援Arm記憶體分區和監控( MPAM)。Grace還允許使用共享頁表的統一記憶體架構。兩個NVIDIA Grace+Hopper Superchip可以透過NVSwitch互連在一起,一個Superchip上的Grace CPU可以直接與另一個晶片上的GPU通訊,甚至可以以原生NVLINK速度訪問其VRAM。
NVIDIA-Grace-CPU-Superchips-_-Ho (1).jpg


仔細觀察Grace的記憶體設計,NVIDIA在32個通道中使用高達960GB的LPDDR5X (ECC),提供高達1TB/s的記憶體頻寬。NVIDIA表示在牢記整體頻寬、成本和功率要求的情況下,LPDDR5X可提供最佳價值。例如與DDR5相比,LPDDR5X系統以每秒八分之一的功率提供多53%的頻寬,並且成本相似。此外HBM2e本可以提供更多的頻寬和效率,但成本是原來的3倍。
NVIDIA-Grace-CPU-Superchips-_-Ho (2).jpg


對於I/O,您將獲得68個PCIe Gen 5.0通道,其中四個可用於128GB/s的x16鏈路,其餘兩個用於MISC。還有12條相干NVLINK通道與兩個Gen 5 PCIe x16鏈路共享。
NVIDIA-Grace-CPU-Superchips-_-Ho (3).jpg


至於TDP,NVIDIA Grace(僅限CPU)Superchip針對單核性能進行了優化,並為144核雙晶片配置提供高達1TB/s的記憶體頻寬和500W的TDP。
NVIDIA-Grace-Superchip-vs-AMD-EP.jpg

NVIDIA展示的性能數據將Grace CPU Superchip與雙路 (2P) AMD EPYC 7763 Milan CPU在各種HPC工作負載(如OpenFOAM、WRF、NEMO和BWA)上進行了比較。在OpenFOAM中Grace CPU Superchip提供令人難以置信的2.5倍性能提升和高達3.5倍的效率。平均而言與AMD的EPYC Milan CPU相比,NVIDIA的新型Grace CPU Superchip應該能夠提供1.9倍的性能提升和2.57倍的每W性能提升。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-12-1 17:26 , Processed in 0.105402 second(s), 34 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表