找回密碼註冊
作者: sxs112.tw
查看: 6154
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

打印 上一主題 下一主題

[顯示卡器] NVIDIA表示Hopper上的第4代Tensor核心在同一時脈下可提供2倍的性能。

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2022-8-22 21:31:42 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
NVIDIA在Hot Chips 34上進一步剖析其Hopper H100 GPU,讓我們體驗第四代Tensor核心架構所提供的功能。
NVIDIA-Hopper-H100-GPU.png

雖然AMD在其HPC GPU上採用MCM方法,但NVIDIA決定暫時堅持單Die設計。因此他們的Hopper H100是使用台積電4N製程製造的最大GPU之一,該設計專為 NVIDIA進行了優化和製造。
NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_1-1480x833.png


NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_2-1480x783.png


NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_3-1480x830.png


NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_4-1480x835.png


NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_5-1480x830.png


NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_6-1480x820.png

H100 GPU是一款怪獸級晶片,採用最新的4nm技術,並結合了800億個電晶體管以及最先進的HBM3技術。H100採用PG520 PCB板打造,該板有30多個電源 VRM和一個使用TSMC的CoWoS技術將Hopper H100 GPU與6堆棧HBM3設計相結合的大型整合中介層。Hopper H100 GPU的一些主要技術包括:
  • 132 SMs (2x Performance Per Clock)
  • 4th Gen Tensor Cores
  • Thread Block Clusters
  • 2nd Gen Multi-Instance GPU
  • Confidential Computing
  • PCIe Gen 5.0 Interface
  • World's First HBM3 DRAM
  • Larger 50 MB L2 Cache
  • 4th Gen NVLink (900 GB/s Total Bandwidth)
  • New SHARP support
  • NVLink Network

在六個堆棧中,保留兩個堆棧以確保良率完整性。但是新的HBM3標準允許以3TB/s的速度提供高達80GB的容量。相比之下目前最快的遊戲顯示卡RTX 3090 Ti僅提供1TB/s的頻寬和24GB的VRAM 容量。除此之外H100 Hopper GPU還採用最新的FP8格式,透過其新的SXM連接,它有助於對應晶片設計的700W電源設計。它還提供兩倍的FP32和FP64 FMA速率和256 KB L1高速快取(共享記憶體)。


因此按照規格NVIDIA Hopper GH100 GPU由一個巨大的144SM(處理器)晶片佈局組成,總共有8個GPC。這些GPC共有9個TPC,每個TPC進一步由2個SM單元組成。這使我們每個GPC有18個SM,而在完整的8個GPC配置中,我們有144個。每個SM最多由128個FP32單元組成,這應該給我們總共18,432個CUDA核心。
NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8.png

這比完整的GA100 GPU配置增加了2.25倍。NVIDIA還在其Hopper GPU中利用了更多的FP64、FP16和Tensor核心,這將極大地提高性能。這將是與Intel的Ponte Vecchio競爭的必要條件,後者也有望採用1:1 FP64。NVIDIA表示Hopper上的第4代Tensor核心在同一時脈下可提供2倍的性能。

另一個有趣的比較指出了GPU擴展,Hopper H100 GPU上的單個GPC相當於Kepler GK110 GPU,這是2012年的旗艦HPC晶片。Kepler GK110總共包含15個SM,而Hopper H110 GPU包含132個SM甚至Hopper GPU上的單個GPC也有18個SM,比Kepler旗艦上的全部SM多20%。
NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7.png


消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-15 02:38 , Processed in 0.083140 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表