找回密碼註冊
作者: sxs112.tw
查看: 5358
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

打印 上一主題 下一主題

[顯示卡器] 神秘的NVIDIA GPU-N可能是偽裝成134個SM、8576個核心和2.68TB/s頻寬的下一代Hopper GH100

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2021-12-14 17:32:46 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
NVIDIA發表的一份新研究論文(由Twitter 用戶Redfire發現)揭示了一種名為GPU-N的神秘NVIDIA GPU,它可能是對下一代Hopper GH100晶片的第一眼。
NVIDIA-Hopper-GPU-Feature-AF (1).jpg

研究論文透過可組合封裝架構實現的GPU領域專業化將下一代GPU設計作為最大化低精度矩陣數學吞吐量以提高深度學習性能的最實用解決方案。已經討論了GPU-N及其各自的COPA設計及其可能的規格和模擬性能結果。

據說GPU-N有134個SM 單元(而A100為104個SM單元)。這總共構成了8576個核心,比當前的Ampere A100解決方案增加了24%。該晶片的測量頻率為1.4 GHz,與Ampere A100和Volta V100的理論速度相同(不要與最終時脈混淆)。其他規格包​括60MB L2,比Ampere A100增加 50%,以及2.68TB/s的DRAM頻寬,並可擴展至6.3 TB/s。HBM2e DRAM容量為100 GB,可透過COPA實現擴展到 233 GB。它圍繞6144位元記憶體匯流排進行配置,速度為3.5Gbps。

談到性能數據,GPU-N(大概是Hopper GH100)可產生24.2 TFLOPs的FP32(比A100增加24%)和779 TFLOPs FP16(比A100增加2.5倍),這聽起來非常接近3倍的增益傳聞。與搭載Instinct MI250X加速器的AMD CDNA2 Aldebaran GPU相比,FP32性能不到一半(95.7 TFLOPs對24.2 TFLOPs),但FP16性能高出 2.15倍。

根據之前的訊息我們知道NVIDIA的H100加速器將採用MCM解決方案並使用台積電的5nm製程。Hopper應該有兩個下一代GPU模組,所以我們總共可以看到288 個SM單元。由於我們不知道每個SM中的核心數量,我們還不能給出核心數量的概要,但是如果每個SM堅持64個核心,那麼我們將獲得18,432個核心,比完整的 GA100 GPU多2.25倍SM。NVIDIA還可以在其Hopper GPU中利用更多FP64、FP16和Tensor核心,這將極大地提高性能。這將是與Intel的Ponte Vecchio競爭的必要條件,該Ponte Vecchio預計將採用1:1 FP64。

最終配置可能會在每個GPU上啟用144個SM單元中的134個,因此我們可能會看到單個GH100晶片在執行。但是NVIDIA不太可能在不使用GPU稀疏性的情況下達到與MI200相同的FP32或FP64 Flops性能。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-17 23:56 , Processed in 0.104182 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表