AMD和NVIDIA下一代旗艦GPU詳解：15360核的Radeon RX 7900 XT和18432核的GeForce RTX 4090

sxs112.tw · 發表於 2021-11-12 19:05:08

下一代由AMD RDNA3驅動的Radeon RX 7900 XT和NVIDIA Ada Lovelace驅動的GeForce RTX 4090顯示卡的傳聞規格再次被詳細說明。謠言來自Greymon55，他一直在他的Twitter積極發布有關即將推出的硬體（例如CPU和GPU的詳細訊息。

AMD RDNA3驅動的Navi 31和Ada Lovelace驅動的AD102 GPU有望帶來巨大的性能提升，也將成為有史以來最耗電的晶片。雖然NVIDIA的目標是透過其Ada Lovelace架構採用單一晶片方法，但AMD將利用完整的MCM設計，該設計在推出CDNA2驅動的MI200系列Aldebaran時已處於領先地位。AMD現在將為消費端和遊戲GPU使用相同的MCM技術。

AMD Navi 31 GPU是旗艦RDNA3晶片，將為下一代Radeon RX 7900 XT顯示卡提供動力。聽說AMD將在其下一代RDNA3 GPU上放棄CU（計算單元）改以支援WGP（工作組處理器）。由於Navi 31是MCM GPU，它將擁有兩個關鍵IP，一個採用台積電5nm製程的GCD（顯示核心晶片）和一個採用台積電6nm製程的MCD（多快取晶片）。早前有傳言稱AMD已經開發出了其Navi 31 GPU。

此處的Navi 31 GPU配置具有兩個GCD（顯示核心晶片）和一個 MCD（多快取晶片）。每個GCD有3個著色器引擎（總共6個），每個著色器引擎有2個著色器陣列（每個SE2個/每個GCD 6個/總共12個）。每個著色器陣列由5個WGP（每個SE 10個/每個GCD 30個/總共60個）組成，每個WGP有8個SIMD32單元和32個ALU（每個SA 40個SIMD32/每個SE 80個/每個GCD 240個/總共480個）。這些SIMD32單元組合起來構成每個GCD 7,680個核心和總共15,360個核心。

在性能方面GPU預計將有2.4 - 2.5 GHz的速度，這使其理論性能約為75 TFLOPs (FP32)。與Radeon RX 6900 XT顯示卡相比，這是驚人的226%改進。

Navi 31 (RDNA 3) MCD將透過下一代Infinity Fabric互連連接到雙GCD，並有256-512 MB的Infinity Cache。每個GPU還有4個記憶體連接（32位元）。對應256位元記憶體匯流排，總共有8個32位元記憶體控制器。據稱該卡將配備高達32GB的GDDR6，以18Gbps的速度執行，並提供高達576GB/s的頻寬。最近出現的另一個傳言表明AMD將在其RDNA3產品線中使用3D Infinity Cache技術，該技術將在GPU上的垂直堆棧中整合新快取，類似於Vermeer-X將L3快取堆疊在CCD上的方式。

根據之前的傳言稱NVIDIA將在其Ada Lovelace GPU上使用台積電的N5 (5nm)製程。這也包括AD102 SKU，它將是一個完全單DIE設計。在他關於特定GPU配置的最新推文中，據說AD102 GPU的速度高達2.5GHz（平均提升2.3GHz）。

NVIDIA AD102“ADA GPU”似乎有18432個CUDA核心，初步規格（可以更改）將安裝在144個SM單元內。這幾乎是Ampere中核心的兩倍，而Ampere已經是 Turing 的一大進步。2.3-2.5 GHz的速度將為我們提供高達85到92 TFLOP的計算性能 (FP32)。這是現有RTX 3090 FP32性能的兩倍多，後者包含36 TFLOP的FP32計算能力。

150%的性能提升看起來很大，但記住NVIDIA在這一代的 FP32 數量上已經有了Ampere的大幅提升。Ampere GA102 GPU (RTX 3090) 提供36 TFLOPs，而 Turing TU102 GPU (RTX 2080 Ti) 提供13TFLOPs。這比FP32 Flops提高了 150% 以上，但RTX 3090的實際遊戲性能提高平均只比RTX 2080 Ti快50-60%。所以我們不應該忘記的一件事是，如今的Flop並不等於GPU遊戲性能。此外我們不知道2.3-2.5 GHz是平均提升還是峰值提升，前者意味著AD102可能有更高的計算潛力。

除此之外洩密者還表示NVIDIA GeForce RTX 40旗艦將保留384位元記憶體匯流排，類似於RTX 3090。有趣的是洩密者提到了G6X，這意味著NVIDIA不會轉向直到Ada Lovelace之後的新記憶體標準，並在我們看到更新的標準（例如 GDDR7）之前為其下一代卡使用更高的G6X 21 Gbps速度。該卡將配備24GB，因此我們可以期待看到單面16Gb DRAM或雙面8Gb DRAM。

NVIDIA Ada Lovelace GPU將為下一代 GeForce RTX 40顯示卡提供動力，這些顯示卡將與AMD採用RDNA3的Radeon RX 7000系列顯示卡正面競爭。關於 NVIDIA使用MCM仍有一些猜測。主要針對數據中心和人工智慧領域的Hopper GPU據稱即將推出，並將採用MCM架構。NVIDIA不會在其Ada Lovelace GPU 上使用MCM設計，因此他們將保留傳統的單DIE設計。

消息來源

文章分享：

+ MORE精選文章：

+ MORE活動推薦：

極致效能為遊戲而生 990 PRO SSD 玩家體驗

Micron Crucial PRO D5 6400超頻版玩家開

O11 VISION COMPACT 玩家開箱體驗分享活動

2024 三星SD記憶卡玩家開箱體驗分享活動

[顯示卡器] AMD和NVIDIA下一代旗艦GPU詳解：15360核的Radeon RX 7900 XT和18432核的GeForce RTX 4090