找回密碼註冊
作者: sxs112.tw
查看: 5829
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

打印 上一主題 下一主題

[顯示卡器] AMD和NVIDIA下一代旗艦GPU詳解:15360核的Radeon RX 7900 XT和18432核的GeForce RTX 4090

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2021-11-12 19:05:08 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
下一代由AMD RDNA3驅動的Radeon RX 7900 XT和NVIDIA Ada Lovelace驅動的GeForce RTX 4090顯示卡的傳聞規格再次被詳細說明。謠言來自Greymon55,他一直在他的Twitter積極發布有關即將推出的硬體(例如CPU和GPU的詳細訊息。
AMD-NVIDIA-GPU-Prices-2021.png

AMD RDNA3驅動的Navi 31和Ada Lovelace驅動的AD102 GPU有望帶來巨大的性能提升,也將成為有史以來最耗電的晶片。雖然NVIDIA的目標是透過其Ada Lovelace架構採用單一晶片方法,但AMD將利用完整的MCM設計,該設計在推出CDNA2驅動的MI200系列Aldebaran時已處於領先地位。AMD現在將為消費端和遊戲GPU使用相同的MCM技術。

AMD Navi 31 GPU是旗艦RDNA3晶片,將為下一代Radeon RX 7900 XT顯示卡提供動力。聽說AMD將在其下一代RDNA3 GPU上放棄CU(計算單元)改以支援WGP(工作組處理器)。由於Navi 31是MCM GPU,它將擁有兩個關鍵IP,一個採用台積電5nm製程的GCD(顯示核心晶片)和一個採用台積電6nm製程的MCD(多快取晶片)。早前有傳言稱AMD已經開發出了其Navi 31 GPU。
AMD-Radeon-GPU-_9.png

此處的Navi 31 GPU配置具有兩個GCD(顯示核心晶片)和一個 MCD(多快取晶片)。每個GCD有3個著色器引擎(總共6個),每個著色器引擎有2個著色器陣列(每個SE2個/每個GCD 6個/總共12個)。每個著色器陣列由5個WGP(每個SE 10個/每個GCD 30個/總共60個)組成,每個WGP有8個SIMD32單元和32個ALU(每個SA 40個SIMD32/每個SE 80個/每個GCD 240個/總共480個)。這些SIMD32單元組合起來構成每個GCD 7,680個核心和總共15,360個核心。

在性能方面GPU預計將有2.4 - 2.5 GHz的速度,這使其理論性能約為75 TFLOPs (FP32)。與Radeon RX 6900 XT顯示卡相比,這是驚人的226%改進。

Navi 31 (RDNA 3) MCD將透過下一代Infinity Fabric互連連接到雙GCD,並有256-512 MB的Infinity Cache。每個GPU還有4個記憶體連接(32位元)。對應256位元記憶體匯流排,總共有8個32位元記憶體控制器。據稱該卡將配備高達32GB的GDDR6,以18Gbps的速度執行,並提供高達576GB/s的頻寬。最近出現的另一個傳言表明AMD將在其RDNA3產品線中使用3D Infinity Cache技術,該技術將在GPU上的垂直堆棧中整合新快取,類似於Vermeer-X將L3快取堆疊在CCD上的方式。



根據之前的傳言稱NVIDIA將在其Ada Lovelace GPU上使用台積電的N5 (5nm)製程。這也包括AD102 SKU,它將是一個完全單DIE設計。在他關於特定GPU配置的最新推文中,據說AD102 GPU的速度高達2.5GHz(平均提升2.3GHz)。
NVIDIA-GeForce-RTX-3090-Graphics-Card-1.jpg

NVIDIA AD102“ADA GPU”似乎有18432個CUDA核心,初步規格(可以更改)將安裝在144個SM單元內。這幾乎是Ampere中核心的兩倍,而Ampere已經是 Turing 的一大進步。2.3-2.5 GHz的速度將為我們提供高達85到92 TFLOP的計算性能 (FP32)。這是現有RTX 3090 FP32性能的兩倍多,後者包含36 TFLOP的FP32計算能力。

150%的性能提升看起來很大,但記住NVIDIA在這一代的 FP32 數量上已經有了Ampere的大幅提升。Ampere GA102 GPU (RTX 3090) 提供36 TFLOPs,而 Turing TU102 GPU (RTX 2080 Ti) 提供13TFLOPs。這比FP32 Flops提高了 150% 以上,但RTX 3090的實際遊戲性能提高平均只比RTX 2080 Ti快50-60%。所以我們不應該忘記的一件事是,如今的Flop並不等於GPU遊戲性能。此外我們不知道2.3-2.5 GHz是平均提升還是峰值提升,前者意味著AD102可能有更高的計算潛力。

除此之外洩密者還表示NVIDIA GeForce RTX 40旗艦將保留384位元記憶體匯流排,類似於RTX 3090。有趣的是洩密者提到了G6X,這意味著NVIDIA不會轉向直到Ada Lovelace之後的新記憶體標準,並在我們看到更新的標準(例如 GDDR7)之前為其下一代卡使用更高的G6X 21 Gbps速度。該卡將配備24GB,因此我們可以期待看到單面16Gb DRAM或雙面8Gb DRAM。

NVIDIA Ada Lovelace GPU將為下一代 GeForce RTX 40顯示卡提供動力,這些顯示卡將與AMD採用RDNA3的Radeon RX 7000系列顯示卡正面競爭。關於 NVIDIA使用MCM仍有一些猜測。主要針對數據中心和人工智慧領域的Hopper GPU據稱即將推出 ,並將採用MCM架構。NVIDIA不會在其Ada Lovelace GPU 上使用MCM設計,因此他們將保留傳統的單DIE設計。

消息來源

您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-15 16:10 , Processed in 0.079195 second(s), 34 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表