找回密碼註冊
作者: sxs112.tw
查看: 5839
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

打印 上一主題 下一主題

[顯示卡器] AMD和NVIDIA下一代旗艦GPU詳解:15360核的Radeon RX 7900 XT和18432核的GeForce RTX 4090

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2021-11-12 19:05:08 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
下一代由AMD RDNA3驅動的Radeon RX 7900 XT和NVIDIA Ada Lovelace驅動的GeForce RTX 4090顯示卡的傳聞規格再次被詳細說明。謠言來自Greymon55,他一直在他的Twitter積極發布有關即將推出的硬體(例如CPU和GPU的詳細訊息。
AMD-NVIDIA-GPU-Prices-2021.png

AMD RDNA3驅動的Navi 31和Ada Lovelace驅動的AD102 GPU有望帶來巨大的性能提升,也將成為有史以來最耗電的晶片。雖然NVIDIA的目標是透過其Ada Lovelace架構採用單一晶片方法,但AMD將利用完整的MCM設計,該設計在推出CDNA2驅動的MI200系列Aldebaran時已處於領先地位。AMD現在將為消費端和遊戲GPU使用相同的MCM技術。

AMD Navi 31 GPU是旗艦RDNA3晶片,將為下一代Radeon RX 7900 XT顯示卡提供動力。聽說AMD將在其下一代RDNA3 GPU上放棄CU(計算單元)改以支援WGP(工作組處理器)。由於Navi 31是MCM GPU,它將擁有兩個關鍵IP,一個採用台積電5nm製程的GCD(顯示核心晶片)和一個採用台積電6nm製程的MCD(多快取晶片)。早前有傳言稱AMD已經開發出了其Navi 31 GPU。
AMD-Radeon-GPU-_9.png

此處的Navi 31 GPU配置具有兩個GCD(顯示核心晶片)和一個 MCD(多快取晶片)。每個GCD有3個著色器引擎(總共6個),每個著色器引擎有2個著色器陣列(每個SE2個/每個GCD 6個/總共12個)。每個著色器陣列由5個WGP(每個SE 10個/每個GCD 30個/總共60個)組成,每個WGP有8個SIMD32單元和32個ALU(每個SA 40個SIMD32/每個SE 80個/每個GCD 240個/總共480個)。這些SIMD32單元組合起來構成每個GCD 7,680個核心和總共15,360個核心。

在性能方面GPU預計將有2.4 - 2.5 GHz的速度,這使其理論性能約為75 TFLOPs (FP32)。與Radeon RX 6900 XT顯示卡相比,這是驚人的226%改進。

Navi 31 (RDNA 3) MCD將透過下一代Infinity Fabric互連連接到雙GCD,並有256-512 MB的Infinity Cache。每個GPU還有4個記憶體連接(32位元)。對應256位元記憶體匯流排,總共有8個32位元記憶體控制器。據稱該卡將配備高達32GB的GDDR6,以18Gbps的速度執行,並提供高達576GB/s的頻寬。最近出現的另一個傳言表明AMD將在其RDNA3產品線中使用3D Infinity Cache技術,該技術將在GPU上的垂直堆棧中整合新快取,類似於Vermeer-X將L3快取堆疊在CCD上的方式。



根據之前的傳言稱NVIDIA將在其Ada Lovelace GPU上使用台積電的N5 (5nm)製程。這也包括AD102 SKU,它將是一個完全單DIE設計。在他關於特定GPU配置的最新推文中,據說AD102 GPU的速度高達2.5GHz(平均提升2.3GHz)。
NVIDIA-GeForce-RTX-3090-Graphics-Card-1.jpg

NVIDIA AD102“ADA GPU”似乎有18432個CUDA核心,初步規格(可以更改)將安裝在144個SM單元內。這幾乎是Ampere中核心的兩倍,而Ampere已經是 Turing 的一大進步。2.3-2.5 GHz的速度將為我們提供高達85到92 TFLOP的計算性能 (FP32)。這是現有RTX 3090 FP32性能的兩倍多,後者包含36 TFLOP的FP32計算能力。

150%的性能提升看起來很大,但記住NVIDIA在這一代的 FP32 數量上已經有了Ampere的大幅提升。Ampere GA102 GPU (RTX 3090) 提供36 TFLOPs,而 Turing TU102 GPU (RTX 2080 Ti) 提供13TFLOPs。這比FP32 Flops提高了 150% 以上,但RTX 3090的實際遊戲性能提高平均只比RTX 2080 Ti快50-60%。所以我們不應該忘記的一件事是,如今的Flop並不等於GPU遊戲性能。此外我們不知道2.3-2.5 GHz是平均提升還是峰值提升,前者意味著AD102可能有更高的計算潛力。

除此之外洩密者還表示NVIDIA GeForce RTX 40旗艦將保留384位元記憶體匯流排,類似於RTX 3090。有趣的是洩密者提到了G6X,這意味著NVIDIA不會轉向直到Ada Lovelace之後的新記憶體標準,並在我們看到更新的標準(例如 GDDR7)之前為其下一代卡使用更高的G6X 21 Gbps速度。該卡將配備24GB,因此我們可以期待看到單面16Gb DRAM或雙面8Gb DRAM。

NVIDIA Ada Lovelace GPU將為下一代 GeForce RTX 40顯示卡提供動力,這些顯示卡將與AMD採用RDNA3的Radeon RX 7000系列顯示卡正面競爭。關於 NVIDIA使用MCM仍有一些猜測。主要針對數據中心和人工智慧領域的Hopper GPU據稱即將推出 ,並將採用MCM架構。NVIDIA不會在其Ada Lovelace GPU 上使用MCM設計,因此他們將保留傳統的單DIE設計。

消息來源

您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-15 18:18 , Processed in 0.079811 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表