NVIDIA GeForce RTX 4090是下一代BFGPU,提供驚天動地的性能,將游戲提升到一個新的水平。GeForce RTX 4090不僅僅是一款GPU,它還是NVIDIA的旗艦產品,其性能比上一代產品提升了四倍。
NVIDIA的GeForce RTX 4090期待已久,現在終於來了。該顯示卡專為希望獲得最佳視覺的發燒友和遊戲玩家而設計,考慮到下一代AAA遊戲的要求,您需要強大的GPU來實現這一目標。NVIDIA並沒有推動其下一個晶片比上一代快百分之幾或50%,而是使用DLSS快4倍,在原始解析度下快2倍,以確保他們的顯示卡不只是準備好了適用於即將推出的遊戲,也適用於增強功能,例如光線追踪等。
NVIDIA GeForce RTX 4090顯示卡的核心是Ada Lovelace AD102 GPU。據說GPU的尺寸約為600mm2,將採用台積電4N製程,這是台積電為NVIDIA設計的 5nm (N5)製程的優化版本。GPU擁有一個瘋狂的760億個電晶體管。
NVIDIA Ada Lovelace AD103 GPU預計將配備多達7個GPC(圖形處理集群)。這與Ampere GA102 GPU的GPC數量相同,並且比GA103 GPU增加了一個 GPC。每個GPU將由6個TPC和2個SM組成,與現有晶片的配置相同。每個SM(串流多處理器)將容納四個子核心,這也與GA102 GPU相同。改變的是FP32和INT32核心配置。每個子核心將包括128個FP32單元,但組合的FP32+INT32單元將達到192個。這是因為FP32單元與IN32單元不共享相同的子核心。128個FP32 核心與64個INT32核心是分開的。
所以總括來說,每個子核心將由32個FP32加上16個INT32單元組成,總共48個單元。每個SM將總共有128個FP32單元加上64個INT32單元,總共192個單元。由於共有84個SM單元(每個GPC 12個),我們正在查看到有12,288個FP32單元和6,144個INT32單元,總共18,432個核心。每個SM還將包括兩個Wrap Schedules(32線程/CLK),每個SM有64個wrap。與GA102 GPU相比,核心 (FP32+INT32) 增加了50%,Wraps/Threads增加了33%。
看到快取,這是NVIDIA對現有Ampere GPU的另一個重大推動。Ada Lovelace GPU將為每個SM打包192KB的L1,比Ampere增加50%。在頂級AD102 GPU上總共有4.5MB的L1。如洩漏中所述L2將增加到96MB。這比僅有6MB L2的Ampere GPU增加了16倍。快取將在GPU之間共享。
最後每個GPC的ROP也增加到 32 個,比Ampere增加了2倍。您在下一代旗艦產品上看到的ROP高達384,而在最快的Ampere GPU RTX 3090 Ti上僅為112。Ada Lovelace GPU上還將注入最新的第4代Tensor和第3代RT(光線追蹤)核心,這將有助於將DLSS和光線追蹤性能提升到一個新的水平。總體而言Ada Lovelace AD102 GPU將提供:
- 2x GPC(與Ampere相比)
- 增加50%的核心(相對於Ampere)
- 多出50%的L1快取(與Ampere相比)
- 16倍以上的L2快取(與Ampere相比)
- 將ROP翻倍(與Ampere相比)
- 第4代Tensor和第3代RT核心
NVIDIA GeForce RTX 4090將使用144個SM中的128個 SM,總共16,384個CUDA核心。GPU將配備96MB的L2和總共384個ROP,但考慮到RTX 4090是精簡設計,它的L2和ROP數可能會略低一些。速度尚未確定,但考慮到正在使用TSMC 4N製程,預計時脈在2.0-3.0GHz內。
至於記憶體,GeForce RTX 4090將擁有24GB GDDR6X,透過384位元記憶體匯流排以21Gbps的速度執行。這將提供高達1TB/s的頻寬。這與現有的RTX 3090 Ti顯示卡的頻寬相同,就功耗而言據說TBP的額定功率為450W,這意味著TGP最終可能會低於此值。該卡將由一個16針連接器供電,可提供高達600W的功率。正如在RTX 3090 Ti中看到的那樣,我們很可能會獲得500W+的非公版設計。
現在談到價格,NVIDIA GeForce RTX 4090 Founders Edition版本的售價為1599美元,將於10月12日上市。
消息來源 |