當NVIDIA推出GeForce RTX 4000系列顯示卡作為GTC 2022 GeForce Beyond特別的重大宣佈時,DLSS 3在實現NVIDIA聲稱的前所未有的性能提升(2x-4x)方面發揮了重要作用。
製造商分享的幾乎所有測試都包括新的DLSS 3技術,少數沒有顯示出比GeForce RTX 3000系列更符合我們對新一代顯示卡的期望的性能改進。既然GeForce RTX 4090旗艦GPU(至少在不可避免的Ti型號之前),也是全新Ada Lovelace架構推出的第一款,已經在評測者手中有一段時間了,我們已經能夠驗證DLSS 3提升了多少性能。不過首先讓我們來看看後面的內容。
新的GeForce RTX顯示卡配備了第四代Tensor核心,其中包括一個新的8位元浮點 (FP8) Tensor引擎,在RTX 4090上將吞吐量提高了5倍,估計為1.32 Tensor-petaFLOPS。而自Turing架構以來Optical Flow Accelerator已在NVIDIA GPU中可用。不過正如之前應用深度學習研究副總裁Bryan Catanzaro所解釋的那樣新顯示卡配備了明顯更快、更先進的OFA版本,這就是為什麼DLSS 3目前是GeForce RTX 4000顯示卡的專屬。
打造的Frame於使用DLSS Super Resolution重建的Frame之間。因此NVIDIA聲稱在每兩Frame中,只有八分之一的顯示畫素被正常渲染,而其餘的則在Super Resolution和Frame生成之間進行了重建,從而大幅提高了FPS。為了解決因打造Frame生成導致的延遲增加,NVIDIA嵌入了降低延遲的Reflex技術,以確保能保持最佳狀態。
正如NVIDIA在介紹該技術時指出的那樣DLSS 3可以在Microsoft Flight Simulator等CPU密集型場景以及最先進的光線追踪遊戲中真正提升性能。
在已經以非常高的FPS執行的遊戲中進行測試時,與常見DLSS 2相比,它的提升更加有限(至少在使用品質預設時 - 性能和超級性能預設可能會擴大差距)。這主要是因為RTX 4090本身就是一頭野獸,即使在使用DLSS 2或本機渲染的情況下,它也比上一代的頂級顯示卡提供了顯著的性能提升。如果您曾經想以4K、144+FPS的速度玩遊戲並將所有設置調到最大,RTX 4090和DLSS 3可以輕鬆實現。
正如在Digital Foundry最初使用該技術時首先指出的那樣,Frame生成有時會引入偽影。但是在常見遊戲過程中很難注意到這些。Frame生成算法也有可能隨著時間的推移而改進以減少這些,就像NVIDIA對DLSS Super Resolution所做的那樣。
在新聞發布會上NVIDIA工程師曾暗示由於其Frame生成,DLSS 2和Reflex的組合而不是DLSS 3將獲得最低延遲。然而數據顯示DLSS 3在所有情況下都名列前茅,有時與DLSS 2 + Reflex相比存在顯著差異。但似乎 RTX 4000系列所有者可能沒有理由關閉Frame生成。
消息來源 |