在CES 2025上Digital Foundry採訪了應用深度學習研究副總裁Bryan Catanzaro,了解NVIDIA DLSS4的發布及其對超解析度、光線重建和Frame Generation的許多改進。
Catanzaro談到了新的Transformer模型正在取代CNN(卷積神經網路)以實現超級解析度和光線重建。它們更加智慧,並可以在更大的資料集上進行訓練,從而做出更好的選擇,從而改善了NVIDIA DLSS的缺陷,例如閃爍或重影。例如新的超級解析度模型的計算量是前一模型的四倍。 Catanzaro沒有估計渲染時間會增加多少,但他確實表示NVIDIA相信這是在本月稍後推出的採用Blackwell技術的全新GeForce RTX 50顯示卡上進行遊戲的最佳方式。
Frame Generation也正在進行徹底修改,放棄了先前採用光流硬體加速器的模型,轉而採用完全由人工智慧驅動的解決方案。以下是NVIDIA這樣做的原因:
當我們建立NVIDIA DLSS3 Frame Generation時,我們絕對需要硬體加速來計算光流。我們沒有足夠的Tensor核心,也沒有足夠好的光流演算法。我們尚未開發出在Tensor Core上運行且適合我們的計算預算的即時光流演算法。我們擁有光流加速器,NVIDIA多年來一直在建立該加速器,作為我們視訊編碼器技術的演進,它也是我們自動駕駛汽車電腦視覺加速的一部分。
我們將其用於NVIDIA DLSS 3 Frame Generation是有意義的。但是像光流這樣的演算法的任何硬體實現的困難之處在於它真的很難改進。這就是硬體光流引起的問題,我們無法用更智慧的神經網路來消除它們,直到我們決定更換它並採用完全採用人工智慧的解決方案,所以這就是我們已經在DLSS4中完成了Frame Generation。
新的Frame Generation模型在Tensor Core上更重,但使用的VRAM更少,提供了更高的圖像品質(Catanzaro認為這一點至關重要,特別是對於新RTX 50 GPU 上提供的Multi Frame Generation) ,而且效率也更高,因為成本已在多個框架中攤提。
DF的Alex Battaglia當時詢問新模型是否可以移植到GeForce RTX 30系列等較舊的硬體上,NVIDIA DLSS的負責人並沒有關上這扇門。
我認為這主要是優化和工程的問題,然後是最終的用戶體驗。我們將在50系列中推出Frame Generation技術,這是最好的Multi Frame Generation技術,我們將看到未來我們能夠從舊硬體中擠出什麼。
提醒一下,當NVIDIA在GeForce RTX 40顯示卡上導入Frame Generation功能時,Catanzaro本人解釋說,該功能是當時新款GPU獨有的,因為它們的光流硬體加速器比RTX30系列有了很大改進。當時他也表示理論上可以將其移植到較舊的硬體上,儘管它可能不會那麼有益。
隨著新模型取消了光流硬體加速器,似乎實現這一目標的大門已經敞開。不過Catanzaro也表示Tensor Core要求更高,顯然較舊的GPU架構的Tensor Core性能較差。我們將看看NVIDIA能否真正實現這一目標。
在採訪的其他地方,Bryan Catanzaro強調了將更新的翻轉測光與CPU分離的重要性,以將FPS時間變化(從而提高FPS)比以前減少五到十倍。最後但並非最不重要的一點是他聲稱使用Reflex 2(也是採用人工智慧的)玩遊戲感覺更加有感覺,他相信特別是對延遲敏感的遊戲玩家會喜歡它。
消息來源 |