近期《奇點灰燼(Ashes of the Singularity)》發表更新,宣布全面支援DirectX 12非同步運算(Asynchronous Compute)功能。這項重大更新不僅展現Radeon GPU運行DirectX 12遊戲的卓越速度,更反映AMD對非同步運算的獨家支援所釋放的優越效能。
非同步運算簡介
重要的遊戲特效如陰影、光線、人工智慧、物理模擬與透鏡等效果,往往需要多重階段的運算才能判斷場景中哪些物體是透過GPU的繪圖硬體進行著色。
以往這些步驟須循序進行,顯示卡自開始到結束會逐步依循API的著色程序著色出影像,初期階段的任何延遲將影響接續的運算。運算過程中出現的這些延遲稱為「空泡」,代表GPU內的某些硬體暫停並等候指令的短暫時刻。
DirectX 11線程的示意圖:繪圖、記憶體以及運算作業以循序模式安排進易產生延遲的作業過程。
空泡會發生在每張顯示卡作業時的任何階段,因此目前還沒有遊戲能完整發揮GPU的所有效能或硬體資源,以致在使用者突然決定於遊戲世界中做出不同動作時,沒有遊戲能完全避免空泡的產生。
Radeon GPU和競爭對手不同之處,在於其次世代繪圖核心架構(Graphics Core Next;GCN) 能夠移動遊戲引擎中的運算作業,以填補這些空泡。舉例來說,若運算複雜光線時出現著色線程空泡,Radeon GPU將透過人工智慧的行為運算作業以填補空泡。Radeon顯示卡不必遵循過去產品或競爭對手的逐步循序流程,能同時進行多項運算,讓運算流程永不間斷。
DirectX 12非同步運算示意圖:繪圖、記憶體以及運算作業可拆分成多個獨立且可同步執行的作業佇列。
填補這些空泡能為使用者改進GPU使用率、輸入延遲、效率與效能,將延遲的擴散效應減至最小或完全消除,避免拖慢其他顯示卡運作。目前僅有Radeon繪圖卡能支援DirectX 12與虛擬實境(Virtual Reality;VR)的這項關鍵功能。
《奇點灰燼》:非同步運算實際比較
由測得分數註1可見,Radeon R9 Fury X GPU的表現遠勝其他對手,為支援DirectX 12且速度最快的GPU。此外,GCN架構於DirectX 12遊戲中發揮強悍性能,400美元的Radeon R9 390X GPU與650美元的GeForce GTX 980 Ti GPU皆獲得相近分數註2。從低中階產品測試結果可見,Radeon GPU不僅勝過同級對手,甚至打敗競爭對手更高價位的產品。
除了我們的實測結果,Tom’s Hardware網站最新THG分析報告公布DirectX 12非同步運算的效能報告,獨立檢測的結果反映Radeon繪圖硬體擁有絕對的效能優勢。
報告作者Igor Wallossek寫道,AMD是當前顯示卡的絕對贏家。實際的平行運算與非同步作業,其效率勝過透過軟體解決方案拆分運算作業的模式。
THG分析報告揭露其他有趣的資料:
- Radeon R9 Fury X在4K解析度的DirectX 12非同步運算作業上,速度加快12%。GeForce 980 Ti在處理這類強大的DirectX 12功能時,速度則慢了5.6%。
- 在運用Radeon R9 Fury X GPU處理DirectX 12作業時,CPU的處理負荷平均比GeForce 980 Ti減少13%。
- Radeon R9 Fury X GPU在分擔CPU處理負荷的效率比GeForce 980 Ti高出98%,故能消弭許多CPU效能瓶頸。例如在1440p解析度下,THG發現Fury X等候處理器的時間比例僅有1.6%,反觀980 Ti則有82.1%的時間都在等候處理器。
在非同步運算方面,Wallossek在結論中表示,如此亮眼的測量數據引人深思,令人好奇PC遊戲在不久未來的面貌。我們確定的是AMD在這回合獲得全勝,AMD研發團隊在產品中融入的功能,直到現在外界尚未真正關注,但日後必定是眾人的焦點。
註1:AMD內部測試。受測系統組態:Core i7-5960X處理器;技嘉X99-UD4主機板;16GB DDR4-2666記憶體。Radeon軟體版本15.301.160205a;NVIDIA 361.75 WHQL版驅動程式;Windows 10作業系統64位元。
註2:根據2016年2月29日Newegg.com網站刊載的美元價格。閏二月快樂!
|