找回密碼註冊
作者: XF-News
查看: 8339
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

打印 上一主題 下一主題

[顯示卡/器] AMD Radeon GPU於DirectX 12遊戲中發揮非同步運算卓越效能

[複製鏈接]| 回復
跳轉到指定樓層
1#
XF-News 發表於 2016-3-9 18:39:10 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
近期《奇點灰燼(Ashes of the Singularity)》發表更新,宣布全面支援DirectX 12非同步運算(Asynchronous Compute)功能。這項重大更新不僅展現Radeon GPU運行DirectX 12遊戲的卓越速度,更反映AMD對非同步運算的獨家支援所釋放的優越效能。

image4-500.jpg


非同步運算簡介
重要的遊戲特效如陰影、光線、人工智慧、物理模擬與透鏡等效果,往往需要多重階段的運算才能判斷場景中哪些物體是透過GPU的繪圖硬體進行著色。

以往這些步驟須循序進行,顯示卡自開始到結束會逐步依循API的著色程序著色出影像,初期階段的任何延遲將影響接續的運算。運算過程中出現的這些延遲稱為「空泡」,代表GPU內的某些硬體暫停並等候指令的短暫時刻。

image1.png

DirectX 11線程的示意圖:繪圖、記憶體以及運算作業以循序模式安排進易產生延遲的作業過程。

空泡會發生在每張顯示卡作業時的任何階段,因此目前還沒有遊戲能完整發揮GPU的所有效能或硬體資源,以致在使用者突然決定於遊戲世界中做出不同動作時,沒有遊戲能完全避免空泡的產生。

Radeon GPU和競爭對手不同之處,在於其次世代繪圖核心架構(Graphics Core Next;GCN) 能夠移動遊戲引擎中的運算作業,以填補這些空泡。舉例來說,若運算複雜光線時出現著色線程空泡,Radeon GPU將透過人工智慧的行為運算作業以填補空泡。Radeon顯示卡不必遵循過去產品或競爭對手的逐步循序流程,能同時進行多項運算,讓運算流程永不間斷。

image2.png

DirectX 12非同步運算示意圖:繪圖、記憶體以及運算作業可拆分成多個獨立且可同步執行的作業佇列。

填補這些空泡能為使用者改進GPU使用率、輸入延遲、效率與效能,將延遲的擴散效應減至最小或完全消除,避免拖慢其他顯示卡運作。目前僅有Radeon繪圖卡能支援DirectX 12與虛擬實境(Virtual Reality;VR)的這項關鍵功能。

《奇點灰燼》:非同步運算實際比較
image3.png


由測得分數註1可見,Radeon R9 Fury X GPU的表現遠勝其他對手,為支援DirectX 12且速度最快的GPU。此外,GCN架構於DirectX 12遊戲中發揮強悍性能,400美元的Radeon R9 390X GPU與650美元的GeForce GTX 980 Ti GPU皆獲得相近分數註2。從低中階產品測試結果可見,Radeon GPU不僅勝過同級對手,甚至打敗競爭對手更高價位的產品。

除了我們的實測結果,Tom’s Hardware網站最新THG分析報告公布DirectX 12非同步運算的效能報告,獨立檢測的結果反映Radeon繪圖硬體擁有絕對的效能優勢。

報告作者Igor Wallossek寫道,AMD是當前顯示卡的絕對贏家。實際的平行運算與非同步作業,其效率勝過透過軟體解決方案拆分運算作業的模式。

THG分析報告揭露其他有趣的資料:
  • Radeon R9 Fury X在4K解析度的DirectX 12非同步運算作業上,速度加快12%。GeForce 980 Ti在處理這類強大的DirectX 12功能時,速度則慢了5.6%。
  • 在運用Radeon R9 Fury X GPU處理DirectX 12作業時,CPU的處理負荷平均比GeForce 980 Ti減少13%。
  • Radeon R9 Fury X GPU在分擔CPU處理負荷的效率比GeForce 980 Ti高出98%,故能消弭許多CPU效能瓶頸。例如在1440p解析度下,THG發現Fury X等候處理器的時間比例僅有1.6%,反觀980 Ti則有82.1%的時間都在等候處理器。

在非同步運算方面,Wallossek在結論中表示,如此亮眼的測量數據引人深思,令人好奇PC遊戲在不久未來的面貌。我們確定的是AMD在這回合獲得全勝,AMD研發團隊在產品中融入的功能,直到現在外界尚未真正關注,但日後必定是眾人的焦點。



註1:AMD內部測試。受測系統組態:Core i7-5960X處理器;技嘉X99-UD4主機板;16GB DDR4-2666記憶體。Radeon軟體版本15.301.160205a;NVIDIA 361.75 WHQL版驅動程式;Windows 10作業系統64位元。
註2:根據2016年2月29日Newegg.com網站刊載的美元價格。閏二月快樂!

您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-27 13:48 , Processed in 0.113175 second(s), 64 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表