話說獨立顯卡兩陣營的年度對決戲碼,在綠軍推出GeForce GTX 590之後也沈寂一段時間對決兩方沒有新的高階產品了。這次紅軍在台積電28奈米製程的協助下,正式推出了內部代號「南方群島」的Radeon HD7000家族產品。
▲超微的「南方群島」產品線。
架構翻新
▲超微的顯示晶片架構演進圖。
這次超微推出的Radeon HD7000,顯示核心改採用非VLIW的GCN(Graphics Core Next)架構,除了在圖形處理能力精進之外,還針對通用計算最佳化。GCN為採SIMD陣列的MIMD架構。 HD 7970內有32個整合純量與向量之Compute Unit (簡稱CU)的運算單元,而CU內包含了有指令擷取仲裁 (Instruction Fetch Arbitration)、控制與解碼(Control and Decode)、相對應的快取記憶體,及重要的純量運算單元(Scalar Unit)和向量運算單元(Vector Unit)。
▲對超微而言,全新的GCN架構倚天劍,終於面市!
向量運算單元內由16個ALU所組成一個SIMD陣列,而該單元內總共有4組SIMD陣列。也就是說每個CU包含64個算術邏輯單元 (Arithmetic Logic Unit;ALU,等同於串流處理器)。32乘以64,即得到2,048個串流處理器這個規格數據。在串流處理器的部分,這回新架構設計上相對於圖形引擎的變動更是劇烈。由於以往的5D/4D架構流處理器,執行效率不夠高,故AMD這次放棄了以往的VLIW架構,改用稱為GCN的新架構。一個GCN陣列包含64個串流處理器,以16個串流處理器為一純量運算器。以往產品所採用之5D/4D架構係針對指令最佳化,每個串流處理器可同一時間處理一個5D/4D指令,但有機會造成ALU閒置。而新的GCN架構是針對執行緒而最佳化,每一個GCN陣列可以支援4個執行緒。只要一直有資料輸入,就不會造成ALU閒置。這與綠軍的處理方式相似,將所有資料都拆解為1D資料。
CU內的4組SIMD在每周期內可執行4個執行緒,具備MIMD的特性。而根據官方所公布的資料圖片,GCN的SIMD陣列存在向量運算單元內,並非整個CU都是SIMD架構。另外,CU內還有1個純量運算單元。GCN的ALU只支援整數(Integer)運算,且純量暫存器(Scalar Registers)尺寸不大,只有4KB。這次超微卯起來幹,在架構上大幅更動,其差異在於執行方式。傳統VLIW雖然每周期可執行4次的操作,但說穿了還是單一條指令。而且這種架構要發揮最高效益,那會非常依賴指令最佳化。而至於GCN,雖每次只執行1個ALU操作,但4組SIMD可同時執行4條執行緒,可讓使用率接近滿載。如此觀之, GCN架構在理論上指令層面以及使用率層面,都會比以往更有效率。
CU內既有向量運算單元又有純量運算單元,如此一來會讓整個架構變得很複雜。每個CU有獨立16KB的L1快取,CU內每個向量運算單元有64KB的暫存器,每4個CU再共用16KB Instruction Cache(指令快取)和32KB Scalar Data Cache(純量資料快取)。而且比較以往AMD產品不同之處在於GCN的L1快取都是可讀寫操作,不再是只能讀取而已。至於768KB的L2快取則透過64bit介面與L1連接,所有L2都是同步並且可供所有CU存取。
GCN核心配備兩個幾何引擎。每一個幾何引擎包含曲面細分單元 (Tessellator)、幾何組譯器 (Geometry Assembler) 和頂點組譯器(Vertex Assembler) 各一個。另外新增了兩個非同步計算引擎 (Asynchronous Compute Engine),用來分配任務給流處理器,增強顯示核心的亂序執行能力(即便說顯示核心本質上依舊是順序執行),提高幾何和通用計算的性能。從光柵器和曲面細分單元的數量來看,依然不如對手。所以AMD特別把開發重點放在相關單元的執行效率提升上。
GCN設計的著眼點在於重視資料同步,所有資料都是CU共享。甚至還能跟系統記憶體同步,提高了處理器與顯示核心的交換能力,完全反映了AMD這種既有CPU又有GPU的廠商。長遠來看,是替該公司的融合(Fusion)在鋪梗!
更值得一提的,這次GCN支援X86虛擬記憶體(X86 Virtual Memory)功能。簡而言之就是將顯卡上GDDR5記憶體,虛擬為處理器可識別的系統記憶體。以現在高階娛樂用顯卡所搭載的高速GDDR5記憶體頻寬(Memery Bandwidth)動不動就是200GB/s以上來說,一般四通道DDR3頻寬,即便是高速的超頻版本式樣,最高也僅僅約50GB/s,遠超過現在X79四通道DDR3的頻寬數以倍計。超微的算盤在試圖透過虛擬記憶體,對複雜的GPGPU運算以及部分3D遊戲來提升處理效能。
前面所述都是廠商在性能提升所採取的手段,在節能減碳救地球已成為當代顯學的今日,GCN架構透過ZeroCore Power技術,顯示核心在待機時,官方號稱功耗小於3W。
Radeon HD 7000在規格上相當領先,是量產消費性顯示卡核心中第一個支援PCI-Express 3.0和Direct X 11.1者。不過回頭看自家的晶片組,不管是990FX還是即將登場的1090FX,都還看不到PCI-Express 3.0的影子。反倒是替英特爾(Intel)的旗艦產品X79/C600晶片組抬轎的意味多了些!另外,DirectX 11.1,更是要到今年Q3才上市的Windows 8才會正式與消費大眾接觸。所以這兩項功能的支援,在目前這個時間點,技術宣示意味比實際應用面上的意義大多了。
▲多螢幕獨立音源,這招夠屌!!
此外,新一代核心終於支援了DDM Audio。以往的顯示核心只支援一個音頻資料流輸出。Radeon HD 7000則支援多個。HD 7900系列可多點獨立音效輸出(Discrete Digital Multi-Point Audio),當電腦用Eyefinity玩三螢幕輸出時,若一個看影片、一個聽音樂、一個編輯影片,三個螢幕都有聲音的話,透過HDMI或DisplayPort的輸出,每個螢幕都可以有自己的獨立音源,不會像以前一樣混在一起大鍋炒,這是HD 7900系列的一大必殺技。
▲Radeon 7900系列支援多樣的先進顯示技術。
Eyefinity多螢幕輸出技術進化至2.0版,不同尺寸的顯示器都可以組成一個Eyefinity群組,Eyefinity技術可配合HD3D技術顯示3D立體影像(需搭配3D眼鏡)。HD3D需要一個支援120Hz更新率的顯示裝置,配合DisplayPort或者HDMI 1.4a輸出。HD7900系列在輸出方面,實體上配置的介面有DVI、HDMI(支援1.4版)、Mini-DisplayPort兩個(支援1.2版)。支援輸出到最多達五顆螢幕,若採水平擺放模式,則解析度可以上達16000 x 1080,這樣的表現,除了爽還是只有爽,玩遊戲的時候保證讓使用者笑開懷,還支援自定義解析度。
▲超微HD3D支援的螢幕機種排排站......
介紹完了HD7900的架構和特色之後,接下來就是看兩張顯卡的性能表現了。
效能測試
依照往例,我們還是會採用3DMark來進行測試,3DMark Vantage在3D子系統性能測試中,可以得到顯示卡DirectX10方面的相對整體效能,所以也是個人愛用的測試工具。3DMark Vantage所使用的引擎在DX10特效方面的資源吃得頗重,由於3DMark不是遊戲,所以可以不用考慮場景流暢度,得以用力的搾乾顯示卡DX10的每滴血汗。不過,在物理特效引擎綁標綠色陣營的PhysX而讓紅軍迷和部分的玩家頗有微詞,直言這樣對測試公平性上是開了倒車。
3DMark11的測試重點是升級為DX11 API進行遊戲的效能測試,通過數個不同測試項目得到一個綜合評分,藉此評判一套系統的3D相關子系統的性能水準。
利用3DMark 11對DirectX 11的原生支援性,現今許多的媒體在顯卡的效能測試上都常看到這款FutureMark產品的身影。該測試軟體全面使用DX11 API的大量新特性,包括計算著色器(Compute Shader)、Direct 2D、多執行緒渲染(Multithreaded Rendering)與鑲嵌圖形(Tessellation)等功能。3DMark 11採用全新測試場景:總計六個測試場景,包括四個圖形測試(嚴格來說是兩個場景)、一個物理引擎測試、一個綜合測試,加以評估GPU以及CPU的性能。另外3DMark11拋棄了PhysX,改用Bullet物理引擎,不再採用封閉的綠軍 PhysX而改用開放來源的Bullet物理引擎資料庫,對紅軍而言可說是遲來的公平。別忘了,3DMark Vantage時代過度往綠軍傾斜採用PhysX的作風也曾遭到部分專業人士的抨擊。
Unigine Engine在《天堂》這個效能測試軟體中大量運用了DX11新增的技術和指令,在鑲嵌圖形技術的應用上要求算是很高的。《熱帶》這個同樣可測DX11的效能測試部分,筆者也將之納入比較。
《浩劫殺陣:晴空染血》(S.T.A.L.K.E.R: Clear Sky)是《浩劫殺陣:車諾比之影》的首部獨立資料片,被視為是原作的前傳。此遊戲乃根據X-Ray 1.5版引擎來開發,首次在浩劫殺陣系列支援DirectX 10,並於1.5.06的核心版本加入了DirectX 10.1特效,讓支援DirectX 10.1顯示卡可以好好舒活筋骨。此遊戲是由著名烏克蘭遊戲開發商GSC Game World負責製作開發。《浩劫殺陣:混沌召喚》(S.T.A.L.K.E.R.: Call of Pripyat)則是第二部獨立資料片,故事發生時間是原作之後。本款遊戲採X-Ray 1.6引擎發展,並首次在浩劫殺陣系列支援DirectX 11特效。
《異型戰場》支援了DX11裏的鑲嵌圖形(Tessellation)、高解析環境光遮蔽(High Definition Ambient Occlusion ; HDAO)以及計算著色器後期處理等技術,本作充滿了暴力血腥場面,因為遊戲要維持電影以來的故事走向。不過在鑲嵌圖形的要求度上,明顯低於Unigine《天堂》的極限模式。
《失落的星球2》使用了CAPCOM公司原創繪圖引擎MT Framework 2.0版進行開發,遊戲內的虛擬世界的繪製的更加精細與美麗。非僅僅是畫面的進化,本作也利用了前作玩家回饋的要求為根基追加全新要素,包括了新的場景、角色、和武器等等。《失落的星球2》自第一代起就和綠軍有一腿,紅軍的顯示卡在這部分一直都相對是吃虧的一方。在此可以看到娛樂用卡跟專業繪圖卡相同之處:不管你的硬體設計或者驅動程式技術上多先進,跟遊戲/應用程式軟體綁標才是王道!!
《戰慄深隧》是俄羅斯工作室4A Games開發的一款大作,該遊戲的核心引擎是號稱自主全新研發的4A Engine,支援當今幾乎所有DX11畫質技術,比如高解析度紋理(High Resolution Texture)、硬體曲面細分、形態反鋸齒(Morphological Anti Aliasing;MLAA)、螢幕環境光遮蔽(Screen Space Ambient Occlusion;SSAO)、次表面散射(Subsurface scattering;SSS)、視差貼圖(Parallax Mapping)、物體動態模糊(Object Motion Blur)等等。雖然本遊戲PhysX物理特效引擎,但對CPU軟體加速的支援能力也相當優秀,因此使用紅軍產品玩遊戲時並不會因此而效能不彰。明顯地對A卡迷而言,相較於一些過份「綠化」的遊戲好上太多。
《鷹擊長空》由Ubisoft推出,以軍事小說家湯姆克蘭西描述下之近現代國際衝突為背景,加上最新銳的航空作戰機種,讓玩家得嘗試以當代最頂尖的戰鬥/攻擊/轟炸用等飛機在廣大無垠的天空中飛行並執行任務。《鷹擊長空》直接內建對DX10和DX10.1的支援,該遊戲程式會自動偵測顯卡最高支援的等級。我們使用螢幕的原生解析度和最高的AA模式進行測試。
CAPCOM公司於1987年推出的大型電玩機臺格鬥遊戲《快打旋風》,堪稱目前格鬥類遊戲的始祖。PC 版的《快打旋風 4》是對戰格鬥遊戲《快打旋風》系列作品,以 Xbox 360 家用版內容為基礎所移植,並收錄了更新後加入的模式與功能。該遊戲的效能測試軟體是讓玩家測試自己個人電腦配備是否足以順暢執行遊戲的專用效能測試軟體,執行時會透過 3 組對戰示範與同時在畫面上描繪出 8 名角色的場景來取得畫面更新張數的資料,並將 PC 的執行效能劃分為 5 個等級,本測試軟體應用的特效以DX9為主。
同是CAPCOM推出的《惡靈古堡5》也有提供3D效能測試程式。我們也不免俗地提供了測試成績。
然後還有《太空戰士14》這款同樣以支援DX9這個老API的遊戲所推出的效能測試程式,我們也拿來賽豬公。
總而言之,HD7970擁有目前紅軍產品中最強悍的性能,也提供了相當完整的新技術支援。不論是DirectX 11的硬體支援還是Eyefinity多螢幕輸出。算得上相當優異的娛樂用3D顯示卡。可惜之處還是落在需要時間磨合的驅動程式撰寫身上,從後面的測試成績讀者可以窺見。當然了,把三種架構以上的驅動全部綁在一大包上,對兩家顯示晶片廠商而言是有點綁手綁腳,不過以使用者的方便性來說,這是無可厚非。目前藍寶7970這款產品台灣售價是新台幣18,990,而低一階的7950則是落在新台幣14,990。在競爭對手已經推出性價比不輸給7970的GTX680來看,接下來就要看AMD在市場端要用怎樣的價格切入。我們期待紅軍能有令人驚喜的價位表現,更期待綠軍用更具侵略性的競爭手段來打價格戰,當市場上性能及價位表現,如果是往一面倒,那對消費大眾的荷包就會不利。~Fin~
|