在ATI Radeon HD 3800系列發佈7個多月以來,競爭對手NVIDIA發售了數量眾多的產品,其中GeForce 8800GT顯卡就取得了在4個月內銷售了200萬片的驕傲成績,而AMD只是利用RV670核心衍生的產品在中低階市場自尋樂趣。經過大半年之後,採用RV770圖形核心的Radeon HD 4800系列顯卡接連上場,是否會帶來讓人眼前一亮的表現呢?
為了能夠第一時間為讀者揭開這個疑問,我們分別在14日和21日趕赴香港直接購買測試所需的Radeon HD 4850/4870顯卡。值得強調的是,在你看到這篇測試報告的同時,Radeon HD 4870依然未發佈。
◆
RV770基本規格解析
RV770是首款浮點運算能力超過1TeraFLOPs的GPU
ATI Radeon HD 4800系列的GPU核心代號為RV770,根據規格的高低,又分為Radeon HD 4870(RV770XT)和Radeon HD 4850(RV770Pro)兩個型號,這一點承襲了上一代Radeon HD3000系列的命名方式。
和前代產品RV670相比,RV770圖形核心最顯著的變化就是流處理器數量從過去的320個激增至800個,達到2.5倍,紋理過濾單元也從16個增加到40個,但是電晶體數目和相應的核心面積只增加了40%,總數為9.65億個。在RV770上,AMD對矽面積規劃作了進一步的優化,以達到更好的每平方毫米性能。
AMD很自豪的拿出這樣一組數字:與競爭對手NVIDIA最新發佈的GeForce GTX200圖形核心相比,採用55nm制程的RV770核心面積只有260平方毫米,後者卻達到了576平方毫米,在功耗上,RV770最多只有160W,而GTX200要高出很多,達到了236W,在越來越注重每瓦特性能每平方毫米性能的今天,AMD認為RV770比對手更有優勢。
為了進一步控制顯卡的功耗,AMD在RV770上還采了第二代PowerPlay技術 (針對桌面PC)。第二代PowerPlay技術能根據需求自動調節電能,在跑3D程式時核心/顯存頻率會達到最高,在2D/待機時頻率會下降,AMD通過對電壓和頻率的節流控制,實現最高效率帶來最高性能的目的。
新一代的節能技術擁有Self-Aware圖形引擎,能夠自動關閉未使用的單元,還具有高級頻率節能和電壓調整能力,非常重要的一點是,開始引入了顯存頻率的自動縮放,而在上一代的PowerPlay中,只能實現對核心頻率的調整。
另一方面,由於擁有800個流處理器,RV770圖形核心的浮點處理能力超過1TeraFLOPs,這也是歷史上首個計算能力超過1TFLOPs的GPU,其中Radeon HD 4850顯卡的浮點處理能力為1TeraFLOPs (核心頻率625MHz*流處理器數量800*2=1000000)、4870顯卡的浮點處理能力為1.2TeraFLOPs (750*800*2=1200000)。這也是為什麼AMD在Radeon HD 4800預熱網站上以“Unleash one tera”作為廣告語的主要原因。
RV770的架構作了很大改進,增強或優化了部分單元的能力,主要包括有:
· 800個高度優化的流處理器
· 重新設計的SIMD核心
· 優化過的紋理單位及紋理寄存器
· 優化過的後端渲染
· 增強的tessellator可編程鑲嵌單元性能
· 首次採用GDDR5顯存
我們下文將逐一為你解釋一下RV770的架構以及將對效能造成的影響。
◆首款採用GDDR5的顯卡
隨著遊戲的越發“變態”,顯卡GPU對顯存帶寬也變得更加渴求,目前主流的GDDR3顯存對帶寬的貢獻已達到極限,GDDR4卻難堪大任,GDDR4頻率提升有限,但成本和功耗高,顯存延遲問題明顯,與同頻率的GDDR3相比性能不升反降,最終AMD將目標鎖定在GDDR5上,Radeon HD 4870成為歷史上首款採用GDDR5顯存的顯卡,出於成本的考慮,Radeon HD 4850採用的還是GDDR3顯存。
256bit位寬下GDDR5的帶寬突破100GB/s
|
GDDR5顯存的時鐘頻率目前可以達到2.5GHz以上,資料傳輸頻率超過5GHz,因此在主流的256bit顯存位寬下帶寬率先突破100GB/s,如Radeon HD 4870的顯存頻率為1.8GHz,顯存帶寬為115GB/s,如果顯存頻率達到2.5GHz,帶寬將能達到160GB/s,這樣的帶寬是上一代GDDR3顯存能達到帶寬的三倍。
除了能滿足GPU對帶寬的渴求外,GDDR5的功耗比GDDR4更低,其電壓為1.5V,並使用了65nm或55nm的製造工藝,FBGA 170封裝方式,大大減小了晶片體積,晶片密度也可以做到更高,為此進一步降低了顯存晶片的發熱量。
GDDR5在技術上的革新包括“Data eye optimization”、“Adaptive interface timing”和“Error compensation”,“Data eye optimization”支援時間延遲調整,允許自行設定延遲,還能對介面驅動、工作電壓等進行優化和調節,不僅可以提升顯卡性能,也讓顯卡PCB板和電路設計更加穩定;“Adaptive interface timeing”可以根據系統的實際需要,自動調節顯存可縮放的位元組,可以讓資料傳輸更加高效,同時還具有節能的效果,確保顯卡的穩定運行;“Error compensation”能檢測顯存在讀取和寫入資料的錯誤,實現同步檢測並修正。
像奇夢達、三星等記憶體廠家已開始投產GDDR5,目前產量還很小,成本較高,在未來的幾年內,GDDR5將會統領主流市場。
Radeon HD 4870顯卡採用雙槽散熱器,PCB長度達到24cm,比GTX200的26.7cm要短不少
輸出介面和4850一樣,雙DVI和S-Video輸出
Radeon HD 4870顯卡的背面
與4850顯卡不一樣,Radeon HD 4870顯卡需要兩個6-pin外接供電
可以看到,4870顯卡PCB與4850的完全不同,供電部分用料明顯更高級
Radeon HD 4870採用Qimonda的GDDR5顆粒
在Radeon HD 4870上,首次採用了GDDR5顯存,這也是GDDR5顯存正式應用在顯卡上面,採用的是Qimonda的產品,規格為16MX32bit,一共8顆組成512MB/256bit的顯存容量/位元寬。顆粒型號為IDGV51-05A1F1C-40X,其中GV表示為GDDR5,-40X表示每引腳資料傳輸帶寬為4.0GB/s,因此每顆顯存最高可以達到16GB/s的帶寬,8顆顯存帶寬最多可以達到128GB/s,而Radeon HD 4870的帶寬為115GB/s。Qimonda還有更高端的GDDR5產品,-45X/-50X型號的,可以讓顯存帶寬提升到一個新的高度。
HD-4870 性能測試~~ 回覆後可看 |