找回密碼註冊
作者: atarux
查看: 37519
回復: 8

文章標籤:

文章分享:

+ MORE精選文章:

相關帖子

+ MORE活動推薦:

極致效能優化 三星990 EVO 玩家體驗分享活

[*]進化日常效能 極致效能優化、電源效率提升、廣泛的通用 ...

FSP VITA GM White 玩家開箱體驗分享活動

中秋佳節,全漢加碼活動來囉~ [*]符合最新 Intel ® ATX 3.1電源設 ...

FV150 RGB 玩家開箱體驗分享活動

粉紅控趕快看過來.......廠商加碼活動來囉~ 心動了嗎? 想取得體驗 ...

海韻創新技術分享會 會後分享--得獎公告

頭獎:dwi0342 https://www.xfastest.com/thread-290899-1-1.html ...

打印 上一主題 下一主題

[AMD] 你滿了,那我就漫出來了!給你滿滿的AMD!!測試篇

[複製鏈接]| 回復
跳轉到指定樓層
1#
atarux 發表於 2011-11-15 02:31:46 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
1321295716A9dl9QLqiVIT44Qa.gif

▲Bulldozer版本AMD Opteron的新商標。
▲32核心和32GB記憶體的魄力!!
還記得在2003年的時候,AMD以K8架構的處理器終於首次有能力去讓強大的對手Intel不得不正視其存在。當時的AMD以處理器內建記憶體控制器、支援64位元指令集以及相對傑出的效能,讓採用NetBurst微架構的Intel受到某種程度的壓力。如今,8年過去了,當Intel從超高時脈和超多層級管線的幻夢中醒來,打造出包含Core、Nehalem和Sandy Bridge等微架構既兼顧了IPC (instructions per clock)效能且擁有可觀的整體運算能量處理器時,AMD還在用以K8微架構延伸出的K10家族苦撐。筆者記憶所及,約在兩三年前參加Computex Taipei時,在會場遇到友人:神達泰安( MiTAC-Tyan)的一位FAE。在聊天之中我對他說:「AMD的處理器要翻身只能看Bulldozer微架構的表現,如果還是不行,那AMD以後要繼續走x86處理器的這條路會非常辛苦!」由此可見AMD在處理器這塊領域自從K8展示曇花一現的崛起(到2006年Intel推出Core微架構的產品後就一路走跌)之後被對手的強大製程和新架構研發能量壓制了多久。
終於,在2011年的後半,AMD總算把Bulldozer微架構的處理器給生了出來。
此回AMD的新微架構建構單元稱之為模塊。一個模塊具備的實體電路和複雜度是妥協後的產物:介於「各個核心為完全獨立的雙核處理器實體」和「具同時雙執行緒能力,而每個執行緒共享大部分的硬體資源之單處理器核心」中間。
▲Bulldozer相對於競爭對手在架構上的差異示意圖。
基本的模塊是一個30.9 mm²晶片面積,由2.13億電晶體組成,其中擁有兩組整數運算的排程器,一個由兩組128位元FMAC所構成,具備彈性化可合併為256位元的浮點運算單元,和所有單元共用的指令預取(Fetch)/ 解碼(Decode)、第二階快取。Bulldozer模塊中每一個整數運算單元會被作業系統辨認為一個實體核心,CPU一共包含4個模塊,又每個模塊內有2個核心,故共計8個核心、4組2MB第二階快取、4組2MB 第三階快取、4條HT匯流排、DDR3記憶體控制器、北橋模組、輸入輸出裝置等等,以及各四個16-bit,用於發出與接受的HyperTransport匯流排連結,故Bulldozer整體的核心晶片面積高達315 mm²。而伺服器版本的Bulldozer(原廠代號Interlagos)是採取 兩組多晶片模組(MCM)方式來實現16核心的規格並且支援了四個 DDR3-1600 ECC Registered DDR3的記憶體控制器通道。
▲AMD新一代處理器基本架構的示意圖。
Bulldozer支援的指令集較前身K10可謂強化不少,從Intel的AES、SSE4.1及SSE 4.2,到FMA4、XOP還有CVT16,全部都被列入清單中!並對先進向量擴充指令集AVX達到最大限度相容。
生產製造的方面,除了用上Global Foundries的11金屬層 32奈米SOI(Silicon On Insulator,矽電晶體結構在絕緣體之上)技術外,也首次使用HKMG(高介電率絕緣膜/金屬閥電極)。之所以使用HKMG方式是因為可減少柵極的漏電量,降低柵極電容,如此一來會使電晶體的尺寸更進一步縮減,亦為繼續提高製程之關鍵技術。
匯流排的部分,採用Hyper Transport Technology 3.1版 (3.20 GHz,6.4 GT/s,25.6 GB/s,16-bit uplink/16-bit downlink)。這已經達到Intel QuickPath Interconnect匯流排的書面規格水準,若真能完全發揮這般水準,相信在資料吞吐量的表現上可以更進一步。
▲這是AMD官方所宣示Bulldozer處理器對軟體方面的特點。
本質上,Bulldozer架構是對高時脈最佳化的處理器,所以要讓該架構的處理器能發光發熱便要能以高時脈運作。雖說Intel在NetBurst微架構失敗後業已膽寒,不過,當時Intel的問題並不主要在高時脈本身。更多的問題在於微架構本身的缺陷。君不見在伺服器市場上,IBM以Power 7達到了高時脈高效能的成果!加上AMD的處理器研發團隊中也有前IBM的技術人員,所以AMD想借用Power 7這類伺服器處理器的方式來達成強大的運算能力是可被理解的。
回歸主題,這次美超微(SuperMicro)送測的是最新的Bulldozer架構處理器伺服器用版本—AMD Opteron 6282SE(惡魔黨黨員習慣暱稱為:超微的黑白衝)、可用於伺服器或繪圖工作站的雙G34 (1944針腳)腳位的H8DG6-F主機板和單支容量4GB的Hynix DDR3-1600 ECC Registered記憶體模組。
測試平台的硬體總結如下:
軟體部分:
本次測試,分為一般家用的Windows 7環境和伺服器級的Windows Server 2008 R2兩個區塊。
之所以會拿來看看家用作業系統的表現,另外一個原因就是因為,約8、9年前,早在AMD推出Athlon MP "Palomino" 核心的時代,國內外的高階玩家就開始有越來越多人是使用雙處理器插槽的工作站/伺服器等級平台兼做一般的個人遊戲用電腦來使用。筆者當時在北市八德路上的玩家天地就見識過了這些「真長輩」是怎樣疼自己或自己的小孩....
首先,我們來看看在Windows 7作業系統下,美超微提供的AMD雙Opteron平台搭配娛樂用3D顯示卡的表現。
▲ 這是藍寶科技所提供的公版Radeon HD6970之GPU-Z截圖。
▲3D Mark Vantage分別在H、P以及X模式下的分數。
▲3D Mark 11分別在P和X模式下的分數。
▲荒野雙蛟龍(Call of Juarez)在不同設定下的效能表現。
▲Final Fantasy XIV(太空戰士14)的測試成績。
▲Street Fighter 4(快打旋風4)測試成績。
▲然後,不能免俗地,也做了Unigine Heaven的測試。這兩張畫面分別是DirectX 11和OpenGL設定下的成績。
接著,就是這個平台在Windows Server 2008 R2 SP1底下的系統效能的部分:
▲由於CPU-Z在測試期間的版本1.58未能完整而正確地辨識處理器,所以部分項目以AIDA64代勞。從圖片中各位也可清楚看到AMD的伺服器用南橋SP5100,實際上就是SB700的伺服器用版本。
▲這個部分是Hyper π的測試成績,以目前Opteron的時脈來看,成績不如對手產品來的理想是可以預期的。
▲處理器快取及記憶體子系統的AIDA64測試成績。
▲以上的磁碟測試項目可以看出AMD的SP5100南橋在磁碟I/O方面的水準。
▲以上是SiSoftware  Sandra (the System ANalyser, Diagnostic and Reporting Assistant) 在測試期間最新的SP5版本測試成績。
▲現在進入了繪圖顯卡相關測試,先用甜甜圈來摧殘…
▲還有Lightsmark 2008進行光影特效的性能評估。
▲MicroStation Graphics Benchmark的部分,結果如上圖。
▲POV-Ray的測試成績揭曉。
▲從Cinebench的測試成績來看,很明顯地,Opteron 6282SE的整體效能是因為以多核心數取勝,單核的表現甚至是倒退的。AMD必須趕快加把勁讓預設時脈得以拉高,否則面對對手兩年一改的步步進逼,在市場上很難抬得起頭。
▲SPECViewperf 10的測試成績。
▲SPECViewperf 11的測試成績。
▲SolidWorks 2007的測試成績。很有趣的一點在於這個老benchmark在測試平台上發生成績忽快忽慢的情況,筆者測試過程中是第一回跑的分數會暴高,後面再跑又會超慢。不過以目前的硬體規格來看,總覺得該讓這套測試軟體除役,畢竟準確度令人懷疑。
▲redsdk turbine benchmark測試結果表。
▲美超微的SuperDoctor III監控程式,由於這次的測試平台所用的電源供應器有配置PMBus接頭,所以會有電源相關的監控頁面。若使用者用的是一般不具備PMBus接頭的電源,或是沒有將這個接頭連接到主機板上,那就不會看到相關的監控頁面。
總結:
高時脈怪物走向的豪賭!以AMD在半導體製程及產能跟競爭對手相較,其差距如此巨大來看,Bulldozer架構的作法不啻為一種豪賭。雖然說這樣的架構對於實現高時脈是具有一定程度的優勢,且在本次測試中的確也在部分測試軟體中看出以多核心數量累積整體效能的優勢,但要這樣玩的先決條件是製程水準要領先對手。以Global Foundries的整體條件來看,筆者暫時持保留態度。畢竟目前業界在製程上,GF還不能算是領頭羊。對手在這塊領域所築出的防禦工事,光推土機還是難以撼其根基!加上要讓這樣的架構能發揮所長,還得要預計於明年國慶日前後才有望進入RTM的Windows 8/Windows Server 8加持。不過,對需要大量核心進行整數運算的資料處理來說,AMD新世代Opteron將會是很好的採購標的!
~Fin~

2#
mclarenfung 發表於 2011-11-15 03:16:22 | 只看該作者
用什麼主板?
SB 700?
3#
zsc15461 發表於 2011-11-15 14:26:39 | 只看該作者
第一個圖就嚇到了...32個核心嗎?
4#
jichihandsome 發表於 2011-11-15 16:19:01 | 只看該作者
我也嚇到了@@32個核心?

還是我眼花啦?
5#
x61055t 發表於 2011-11-16 15:45:53 | 只看該作者
這配備太屌了吧
6#
凱凱 發表於 2011-11-24 10:03:09 | 只看該作者
感謝分享!!
7#
waiwa1003 發表於 2011-11-28 23:46:06 | 只看該作者
感謝分享
8#
qxxrbull 發表於 2012-2-6 14:52:10 | 只看該作者
回復 5# x61055t


    這個貌似不會再一般消費及市場出現
9#
x61055t 發表於 2012-2-6 17:13:29 | 只看該作者
回復  x61055t


    這個貌似不會再一般消費及市場出現
qxxrbull 發表於 2012-2-6 14:52



除了不能超頻之外
一切都很完美:)...
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-9-20 06:17 , Processed in 0.119366 second(s), 64 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表