在輝煌的K8、平淡的K10架構之後,AMD的“推土機”(Bulldozer)模組化多核CMT架構承載了他們的新希望,但2011年發佈以來,AMD的CMT架構折戟沉沙,期間AMD雖然升級了打樁機(Piledriver)、壓路機(Steamroller)及挖掘機(Excavator)等四代模組架構,但FX系列處理器已經一蹶不振。如今重壓之下的AMD依然把高性能伺服器市場作為重點,他們的籌碼這次壓在了全新的X86架構Zen上,從日前曝光的Zen架構核心圖上我們可以確認AMD這次真的是徹底放棄模組多核設計了,回歸傳統。
AMD的Zen架構搞了很多年了,我們對該架構所知甚少,此前只知道AMD會放棄“推土機”那樣的CMT模組多核,回歸傳統的SMT同步多執行緒,TDP還會更低。日前有網友在Planet3dnow論壇上曝光了AMD官方的PPT,這是AMD 5月份的會議上才會公佈的資料,上面赫然列出了Zen架構的內核設計,並與目前的Excavator挖掘機架構做了對比。
瞭解這兩種架構的不同,讀者可以先參考下我們之前對“推土機”架構的解析:AMD復仇之劍,Bulldozer推土機預覽及展望。前文對AMD的模組多核設計做了解釋,該架構最明顯的設計就是2個整數單元搭配1個彈性浮點單元,整數單元各自有自己的解碼器和調度器,而浮點單元是共用設計的。AMD採用這種設計是因為日常應用中有80%的運算都是整數型的,浮點運算只有20%,而且AMD當時還在搞APU融合計算,他們希望浮點運算轉向能力更強的GPU方面。
理想很豐滿,現實很骨感,可惜AMD的這種設想在現實中並沒有發揮出優勢,“推土機”的實際性能並不強。此外,AMD當時使用的還是32nm SOI工藝,Globalfoundries缺乏先進制程的頑疾也加劇了“推土機”的失利,功耗大、發熱高,再加上性能不濟,AMD的FX處理器自此就沉寂下來了。
AMD的模組化架構上使用的是彈性浮點單元設計
如今AMD攜Zen歸來,它不再使用模組化設計了,回歸了傳統的整數單元+浮點單元的設計,當然每個單元的功能現在已經今非昔比了,比如“挖掘機”架構中浮點單元是128bit的,Zen架構中則是256bit的,將支持Intel的AVX 2.0指令。
不僅如此,AMD的FP單元具備很高的彈性,之前推土機架構中2個128bit浮點單元可以合併執行256bit指令,Zen架構的2個256bit單元理論上可以執行512bit指令,達到Intel Skylake處理器的水準。
下個月初AMD有可能在分析師會議上公佈更多Zen架構的詳情,大家拭目以待吧。
Zen架構預計今年底問世,但產品上市可能要等到明年了,此前已經曝光的Zen架構16核APU、Zen架構32核伺服器晶片看上去也各種強大,希望Zen架構不要再跟推土機這麼杯具了。
實際上我們這次對Zen可以保持謹慎樂觀,首先參與Zen架構研發的設計師Jim Keller是個技術大牛,早前負責過AMD的K7及64位K8處理器的研發,之後投奔蘋果,參與了蘋果A4/A5處理器的開發。再次,推土機失利很大一個原因也是GF工藝不行,當時還在使用32nm SOI工藝,但Zen架構將會使用GF的14nm FinFET工藝,後者使用了三星的14nm授權,成熟度比GF自己搞的好多了。2016年Intel的主流工藝也是14nm 3D電晶體工藝,雖然各自的設計不同,但AMD終於能跟Intel使用同代水準的半導體工藝了。
超能網
|