日前,ARM在深圳召開了2015 ARM Tech Forum,會議上沒有太多新東西。還是前一段發佈的A72架構和CoreLink CCI-500,不過近來,ARM一直對Intel把持的伺服器和資料中心市場很感興趣。
ARM高級副總裁Pete Hutton樂觀表示到2017年ARM將在伺服器晶片市場佔有5-10%的份額,Canaccord銀行的分析師更樂觀認為到2018年ARM將能贏得伺服器晶片市場的20%的份額。
為何ARM如此有信心?在Intel把持的伺服器市場,ARM會有機會嗎?
一、A72架構和CoreLink CCI-500
長期以來,ARM走的都是低功耗,低性能路線,產品性能距離桌面的X86處理器很遠,更不用說伺服器晶片了。但是隨著智能手機的不斷升級,和PC市場的停滯,這個性能差距越來越小。
在A9之後,ARM意識到自己無法在性能和功耗之間兼顧,於是推出了大小核的策略,ARM稱之為big.LITTLE,在低負載用小核心,高負載用大核心,平衡性能與功耗的矛盾。這樣ARM就可以不太顧及功耗發展高性能核心。
第一款產品是A15,第二代是A57,如今的A72理論上是第三代產品。按照ARM的說法,Cortex-A72是其性能最出色、最先進的處理器,構建在Cortex-A57的基礎之上,性能可達Cortex-A15 3.5倍。不過,從架構圖和規格表上看,A72和A57並沒有本質的不同,仍舊最多四核心,一級二級的緩存容量都沒變,只是做了一些細節調整,比較明顯的變化是砍去了NEON SIMD引擎中的加密擴展功能,匯流排界面擴展到128bit。
ARM自己則說是通過過對讀寫指令操作的不斷優化以及細節上的創新提升了性能降低了功耗。
不過,我們要知道,按照ARM這種性能演算法,A57比A15也有1.9倍的性能提升。那是建立在20nm對28nm工藝的基礎之上的。同樣,A72這個所謂3.5倍的性能提升,也是建立在16nmfinFET對28nm的工藝優勢上。如下圖:
實際上,ARM的A57在同頻下相對於A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大約是1100分,1.7GHZ的A57跑specint2000是1250分。
按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估計同頻A72相對於A57大約也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大約在1550分。
而根據前不久華為提供的內部測試的資料,同頻同工藝下,A72相對於A57只有大約5%的性能提升。功耗也只下降了5%左右。
華為的資料或許沒發揮出A72的潛力,但是A72相比A57在核心上的進步並不如ARM描述的那麼大恐怕是事實。
核心上進步不太大,真正的進步是 CoreLink CCI-500,CoreLink CCI-500最大的變化就是增加了一個“探聽篩檢程式”(Snoop Filter),從而使探聽控制不再局限於單個簇內部的CPU之間,可以擴展到整個處理器的所有核心。
過去,ARM雖然支持多核心,但實際上是四個核心一個簇,簇內部是有偵聽的,可以解決快取一致性的問題,而簇之間是沒有的,所以從四核心到八核心會有一定的性能下降。
而ARM提倡的大小核恰恰是八核心的,這次增加“探聽篩檢程式”可以提升多核心的性能。而 CoreLink CCI-500最多支援的CPU簇從2個增加到4個,每個簇可以支援四個處理器,這樣算最多可以支援16個處理器。
處理器增加,多核心效率提升,這就給進軍高性能建設鋪好了路。
在記憶體性能方面,ARM宣稱CoreLink CCI-500可以提升30%的記憶體性能。再加上CoreLink CCI-500的記憶體貸款提升到了四通道128-bit記憶體位元寬,這樣資料的吞吐能力也有可觀的提升,這對伺服器來說至關重要。
所以,ARM的信心來源還是技術,在大小核戰略之後,ARM的大核心性能已經有了長足進步,單個核心已經逼近Intel當年的酷睿2處理器,但是功耗卻不大。性能功耗比不錯。
另外一方面, CoreLink CCI-500提升了核心的支持數量,提升了多核心效率,還提升了記憶體性能與頻寬,這都對伺服器的性能是好事。
ARM的野心勃勃來自於技術的提升。
二、ARM有機會嗎?
其實ARM進軍伺服器不是現在才開始提的,2011年Calxeda推出了搭載480個ARM處理器核心的低功耗伺服器,惠普的微伺服器也採用Calxeda的晶片,2013年百度採用MARVELL的ARM處理器搭建伺服器。
但是這些嘗試都失敗了,因為當年的ARM處理器太弱,如今ARM憑技術進步想要捲土重來,它有機會嗎?
單純從性能看,ARM確實有了進步,現在用ARM指令集的晶片做伺服器,在多核心支援上,記憶體頻寬上都值得嘗試。
但問題是,伺服器不僅僅是個性能問題。多年以來,在硬體上、軟體上、網路標準上,Intel已經深耕多年,IBM、HP這類巨頭也已經在Intel的戰車上捆綁了多年。
即使在IBM自己的PowerPC的小底盤,也是有成型的標準規範,ARM作為一個後來者加入,很難被接受。
你換用了ARM指令集的晶片,你的儲存設備能否配套,原來的軟體怎麼辦?原來的系統怎麼辦?原來的資料備份怎麼處理?
這種轉換的成本非常之高,幾乎不可能遷移。
而Intel也不是固步自封,在智慧手機市場,Intel雖然走錯了路,但是追的很快。目前,Intel的智慧手機晶片性能並不比ARM差。雖然在智慧手機上因為安卓系統的原因發揮不出來,但是到了伺服器市場,換上Intel熟悉的軟體環境,就是ARM有力無處使了。
在伺服器上,Intel同級別的晶片完勝ARM,使用者完全可以用Intel的低功耗晶片方案來解決問題,成本會比換用ARM更低。
而且Intel還防禦性的收購了Altera,真正要做低功耗低成本,ARM也不是對手。
在高性能領域,Intel有眾核方面,其效率也不是ARM靠堆晶片所能比擬的。
所以,從硬體到軟體,使用者都沒有換馬的必要,嘗試ARM不過是試水而已。
雖然ARM自己的技術進步了不少,但是在伺服器市場機會依然渺茫。
文章來源 |