IBM Research開發了首款AI專用晶片Northpole,據稱其性能比其他行業產品快22倍。
這則消息來自科學雜誌上發表的一篇論文,其中討論了IBM即將推出的代號為NorthPole的AI加速器。隨著業界AI熱潮的湧入,不少晶片廠商紛紛打造自己的解決方案,唯一的目的就是超越業界領導者的運算效能,滿足不斷成長的AI需求。IBM研究院發布的新數據暗示NorthPole人工智慧晶片將在業界樹立新的基準,特別是因為該公司的人工智慧晶片方法確實令人著迷。
專案負責人Dharmendra Modha對晶片架構非常樂觀。現在IBM Research的實現是該公司將神經推理架構結合到晶片處理本身中,這就是Modha將其歸類為人腦的原因。其高效的CPU互連性與全數位架構相結合,可以更快地實現相互通訊,這就是NorthPole輸出如此性能的原因。
說到規格NorthPole AI晶片採用12nm製程處理技術,從行業角度來看,該技術相當古老,但IBM Research認為由於使用了ResNet-50神經網路,該晶片也超越了現代4nm AI GPU模型。這項成就也否定了摩爾定律,並且在某種程度上遵循了黃氏定律的核心要素,即專注於單一晶片堆疊而不是製程縮小。
從架構上來說NorthPole模糊了運算和記憶體之間的界線。在單一核心的層面上NorthPole表現為近計算記憶體,而從晶片外部來看,在輸入輸出層面上,它表現為主動記憶體。這使得NorthPole易於整合到系統中,並顯著減少主機上的負載
-Dharmendra Modha來自IBM研究中心
NorthPole晶片的第一組有希望的結果今天發表在科學雜誌上。Modha表示NorthPole是晶片架構方面的一項突破,可大幅提高能源、空間和時間效率。以 ResNet-50模型為基準,NorthPole的效率明顯高於常見的12nm GPU和14 nm CPU。(NorthPole本身是採用12nm製程技術打造。)在這兩種情況下,就每焦耳所需功率解釋的幀數量而言,NorthPole的能效提高了25倍。就每十億個電晶體所需的每秒解釋幀數而言,NorthPole在延遲和計算所需空間方面也表現出色。
Modha表示在ResNet-50上NorthPole的效能優於所有主要流行架構,甚至是使用更先進技術製程的架構,例如使用4nm製程實現的GPU。
透過IBM
如果我們看到NorthPole對整個人工智慧產業的潛在影響,它肯定僅限於模型推理,因為該晶片缺乏對GPT-4等大規模神經網路的支援。不過該公司推出該晶片的目標並非針對主流人工智慧市場,而是針對那些只專注於推理的市場,因此其影響力有限。鑑於NorthPole聲稱它也可以超越現代NVIDIA AI產品,因此看看 NorthPole能夠輸出什麼樣的性能將會很有趣。
消息來源 |