找回密碼註冊
作者: sxs112.tw
查看: 3347
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

SAMSUNG T7 Shield 移動固態硬碟

[*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

打印 上一主題 下一主題

[業界新聞] Panmnesia推出CXL Protocol,允許AI GPU以最小延遲利用DRAM或SSD

[複製鏈接]| 回復
跳轉到指定樓層
1#
KAIST新創公司Panmnesia推出了一項尖端IP,可使用PCIe上的CXL協定將外部記憶體新增至AI GPU,從而打破了記憶體容量的障礙。
Intel-Arc-Alchemist-GPUs-Resizable-BAR.jpg

目前的AI加速器僅限於板載記憶體,因為製造商只能壓縮有限數量的HBM。隨著資料集的不斷增長和對電力的需求,該行業正在專注於配備更多的AI GPU,但考慮到它佔用的金額和製造資源,這種方法從長遠來看是不可持續的。有鑑於此由韓國KAIST支援的公司Panmnesia推出了一款CXL IP,可以讓GPU利用DRAM甚至 SSD的記憶體,從內建的HBM進行擴展。
Screenshot-2024-07-03-at-9.39.14 PM.png

為了橋接連接,CXL利用PCIe鏈路,確保消費者廣泛採用。然而有一個問題。傳統的AI加速器缺乏必要的系統來直接連接並利用CXL進行記憶體擴展,而UVM(統一虛擬記憶體)等解決方案速度相當慢,這從一開始就達不到目的。

不過作為解決方案,Pamnesia開發了自己的符合CXL 3.1標準的Root Complex晶片,該晶片有多個端口,透過PCIe匯流排將GPU連接到外部儲存器,並且HDM(主機管理設備記憶體)解碼器充當橋樑連接之間,管理記憶體分配和翻譯。

有趣的是Pamnesia決定將他們的解決方案 (CXL-Opt) 與三星和Meta開發的原型進行測試,他們將其稱為CXL-Proto。令我們驚訝的是CXL-Opt顯著降低了往返延遲,即資料從GPU傳輸到記憶體並返回的時間。 CXL-Opt的延遲為兩位數ns,而CXL-Proto的延遲為250ns。除此之外CXL-Opt 的執行時間遠低於UVM解決方案,因為它的IPC效能速度是UVM的3.22倍。
Screenshot-2024-07-03-at-9.40.02 PM.png

Panmnesia的解決方案可以在市場上取得巨大進步,因為它充當堆疊HBM晶片和轉向更高效解決方案之間的中介。鑑於該公司是首批擁有創新CXL IP的公司之一,如果這項技術獲得關注,Panmnesia將受益匪淺。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-12-28 20:54 , Processed in 0.077170 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表