找回密碼註冊
作者: lin.sinchen
查看: 5298
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

打印 上一主題 下一主題

[業界新聞] Intel 為企業生成式 AI 市場推出 Gaudi 3 AI 加速器

[複製鏈接]| 回復
跳轉到指定樓層
1#


Intel Vision 2024 大會上,宣布推出 Intel Gaudi 3 AI 加速器,與前代產品相比 Gaudi 3 為 BF16 提供 4 倍 AI 運算能力、1.5 倍記憶體頻寬以及 2 倍網路頻寬,可擴充大規模系統,將有助大型語言模型(LLM)和多模態模型的 AI 訓練和推理,大幅提升效能和生產力。

金融、製造和醫療保健等關鍵領域的企業,目前正快速提升 AI 的普及化,並積極將生成式AI計畫從試驗階段轉為全面實施。為了因應轉型、推動創新並達成營收成長目標,企業需要開放、符合成本效益且更節能的解決方案和產品,以符合投資報酬率(ROI)和營運效率需求。

Intel Gaudi 3 加速器將滿足這些需求,並透過開放社群軟體和開放標準的乙太網路,協助企業靈活擴充AI系統和應用。



客製化基礎架構如何提升生成式 AI 效能和效率:Intel Gaudi 3 加速器專為高效的大規模 AI 運算打造,採用相較前一代產品更先進的 5nm 製程。其設計允許同時啟動所有引擎以提升速度,包括矩陣乘法引擎(MME)、張量處理器核心(TPC) 和網路介面卡(NIC),進而實現更高速、高效的深度學習運算和規模擴充。Gaudi 3 加速器的主要特點包括:
  • AI 專用運算引擎:Intel Gaudi 3 加速器專為高效能、高效率的生成式 AI 運算所打造。每台加速器都有專屬的異質運算引擎,由 64 個 AI 自訂和可編程 TPC 和 8 個 MME 組成。每個 Intel Gaudi 3 MME 皆能執行 64,000 個平行運算,運算效率極高,並擅於處理複雜的矩陣運算,這也是深度學習演算法的基礎運算。此獨特的設計大幅提升平行AI運算的速度和效率,並支援多種資料類型,包括 FP8 和 BF16。
  • 提升記憶體容量,滿足 LLM 容量需求:Intel Gaudi 3 搭載 128 GB 的 HBMe2 記憶體容量、7 TB 的記憶體頻寬和 96 MB 的 on-board 靜態隨機存取記憶體(SRAM),因此能夠在更少的 Intel Gaudi 3 上,提供處理大型生成式 AI 資料集所需的足夠記憶體,且特別適用於大型語言和多模態模型,有助於提升工作負載效能和資料中心的成本效率。
  • 為企業提供生成式AI高效系統擴充:每個 Intel Gaudi 3 加速器皆整合 24 個 200 GB 的乙太網路連接埠,提供靈活的開放標準網路,實現高效擴充,以支援大型運算集,並克服專有網路架構的供應商限制。Intel Gaudi 3 加速器實現單一節點到上千節點的高效擴充,以滿足生成式 AI 模型的廣泛要求。
  • 開放產業軟體提升開發人員生產力:Intel Gaudi 軟體整合 PyTorch 框架,並提供基於 Hugging Face 社群的最佳化模型,是目前生成式 AI 開發人員最常用的AI框架,使生成式 AI 開發人員能夠在高度抽象層上進行操作,提升易用性和生產力,並可輕鬆地將模型轉移到不同硬體類型上。
  • Gaudi 3 PCIeGaudi 3 高速 PCIe 附加卡是全新產品,外型規格專為實現高效率並降低功耗設計,適用於微調、推理和檢索增強生成(RAG)等工作,配備功率600瓦的標準(Full-height )封裝,128GB 的記憶體容量,且頻寬達到每秒 7TB。


Intel Gaudi 3 加速器將為領先生成式 AI 模型的訓練和推理,帶來顯著的效能提升。與 Nvidia H100 相比,Gaudi 3 加速器的平均效能預期將為:
  • 在 Llama2 7B 和 13B 參數以及 GPT-3 175B 參數模型的訓練時間加快 50%
  • 在 Llama 7B 和 70B 以及 Falcon 180B 參數模型上,推論吞吐量提升 50%,推論能源效率提升 40%。在較長的輸入和輸出序列中,具有更大的推理效能優勢。
  • 與 Nvidia H200 相比,在 Llama 7B 和70B以及Falcon 180B參數模型的推理速度提升 30%


Intel Gaudi 3 加速器將於 2024 年第二季,向 OEM 提供通用基板和開放加速器模型(Open accelerator module, OAM)的業界標準配置。包含戴爾科技、慧與科技(HPE)、聯想和美超微等知名OEM,都將採用 Gaudi 3。Intel Gaudi 3 加速器預計於 2024 年第三季全面上市,Intel Gaudi 3 PCIe 附加卡預計於 2024 年第四季上市。

Intel Gaudi 3 加速器也將支援多個高成本效益 LLM 基礎架構,協助訓練和推理,並為包括 NAVER 在內的組織提供性價比優勢和選擇。

開發者從今日起即可存取 Intel Developer Cloud上以Intel Gaudi 2 為基礎的實例,以學習、建立原型、測試和執行應用程式與工作負載。

Intel Gaudi 3 加速器的發展將為英特爾下一代針對 AI 和高效能運算的 GPU Falcon Shores 奠下基石。Falcon Shores 將整合 Intel Gaudi 和 Intel Xe 的智慧財產權(IP),以及建立在 Intel oneAPI 規範的單一 GPU 可程式化界面。
更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-14 13:19 , Processed in 0.148130 second(s), 67 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表