找回密碼註冊
作者: lin.sinchen
查看: 5674
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

SAMSUNG T7 Shield 移動固態硬碟

[*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

打印 上一主題 下一主題

[業界新聞] Intel 為企業生成式 AI 市場推出 Gaudi 3 AI 加速器

[複製鏈接]| 回復
跳轉到指定樓層
1#


Intel Vision 2024 大會上,宣布推出 Intel Gaudi 3 AI 加速器,與前代產品相比 Gaudi 3 為 BF16 提供 4 倍 AI 運算能力、1.5 倍記憶體頻寬以及 2 倍網路頻寬,可擴充大規模系統,將有助大型語言模型(LLM)和多模態模型的 AI 訓練和推理,大幅提升效能和生產力。

金融、製造和醫療保健等關鍵領域的企業,目前正快速提升 AI 的普及化,並積極將生成式AI計畫從試驗階段轉為全面實施。為了因應轉型、推動創新並達成營收成長目標,企業需要開放、符合成本效益且更節能的解決方案和產品,以符合投資報酬率(ROI)和營運效率需求。

Intel Gaudi 3 加速器將滿足這些需求,並透過開放社群軟體和開放標準的乙太網路,協助企業靈活擴充AI系統和應用。



客製化基礎架構如何提升生成式 AI 效能和效率:Intel Gaudi 3 加速器專為高效的大規模 AI 運算打造,採用相較前一代產品更先進的 5nm 製程。其設計允許同時啟動所有引擎以提升速度,包括矩陣乘法引擎(MME)、張量處理器核心(TPC) 和網路介面卡(NIC),進而實現更高速、高效的深度學習運算和規模擴充。Gaudi 3 加速器的主要特點包括:
  • AI 專用運算引擎:Intel Gaudi 3 加速器專為高效能、高效率的生成式 AI 運算所打造。每台加速器都有專屬的異質運算引擎,由 64 個 AI 自訂和可編程 TPC 和 8 個 MME 組成。每個 Intel Gaudi 3 MME 皆能執行 64,000 個平行運算,運算效率極高,並擅於處理複雜的矩陣運算,這也是深度學習演算法的基礎運算。此獨特的設計大幅提升平行AI運算的速度和效率,並支援多種資料類型,包括 FP8 和 BF16。
  • 提升記憶體容量,滿足 LLM 容量需求:Intel Gaudi 3 搭載 128 GB 的 HBMe2 記憶體容量、7 TB 的記憶體頻寬和 96 MB 的 on-board 靜態隨機存取記憶體(SRAM),因此能夠在更少的 Intel Gaudi 3 上,提供處理大型生成式 AI 資料集所需的足夠記憶體,且特別適用於大型語言和多模態模型,有助於提升工作負載效能和資料中心的成本效率。
  • 為企業提供生成式AI高效系統擴充:每個 Intel Gaudi 3 加速器皆整合 24 個 200 GB 的乙太網路連接埠,提供靈活的開放標準網路,實現高效擴充,以支援大型運算集,並克服專有網路架構的供應商限制。Intel Gaudi 3 加速器實現單一節點到上千節點的高效擴充,以滿足生成式 AI 模型的廣泛要求。
  • 開放產業軟體提升開發人員生產力:Intel Gaudi 軟體整合 PyTorch 框架,並提供基於 Hugging Face 社群的最佳化模型,是目前生成式 AI 開發人員最常用的AI框架,使生成式 AI 開發人員能夠在高度抽象層上進行操作,提升易用性和生產力,並可輕鬆地將模型轉移到不同硬體類型上。
  • Gaudi 3 PCIeGaudi 3 高速 PCIe 附加卡是全新產品,外型規格專為實現高效率並降低功耗設計,適用於微調、推理和檢索增強生成(RAG)等工作,配備功率600瓦的標準(Full-height )封裝,128GB 的記憶體容量,且頻寬達到每秒 7TB。


Intel Gaudi 3 加速器將為領先生成式 AI 模型的訓練和推理,帶來顯著的效能提升。與 Nvidia H100 相比,Gaudi 3 加速器的平均效能預期將為:
  • 在 Llama2 7B 和 13B 參數以及 GPT-3 175B 參數模型的訓練時間加快 50%
  • 在 Llama 7B 和 70B 以及 Falcon 180B 參數模型上,推論吞吐量提升 50%,推論能源效率提升 40%。在較長的輸入和輸出序列中,具有更大的推理效能優勢。
  • 與 Nvidia H200 相比,在 Llama 7B 和70B以及Falcon 180B參數模型的推理速度提升 30%


Intel Gaudi 3 加速器將於 2024 年第二季,向 OEM 提供通用基板和開放加速器模型(Open accelerator module, OAM)的業界標準配置。包含戴爾科技、慧與科技(HPE)、聯想和美超微等知名OEM,都將採用 Gaudi 3。Intel Gaudi 3 加速器預計於 2024 年第三季全面上市,Intel Gaudi 3 PCIe 附加卡預計於 2024 年第四季上市。

Intel Gaudi 3 加速器也將支援多個高成本效益 LLM 基礎架構,協助訓練和推理,並為包括 NAVER 在內的組織提供性價比優勢和選擇。

開發者從今日起即可存取 Intel Developer Cloud上以Intel Gaudi 2 為基礎的實例,以學習、建立原型、測試和執行應用程式與工作負載。

Intel Gaudi 3 加速器的發展將為英特爾下一代針對 AI 和高效能運算的 GPU Falcon Shores 奠下基石。Falcon Shores 將整合 Intel Gaudi 和 Intel Xe 的智慧財產權(IP),以及建立在 Intel oneAPI 規範的單一 GPU 可程式化界面。
更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-12-28 00:57 , Processed in 0.118555 second(s), 64 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表