找回密碼註冊
作者: sxs112.tw
查看: 5937
回復: 1

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

ROG電能狂潮 電源供應器開箱體驗活動

ROG Thor III 1000W 白金牌 氮化鎵 GaN MOSFET / 智慧穩壓器 / A ...

Micron Crucial P310 1TB (Gen4 2280 M.2)

迎擊而上,跳脫限制。 讓效能強大的 Crucial P310 NVMe SSD 為您贏得 ...

FIT V DDR5 電競/超頻記憶體 玩家開箱體驗

FIT V DDR5 電競/超頻記憶體最 FIT 專業工作者的效能首選 [*]靈巧俐 ...

華碩 極速WiFi 7 寫文競走開始!-- 得獎公

第一名 dwi042 https://www.xfastest.com/thread-294970-1-1.html ...

打印 上一主題 下一主題

[處理器 主機板] Intel第4代Xeon Sapphire Rapids CPU透過AMX實現高達10倍的AI穩定擴散性能

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2023-3-29 09:27:42 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
得益於AMX,代號為Sapphire Rapids的Intel第4代Xeon CPU在AI Stable Diffusion中實現了高達10倍的性能提升。
Intel-Sapphire-Rapids-Xeon-CPU-gigapixel-very_compressed-scale-4_00x-Custom.png

最近推出的Intel第4代Xeon Sapphire Rapids CPU在雲端和數據中心領域得到了加速採用。Intel付出額外努力的關鍵領域之一是其用於深度學習加速的硬體功能集,該功能透過新的AMX(高級矩陣擴展)加速器得到提升。

Intel首先展示了當前一代Sapphire Rapids與上一代Ice Lake CPU之間的平均延遲。第三代Xeon CPU需要大約45秒來執行代碼,而第四代CPU需要32.3秒。在不更改代碼的情況下延遲降低了 28%。那麼如果Intel使用優化的開源工具包進行高性能推理,如OpenVINO,會怎樣呢?
01.png

答案是性能更快!借助Optimum Intel和OpenVino,Intel Xeon CPU將延遲降至16.7秒,加速超過2倍。將代碼進一步優化為固定解析度可將延遲降至僅4.7秒,這標誌著與未修改代碼相比加速了3.5-3.8倍。

消息來源
2#
clouse 發表於 2023-3-29 10:51:56 | 只看該作者
本帖最後由 clouse 於 2023-3-29 23:03 編輯

10nm功耗高性能太差又貴
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2025-3-14 07:04 , Processed in 0.102370 second(s), 32 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表