找回密碼註冊
作者: sxs112.tw
查看: 5083
回復: 1

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能優化 三星990 EVO 玩家體驗分享活

[*]進化日常效能 極致效能優化、電源效率提升、廣泛的通用 ...

FSP VITA GM White 玩家開箱體驗分享活動

中秋佳節,全漢加碼活動來囉~ [*]符合最新 Intel ® ATX 3.1電源設 ...

FV150 RGB 玩家開箱體驗分享活動

粉紅控趕快看過來.......廠商加碼活動來囉~ 心動了嗎? 想取得體驗 ...

海韻創新技術分享會 會後分享--得獎公告

頭獎:dwi0342 https://www.xfastest.com/thread-290899-1-1.html ...

打印 上一主題 下一主題

[處理器 主機板] Intel第4代Xeon Sapphire Rapids CPU透過AMX實現高達10倍的AI穩定擴散性能

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2023-3-29 09:27:42 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
得益於AMX,代號為Sapphire Rapids的Intel第4代Xeon CPU在AI Stable Diffusion中實現了高達10倍的性能提升。
Intel-Sapphire-Rapids-Xeon-CPU-gigapixel-very_compressed-scale-4_00x-Custom.png

最近推出的Intel第4代Xeon Sapphire Rapids CPU在雲端和數據中心領域得到了加速採用。Intel付出額外努力的關鍵領域之一是其用於深度學習加速的硬體功能集,該功能透過新的AMX(高級矩陣擴展)加速器得到提升。

Intel首先展示了當前一代Sapphire Rapids與上一代Ice Lake CPU之間的平均延遲。第三代Xeon CPU需要大約45秒來執行代碼,而第四代CPU需要32.3秒。在不更改代碼的情況下延遲降低了 28%。那麼如果Intel使用優化的開源工具包進行高性能推理,如OpenVINO,會怎樣呢?
01.png

答案是性能更快!借助Optimum Intel和OpenVino,Intel Xeon CPU將延遲降至16.7秒,加速超過2倍。將代碼進一步優化為固定解析度可將延遲降至僅4.7秒,這標誌著與未修改代碼相比加速了3.5-3.8倍。

消息來源
2#
clouse 發表於 2023-3-29 10:51:56 | 只看該作者
本帖最後由 clouse 於 2023-3-29 23:03 編輯

10nm功耗高性能太差又貴
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-9-21 18:31 , Processed in 0.072981 second(s), 32 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表