sxs112.tw 發表於 2023-3-29 09:27:42

Intel第4代Xeon Sapphire Rapids CPU透過AMX實現高達10倍的AI穩定擴散性能

得益於AMX,代號為Sapphire Rapids的Intel第4代Xeon CPU在AI Stable Diffusion中實現了高達10倍的性能提升。

最近推出的Intel第4代Xeon Sapphire Rapids CPU在雲端和數據中心領域得到了加速採用。Intel付出額外努力的關鍵領域之一是其用於深度學習加速的硬體功能集,該功能透過新的AMX(高級矩陣擴展)加速器得到提升。

Intel首先展示了當前一代Sapphire Rapids與上一代Ice Lake CPU之間的平均延遲。第三代Xeon CPU需要大約45秒來執行代碼,而第四代CPU需要32.3秒。在不更改代碼的情況下延遲降低了 28%。那麼如果Intel使用優化的開源工具包進行高性能推理,如OpenVINO,會怎樣呢?

答案是性能更快!借助Optimum Intel和OpenVino,Intel Xeon CPU將延遲降至16.7秒,加速超過2倍。將代碼進一步優化為固定解析度可將延遲降至僅4.7秒,這標誌著與未修改代碼相比加速了3.5-3.8倍。

消息來源

clouse 發表於 2023-3-29 10:51:56

本帖最後由 clouse 於 2023-3-29 23:03 編輯

10nm功耗高性能太差又貴:time:...
頁: [1]
查看完整版本: Intel第4代Xeon Sapphire Rapids CPU透過AMX實現高達10倍的AI穩定擴散性能