Intel即將推出的AVX10 ISA(指令集架構)已得到詳細說明,並為P核和E核提供AVX-512支援。
在Twitterati Longhorn發布的資料中,我們看到了Intel即將推出的AVX10 ISA的詳細訊息,該ISA似乎有兩個版本:預啟用 (AVX10.1) 和後啟用 (AVX10.2)。兩種 ISA都有一個主要的新增功能,即支援可選的512位元FP/int,這是最近的客戶端晶片中排除的功能。Intel AVX-512 ISA已經在Rocket Lake和Tiger Lake中使用了一段時間,但該公司決定在最新的客戶端晶片(例如Alder Lake和Raptor Lake)中禁用它。
但看起來Intel可能會在支援AVX 10 ISA的處理器中重新導入這些指令。根據啟用前和啟用後的詳細訊息,AVX10 ISA是最新APX(高級性能擴展)的一部分,並將提供:
- Optional 512-bit FP/int
- 128/256-bit FP/int
- 32 vector registers
- 8 mask registers
- 256/512-bit embedded rounding
- Embedded broadcast
- Scalar/SSE/AVX "promotions"
- Native media additions
- HPC additions
- Transcendental support
- Gather/Scatter
- Version-based enumeration
- Support on P-Cores, E-Cores
現在AVX-512並沒有完全消失。Xeon的HPC端仍然支援這些指令。然而客戶端可能只是恢復AVX-512指令,因為AMD已經在其Ryzen 7000消費級處理器上提供了該指令,並且它們在特定工作負載中展示了一些令人印象深刻的性能,而不會嚴重影響功耗。功耗是Intel之前的 AVX-512指令的一個主要問題。
Intel AVX10代表了未來Intel處理器支援高性能矢量ISA的重大轉變。它允許開發人員維護單一代碼路徑,從而在所有Intel平台上實現高性能,而不會嚴重影響功耗。Intel AVX10 ISA的未來發展將繼續提供豐富、靈活且一致的環境,以最佳方式支援伺服器和客戶端產品。
透過Intel
此外預啟用的AVX10.1版本僅列出了對P核的AVX-512支援,而AVX10.2版本也添加了E核。已有報導稱Intel未來可能會以某種形式將AVX-512帶回客戶端晶片。除了前面提到的可用性優勢之外,Intel AVX10的其他一些基於性能的優勢還包括:
- Intel AVX2編譯的應用重新編譯為Intel AVX10後無需額外的軟體調整即可實現性能提升。
- 由於增加了16個向量寄存器和新指令,對向量寄存器壓力敏感的Intel AVX2應用將獲得最大性能。
- 當在採用E核的Intel XEON處理器或有性能混合架構的Intel® 產品上執行時,高線程可矢量化應用可能會實現更高的聚合吞吐量。
該公司為客戶提供 Meteor Lake,為HPC客戶提供Granite Rapids和Sierra Forest。所有三個系列均採用類似的架構,其中P核使用Redwood Cove核,E核採用Crestmont架構。Intel表示其未來的至強處理器(代號Granite Rapids)將是第一個與AVX10相容的處理器,並將標誌著從AVX-512到Intel AVX10的過渡(不包括256位元矢量擴展)。期待未來有更多訊息。
消息來源 |