sxs112.tw 發表於 2023-2-18 19:20:42

Intel悄然合併新的AVX-512快速排序庫,性能提升高達17倍

NumPy即Numerical Python是著名編碼語言中專注於科學計算的Python庫之一,最近在AVX-512中整合了用於快速排序的Intel C++文件庫。新的整合表明採用比起SIMD的排序速度提高了10到17倍。

Intel將x86-simd-sort上傳到公司的GitHub上,為用戶提供C++文件庫,以協助SIMD排序達到更高的性能水平。Intel工程師之一Raghuveer Devulapalli在將x86-simd-sort代碼整合到NumPy中發揮了關鍵作用。但是文件庫僅適用包含AVX-512及其快速排序。

Linux 分析師兼網站Phoronix的編輯(Michael Larabel 表示結果非常好,AVX-512排序的增加幫助項目將性能提高了10到17倍。Larabel指出PR 22315被導入NumPy以向量化16位元和64位元數據類型的快速排序bf AVX-512整合。他繼續說採用Tiger Lake的系統,特別是使用第11代Tiger Lake i7-1165G7的系統,見證了 16位元int排序的最高速度(快17倍)。相比之下64位元浮點排序的得分最低(增加了十倍)。最後32位元數據類型和隨機數組的排序能力確實提高了12到13倍。您可以在此處查看測試的結果。

消息來源
頁: [1]
查看完整版本: Intel悄然合併新的AVX-512快速排序庫,性能提升高達17倍