Intel悄然合併新的AVX-512快速排序庫,性能提升高達17倍
NumPy即Numerical Python是著名編碼語言中專注於科學計算的Python庫之一,最近在AVX-512中整合了用於快速排序的Intel C++文件庫。新的整合表明採用比起SIMD的排序速度提高了10到17倍。Intel將x86-simd-sort上傳到公司的GitHub上,為用戶提供C++文件庫,以協助SIMD排序達到更高的性能水平。Intel工程師之一Raghuveer Devulapalli在將x86-simd-sort代碼整合到NumPy中發揮了關鍵作用。但是文件庫僅適用包含AVX-512及其快速排序。
Linux 分析師兼網站Phoronix的編輯(Michael Larabel 表示結果非常好,AVX-512排序的增加幫助項目將性能提高了10到17倍。Larabel指出PR 22315被導入NumPy以向量化16位元和64位元數據類型的快速排序bf AVX-512整合。他繼續說採用Tiger Lake的系統,特別是使用第11代Tiger Lake i7-1165G7的系統,見證了 16位元int排序的最高速度(快17倍)。相比之下64位元浮點排序的得分最低(增加了十倍)。最後32位元數據類型和隨機數組的排序能力確實提高了12到13倍。您可以在此處查看測試的結果。
消息來源
頁:
[1]