Arm 為新世代 AI 運算推出新軟硬體組合的終端產品運算子系統
針對行動裝置提供更多 AI 應用,Arm 宣布推出終端產品運算子系統,包括新的運算核心與繪圖處理器組合之外,也特別推出 Kleidi 函式庫以發揮強大的運算能力。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_11.jpg
在生成式 AI 熱潮之下,各種裝置都加入不同程度的人工智慧功能,其中行動裝置更是加上許多功能,包括影像處理、互動簡訊,新一代的機種更加入即時翻譯、語音轉文字等功能,讓使用者擁有更方便的使用體驗。在行動裝置運用更多 AI 功能之下,需要的運算資源就更多,為了提供更強的功能,勢必要採用更強大的處理器,但仍要考量功耗的重要因素。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/R6JC8664.jpg
(左起)Arm 應用工程總監徐達勇、Arm 終端產品事業部產品管理副總經理 James McNiven 及 Arm 台灣總裁曾志光
目前行動裝置幾乎都是採用 Arm 架構產品,擁有高性能與低功耗的特色,這樣的特色也適合用於新世代的筆記型電腦、可穿戴裝置、智慧電視等終端使用,更重要是有普及的開發生態。為了讓行動裝置能夠擁有更強大的 AI 運算能力,Arm 宣布推出新的終端產品運算子系統(CSS for Client)運算平台。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_02.jpg
Arm 為 AI 時代推出新的終端產品運算子系統(CSS for Client)採用最新 Armv9.2 架構提供高運算性能、效率與安全
新的終端產品運算子系統是針對生成式 AI 而設計,擁有極佳的性能與能源效率,並首次採用 CPU 與 GPU 最佳化的布局,更與領先的晶圓製造商合作,最佳化整個設計以適應新的 3nm 製程。比較特別是新的終端產品運算子系統以實體形式提供 IP,但仍可讓客戶擁有客製化的設計。針對客戶不同的應用,Arm 提供三種不同的 CPU 架構與 GPU 選項,還包括 CPU 類型、快取記憶體大小等都有靈活的選擇空間。
新終端產品運算子系統是為 AI 與資安而設計的平台,採用最新的 Armv9.2 架構版本,並有最新的 CPU 與 GPU 組合,是目前最快速的 Arm 運算平台,提升 30% 以上的運算及繪圖效能,以因應實際應用時複雜的 Android 工作負載,並以加快 59% 速度的 AI 推論,處理更廣大的 AI 機器學習和電腦視覺工作負載。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_05.jpg
Cortex-X925 是 Cortex-X 系列性能最高的產品
新的 CSS 提供功能多樣的 CPU 叢集,擁有最高的效能及功耗效率。其中做為 Cortex-X4 後繼者的 Arm Cortex-X925 是 Cortex-X 系列最新且性能最高的產品,是此系列中首款採用新的命名方式。以 3nm 製程工作時脈為 3.8GHz 並擁有最大快取記憶體的 Cortex-X925 為例,相比去年同期產品其 CPU 時脈周期指令數(IPC)有二位數的提升。與2023年使用 4nm 製程應用於旗艦級智慧手機的單晶片相比,單執行緒效能提升 36%。在 AI 運算效能更有驚人的 41% 提升,大幅提升裝置內生成式 AI 如大型語言模型(LLM)的反應速度。
Cortex-X925 性能的提升包括新製程以及微架構的改變,擁有至今為止最寬的解碼和向量設計,讓 AI TOPS 提升 50%。另外它還強化可配置性和更大的私有 L2 快取最大容量達 3MB,並保留進出 CPU 的指令和資料。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_07.jpg
Arm Cortex-A725 與 A520 也比之前產品具有更好的電源使用效率
新的 Arm Cortex-A725 CPU 也持續追求效能與效率提升,其效能效率提升 35%,目標鎖定 AI 及手機遊戲等應用。而更新的小核 Arm Cortex-A520 CPU 及 DSU-120,讓採用最新 Armv9 CPU 叢集的消費性裝置,得以提升功耗效率及擴充性。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_06.jpg
Arm Immortalis-G925 GPU 是 Arm 目前性能最強的 GPU
Arm Immortalis-G925 GPU 是 Arm 目前效能及效率最高的繪圖處理器(GPU),在各種頂尖的手機遊戲效能提升 37%,且多種 AI 及機器學習網路效能也提升 34%。此外它的光線追蹤效能提升,在複雜物體上的光線追蹤效能提高達 52%。Immortalis-G925 可應用於旗艦級智慧手機市場,而包括 Arm Mali-G725 和 Mali-G625 GPU 在內的全新高擴展性繪圖處理器系列,則鎖定更廣大的消費性市場,涵蓋高階行動手持裝置、智慧型手錶及 XR 穿戴式裝置。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_09.jpg
Arm 新推出 Arm Kleidi 函式庫讓開發人員更快速推出 AI 相關應用
在新的硬體之外,Arm 也針對全球數百萬開發人員提供可高效快速創建下一波 AI 應用所需的效能、工具和軟體函式庫,特別新推出 Arm Kleidi 函式庫,其中包括針對 AI 工作負載的 KleidiAI 和針對電腦視覺應用的 KleidiCV。
https://p.xfastest.com/~kenny.kuan/2024/20240530C/armcss_10.jpg
KleidiAI 可支援所有 Arm CPU ,並與現行熱門的 AI 框架整合
KleidiAI 是為 AI 框架開發人員設計的運算核心,可無縫存取 Arm CPU 上的最佳效能,適用於各種裝置,並支援 NEON、SVE2 和 SME2 等關鍵 Arm 架構特性。KleidiAI 與現行熱門的 AI 框架整合,例如 PyTorch、TensorFlow 和 MediaPipe,以促進主要模型包括 Meta Llama 3 和 Phi-3的加速。更重要是它還能向前及向後相容,確保Arm 未來導入更多技術時仍能適用,並能獲得更多新功能。
KleidiCV 針對電腦視覺流程最佳化的解決方案,將其整合進 OpenCV 函式庫,可大幅提升效能。Arm 也與 OpenCV.ai 合作,使 Android 開發人員更容易將 OpenCV 納入專案中。
頁:
[1]