Arm的新款Cortex-A320是其首款採用先進Armv9架構的超高效CPU,專用於滿足物聯網和人工智慧應用的需求。該處理器透過多種微架構優化,以及狹窄的獲取和解碼資料路徑、密集儲存的L1快取和減少連接埠的整數暫存器文件,與Cortex-A520相比實現了50%以上的效率。與其前代產品Cortex-A35相比,它還透過高效的分支預測器、預取器和記憶體系統改進,實現了30%的標量效能提升。
Cortex-A320是單發射、有序CPU,有32位元指令擷取和8級管線。該處理器透過支援單核心到四核配置提供了可擴展性。它有DSU-120T,這是一種精簡的 DynamIQ共享單元 (DSU),可支援僅限Cortex-A320的叢集。 Cortex-A320支援高達64KB L1快取和高達512KB L2,並有256位元AMBA5 AXI界面以連接外部記憶體。 L2快取和L2 TLB可以在Cortex-A320 CPU之間共用。實現NEON和SVE2 SIMD(單指令多資料)技術的向量處理單元既可以在單核心複合體中私有,也可以在雙核心或四核心實現中在核心之間共享。
Cortex-A320不僅瞄準物聯網市場,還瞄準人工智慧領域,它透過在NEON和SVE2向量處理中整合Armv9架構改進來實現這一目標。與Cortex-A35相比,該處理器的ML處理能力提高了10倍,與廣泛使用的Cortex-A53相比,ML整體效能提高了6倍。 Arm Cortex-A320支援BF16等新資料類型以及增強的點積和矩陣乘法指令,使其成為ML應用中最高效的Cortex-A CPU。
消息來源
|