高通Snapdragon 處理器一直擁有極其強大的GPU性能,常被調侃為買GPU送CPU,但官方對於GPU架構的技術細節一直諱莫如深,每次只說支持XX技術、性能提升XX。到了最新的Snapdragon X Elite/Plus系列處理器上,或許是為了更好地對決Intel、AMD,高通空前大方地公開了Adreno X1 GPU的細節,頂級型號為Adreno X1-85。
Adreno X1是專門針對Windows PC設計的,圖形介面完整支援DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驅動支援。FP32單精度浮點性能最高4.6TFlops,畫素填充率最高72Gp/s。
如此詳細的架構圖對於高通GPU來說似乎還是第一次,可以看到分為6個著色處理器(SP),整體共計1536個FP32 ALU,可以通俗地表達為1536個核心,最高頻率1.5GHz 。粗暴地按照核心數計算,這相當於GTX 1660 Ti,或者說三個Arc A770,或者說四分之三個RX 7600。
渲染前端模組支援每時脈週期2個三角形和光柵化處理、雙向LRZ(地解析度深度測試)、基於影像的可變著色率(VSR Tie2)。還有專門用於分箱(binning)的前端模組,與渲染同步運作。6個SP對應6個渲染後端,每時脈週期最多48個像素、96個fragment(用於MSAA抗鋸齒)。另外還有GMU,也就是GPU管理單元,完整支援虛擬化(最多8個虛擬機),還有電源管理的功能。
細看SP部分,也就是SIMD著色處理器,屬於核心執行模組,分為兩個uSPTP(微型著色與紋理管線)。整個SP分佈著256個FP32 ALU(單精度浮點算術邏輯單元),支援FP32/16、INT32/16、BF16資料型,支援DP4ACC指令(四路INT8點積),以及512個FP16 ALU(半精確度浮點算術邏輯單元),支援FP16、INT16、BF16資料型別。
此外還有32個32位元EFU(基本功能單元)、384KB GPR(通用暫存器)、指令快取、本地緩衝、載入/儲存單元、紋理管線和紋理快取、GMEM單元等等。
GPU內還整合了384KB叢集快取(每兩個SP共享128KB)、1MB一體化L2快取、6MB系統級快取(即L3快取),還有一些其他較小的快取,用於著色器指令、本地紋理資料等。
GMEM是特殊功能單元,也就是高頻寬的本地GPU顯示記憶體,容量3MB,頻寬達2TB/s,與系統記憶體完全非同步。而且它不僅僅是緩存,還可以全部或部分靈活地用於色彩與景深快取、通用本地記憶體,無論是圖形渲染還是通用計算都可以使用。它可以讓GPU大幅減少對系統記憶體的依賴,降低對延遲和頻寬的需求,還有超高的效能與能源效率。
FlexRender彈性渲染技術也值得一提,可以由驅動控制,針對每個不同的表面動態切換不同的渲染模式,提升效能的同時盡可能降低功耗。具體分為三種模式:
- 一是Direct Mode,PC標準渲染方式,相容性最好。
- 二是Binned Mode,將每一幀畫面切割成不同的區塊(Tile),每一個都會進入GMEM,可盡量減少資料移動,提高能源效率。
- 三是Bined Direct Mode,前述兩種方式的混合。
軟體方面,高通承諾每月升級GPU驅動,Adreno控制面板可調節效能和各項功能,而在相容性方面已經是數百款流行的Windows應用,已測試的遊戲均可查詢,還有豐富的開發工具。
高通聲稱Adreno X1對比Core Ultra的Arc核心顯示,同等功耗下性能領先最多67%,同等行下功耗低最多62%!對比Ryzen 9 7040系列中的Radeon 780M更是性能、能源效率都遙遙領先。
在流行的3A遊戲中官方列出了9款,都基本持平或優於Intel Arc核心顯示。
消息來源 |