Intel的Xe2已正式發布,並將應用於Lunar Lake CPU和代號為Battlemage的下一代Arc獨立顯示卡系列。
在ITT 2024上Intel粉碎了有關取消或延遲推出GPU和Arc產品線的所有謠言。 Tom Petersen在活動期間做了最激烈的演講之一,主要圍繞著下一代Xe2架構。從細節開始,Intel正在讓事情變得更簡單,該公司沒有使用LP、LPG、HP和HPG命名方案,而是簡單地將其下一代產品線稱為Xe2。在內部這些晶片仍將有這些代號,但不再用於客戶端。
Intel Xe2的一些目標是實現更高的利用率、改進的工作分配和更少的軟體。這是一個從頭開始的設計,解決了Xe Alchemist GPU中注意到的幾個主要問題。Intel立即以IP效能效率圖表讓觀眾驚嘆不已,該圖表顯示高達12.5倍的增益,這是相當顯著的,我們深入探討什麼是Xe2以及Intel如何實現這些增益。
Intel表示Xe2架構與Xe一樣,有高度可擴展性,這將導致其整合到低功耗行動SOC(例如Lunar Lake)以及稍後推出的高階Arc顯示卡中。
因此開始我們的深入研究,第二代Xe核心配備了多個運算資源,這些資源被重新分配到本機SIMD16引擎中以提高效率。
Xe2核心特性:
- 8 512-bit Vector Engines
- 8 2048-bit XMX Engines
- 64b atomic ops support
- 192KB Shared L1$/SLM
向量引擎也已更新,其中包括:
- SIMD16 native ALUs - Support for SIMD16 and SIMD32 ops
- Xe Matrix Extensions (Support for INT2, INT4, INT8, FP16, BF16)
- Extended Math & FP64 - Transcendentals: SIN, COS, LOG, EXP
- 3-way co-issue - FP + INT/EM + XMX
Xe Matrix Engines或稱XMX單元也出現在Alchemist Xe GPU 上,但現在發生的變化是它們支援更多資料類型,並且運行速度更快,FP16額定為2048 OPS/時脈,INT8額定為4096 OPS/時脈。
排除這兩個因素後,讓我們看看這些新引擎如何在Xe2渲染切片(Xe2 GPU的基本區塊)中堆疊。這些渲染切片可以根據需要進行堆疊和縮放,並進行最佳化以減少延遲、消除停頓並改善硬體/軟體。這些渲染切片連接到本身支援間接執行的命令前端。
Xe2核心的一個主要模組是其RTU(光線追蹤單元),其有3個管道、18個框交叉點(每個Box交叉點6個、每個RTU 3個框)和2個三角形交叉點。
總體而言Intel的Xe2 GPU架構旨在更相容於遊戲並實現更高的利用率。遊戲使用新的Execute Indirect區塊來加速繪製調用,並獲得12.5倍的跳躍速度,這對遊戲玩家來說是個好兆頭,因為它被虛幻引擎等引擎大量使用。
第一個採用Xe2 GPU的產品是Lunar Lake,它採用整合配置。 Lunar Lake中的多個模組與GPU相關聯,例如媒體引擎和顯示引擎。
Xe2是一個全新的顯示架構,它將為Lunar Lake等整合解決方案和即將推出的Arc Battlemage系列的獨立選項帶來了巨大的性能改進、最新的功能集以及更多功能。該公司將在今年稍後分享更多有關Battlemage獨立顯示卡產品的資訊。
消息來源 |