採用Alchemist Xe-HPG GPU的Intel ARC顯示卡將於明年推出,根據規格我們可能會看到與AMD和NVIDIA GPU相比非常有競爭力的性能數據。
首批Intel ARC顯示卡將由採用Xe-HPG架構的Alchemist GPU提供動力。到目前為止Intel已確認首批獨立顯示卡將於2022 年第一季上市,並將採用TSMC 6nm製程。Intel還詳細介紹了Alchemist GPU和包括Xe-Core在內的核心打造的規格。
因此根據曝光的資料,Xe-HPG Alchemist GPU擁有Xe-Core,這是第一代ARC產品線的基本DNA。Xe-Core是一個Compute Block,由16個Vector Engines(每個引擎256位元)和16個Matrix Engines(每個引擎1024位元)組成。每個Vector Engines由8個ALU組成,因此我們預計每個Xe-Core總共有128個ALU。每個Matrix Engines也稱為XMX block,它將在FP16和INT8模式下處理Tensor操作。Xe-Core還有自己的專用L1快取。
Intel將四個Xe-Core融合在一起形成一個Render Slice,它由4個光線追踪單元、四個採樣器單元、幾何/光柵化/HiZ引擎和兩個Pixel Backend組成,每個塊上有8個單元。這些渲染切片組合在一起形成主GPU。旗艦由8個渲染切片配置組成,擁有32個Xe 核心、512個Vector Engines和4096個ALU。2、4、6個渲染切片會有不同的配置,但本篇會專注於旗艦部分。
3DCenter對規格和比較進行了簡要介紹,這讓我們對Intel的新GPU必須提供的理論性能有所了解。因此Intel的ARC Xe-HPG Alchemist旗艦產品將立即提供比 NVIDIA和AMD競爭對手更多的TMU和ROP。4096的核心數高於AMD的Navi 22、Navi 21 (RX 6800),但低於NVIDIA的GA104。NVIDIA使用的是雙FP32編號方法,理論上應該是3072。
Intel的ARC Alchemist GPU的光線追踪單元比競爭對手的要少,但我們並不確切知道他們的光線追踪實現是如何工作的。例如雖然Navi 22提供比GA106 Ampere GPU更多的RT核心,但NVIDIA的RT核心中的硬體整合在所有方面都優於AMD。因此最終的性能將取決於Intel針對光線追踪應用的硬體整合和軟體優化。
Intel在競爭中的一個主要領先優勢,尤其是NVIDIA,因為AMD在這個部門缺乏,是人工智慧在超級採樣技術方面的幫助。Intel已經展示了其XeSS技術的令人印象深刻的展示,並且有預期的數字,Intel GPU的XMX架構可以勝過NVIDIA的Tensor Core 實現 (DLSS)。預計Intel還將在其GPU上配備一個小而有用的遊戲快取,並將在256位元記憶體匯流排上配備高達16GB (GDDR6) 的更高VRAM容量。這將是NVIDIA的RTX 3070和RTX 3070 Ti 的兩倍,因此他們可能不得不准備更新其產品以應對它。
最後理論FP32計算性能是在2GHz的時脈速率下計算的。考慮到TSMC 7nm製程上的時脈擴展能力,這是TSMC 6nm製程最有可能的情況。因為如此Intel Xe-HPG Alchemist GPU可以提供大約16-17 TFLOPs的計算能力。這比NVIDIA的GA104產生的FLOP略低,但應注意並非所有FLOP都應同等測量,因為與數據中心晶片相比,遊戲架構的執行方式大不相同。
因這些早期規格,這款Intel顯示卡,它最終可以輕鬆地比AMD的Radeon RX 6700 XT和NVIDIA 的 RTX 3070更快。為了將其第一代顯示卡進一步推向消費領域,Intel可能會提供與AMD和NVIDIA等老牌龍頭相比極具競爭力的價格。再加上一套強大的軟體優化,他們可能會實現雙贏。
消息來源 |