NVIDIA Blackwell GB202遊戲GPU採用台積電4NP製程,大幅提升快取和SM吞吐量
NVIDIA剛剛發布了用於AI的Blackwell GPU,但現在人們的目光都集中在其遊戲產品上,據傳這些產品也採用了相同的台積電4NP製程。先前預計NVIDIA將在遊戲晶片中採用台積電3nm製程,但這項計畫似乎已經改變,因為Kopite7kimi現在表示Blackwell AI Tensor Core和遊戲GPU將在非常相似的製程上製造。就在幾個小時前我們得知NVIDIA將使用台積電的4NP製程,這是已用於Ada Lovelace和Hopper GPU的5nm製程的版本。
據稱新的製程將使電晶體密度增加30%,從而帶來更高的效能增益,但實際的效率優勢仍有待解釋。台積電並未在其網頁上的任何地方明確說明4NP製程。他們只提到了N4P,它也被稱為N5平台的擴展,比N5效能提升11%,比N4提升6%。
我們知道Ada GPU之前使用的4N製程只是N5(5nm),透過一些NVIDIA專有的最佳化進行了偽裝。NVIDIA也透露它已與台積電和Synopsys合作,利用改變遊戲規則的CuLitho技術,確保這些新一代Blackwell AI Tensor & Gaming GPU的生產和製造順利進行,以便按時交付給客戶。除了處理製程之外,NVIDIA預計還將在 L1快取方面帶來一些巨大的收益。據稱Blackwell旗艦遊戲GPU GB202相對於AD102和GA102將有顯著改進,從而提高SM吞吐量。Kopite7kimi早些時候也透露了 Blackwell GB202 Gaming GPU的配置。
他表示該晶片將提供12個GPC,每個GPC 8個TPC,總共96個TPC,如果我們考慮到Ada結構,假設有128個FP32,我們可以預期多達192個SM或24,567個CUDA 核心每個SM的核心數。這將比迄今尚未發布的完整AD102 GPU多出33%的CUDA核心。
他也提到Blackwell Gaming GPU系列中的下一款GB203 GPU將是GB202的一半,類似AD102和AD103 GPU。如果NVIDIA接下來的90系列卡配備GB202,而80系列卡配備GB203,這將導致效能上的巨大差距。最大的問題是NVIDIA是否會為其Blackwell遊戲GPU使用 MCM(多晶片模組)封裝,還是暫時保持它們的單Die封裝。考慮到與GPU/晶片開發相關的成本和產量問題不斷增加,chiplet路線確實是未來的發展方向,AMD的Radeon部門已經接受了它。
消息來源
頁:
[1]