與Hopper相比,NVIDIA的Blackwell B200 GPU採用了全新的架構,但功耗幾乎是Hopper的兩倍。
當NVIDIA CEO黃仁勳在GTC 2024主題演講期間宣布Blackwell時,該揭露缺乏大量技術和架構資訊。但在接下來幾天的GTC中NVIDIA分享了更多細節,但仍然沒有深入探討我們都在等待的技術深入。Jonah Albe(NVIDIA資深副總裁兼GPU架構師)和Ian Buck(NVIDIA超大規模與HPC副總裁)透露了新的細節。
首先我們都知道Blackwell將是Hopper的重大架構升級,而Jonah表示Blackwel 使用與Hopper完全不同的微架構,看起來還不止於此。我們對Blackwell的了解是它採用了第二代Transformer Engine技術,增加了FP4和FP6計算格式。這些格式和新的軟體優化使Blackwell成為地球上同類中最快的AI晶片,但這對其標準 FP64 計算造成了影響,與Hopper相比,該計算僅增加了32%。原因很簡單,Blackwell首先是人工智慧晶片,這是它的主要目標市場。從人工智慧的角度來看,FP64並不那麼重要,越低,推理和訓練能力就越快。
此外走小晶片(MCM)路線的原因恰好是需要提高整體效能,而不是提高良率。看看NVIDIA的第一個MCM方法如何在該領域發揮作用將會很有趣,因為我們正在討論在同一軟體上運行的兩個GPU。據說CUDA在處理兩個GPU和不同的架構方面做得相當好,不需要程式設計師進行重大更改。
在發布期間圍繞所有Blackwell GPU和平台出現了特別大的混亂。Jensen表示Blackwell不是GPU,而是一個完整的平台,該平台擁有一系列產品,但它們仍然採用GPU。截至目前NVIDIA已發布了三種官方Blackwell GPU。
其中包括GB200 Superchip平台所使用的旗艦全規格B200 。該晶片擁有最高評級的運算能力,最大TDP為1200W。這比有700W TDP的Hopper H100高出500 W。整個Superchip配備了兩個B200 GPU和一個Grace CPU,功率高達2700W(B200為1200W x 2 + 300W CPU/IO)。
接下來是DGX和HGX平台使用的Blackwell B200,它在1000W左右進行了優化,提供了全規格版本的近90%的性能。目前尚不清楚該版本是否僅有較低的TDP,或與完整配置相比有縮減的規格。最後還有Blackwell B100,它是經過進一步調整的版本,TDP為700W。該版本的性能約為B200 (1000W) 的80%和B200 (1200W) 的70%。
可能會出現單Die Blackwell GPU版本,特別是對於未來的PCIe平台。Blackwell GPU架構已納入消費級RTX和AI平台,例如Drive Thor和未來的GeForce系列。NVIDIA的Blackwell GB200 GPU將於今年稍晚開始向第一批主要AI客戶發貨,隨後銷量將會增加。
消息來源 |