NVIDIA分享Blackwell GPU運算統計資料:FP64比Hopper高30%,類比和科學速度快30倍,比CPU快18倍
NVIDIA分享了其下一代Blackwell GPU架構的更多效能統計數據,該架構已席捲業界。該公司分享了多項指標,包括使用Grace驅動的Superchip模組時與即將推出的Hopper晶片和競爭對手的x86 CPU相比的科學、人工智慧和模擬結果。在一篇新的部落格文章中,NVIDIA分享了Blackwell GPU將如何為研究領域提高更多效能,其中包括量子運算、藥物發現、聚變能源、採用物理的模擬、科學計算等。當該架構最初在GTC 2024上宣佈時該公司展示了一些大數據,但我們尚未正確了解該架構本身。
從細節開始,NVIDIA Blackwell GPU架構的最大目標之一是降低成本和能源需求。 NVIDIA表示Blackwell平台可以以降低200倍的成本和減少300倍的能源來模擬天氣模式,而運行涵蓋整個地球的數位孿生模擬則可以將成本降低65倍,能源減少58倍。
NVIDIA也展示了其Blackwell GPU的雙精確度FP64(浮點)功能,其額定TFLOP比Hopper高出 30%。單一Hopper H100 GPU提供約34 TFLOP的FP64運算效能,單一Blackwell B100 GPU提供約45 TFLOP的運算效能。 Blackwell主要採用GB200 Superchip,其中包含兩台GPU和Grace CPU,因此FP64運算能力約為 90 TFLOP。 AMD MI300X和MI300A Instinct加速器採用單Die,在單Die上提供81.7和61.3 TFLOP的FP64功能。
雖然NVIDIA的Blackwell GPU在傳統的密集浮點效能方面有所退步,但這並不會削弱其運算能力。該公司首先展示了Cadence SpectreX模擬中的模擬性能,與 ASIC和傳統CPU相比,該模擬在Blackwell GB200上的運行速度提高了13倍,CFD(計算流體動力學)提高了22倍。該晶片也比A100和Grace Hopper (GH200) 系統快很多。
NVIDIA再次為我們帶來AI效能,其Blackwell GB200 GPU平台再次佔據主導地位,其GPT(1.8兆參數)比H100提高了30倍。 GB200 NVL72平台可將吞吐量提高30倍,同時實現能源效率提高25倍和TCO(總營運成本)降低25倍。即使將GB200 NVL72系統與72 x86 CPU進行比較,Blackwell系統的增益也將達到18倍,資料庫連接查詢的增益也將比GH200 NVL72系統的增益提高3.27倍。
隨著圍繞Blackwell GPU的所有討論,人們應該預料到每個人都會忘記Hopper,但事實並非如此。 NVIDIA Grace Hopper GH200超級晶片GPU平台目前仍然是 AI領域無可爭議的王者,目前為全球9台不同的超級電腦提供支援,綜合運算能力為200 Exaflops,實現每秒200百億次運算的AI效能。
NVIDIA的GPU是目前日益增長的人工智慧需求的首選產品,而且這種趨勢似乎不會停止。分析師指出NVIDIA將成為整個2024年的主導力量,一旦Blackwell可供客戶使用,我們就可以預期它將在AI領域和NVIDIA自己的收入中迎來創紀錄的性能水平。但NVIDIA不會很快停下來,該公司預計最快將於2025年底開始生產下一代Rubin R100 GPU。
消息來源
頁:
[1]