NVIDIA針對中國的H20 Hopper GPU已經經過測試,其核心數比頂級H100配置少41%。
去年有報告指出NVIDIA正在為中國準備符合出口標準的 PU,以滿足該地區不斷增長的人工智慧需求。該公司終於在2月開始接受這些晶片的訂單,據透露這種精簡版的價格約為每片12,000美元。現在透過一次綜合測試就可以看出晶片的精簡程度以及它提供的性能。
根據官方介紹NVIDIA Hopper H20 GPU專為HGX平台設計,配備96GB HBM3,可提供4.0TB/s的頻寬,而頂級解決方案提供的頻寬為8TB/s。該晶片有296 TFLOPS的INT8、148 TFLOPS的FP16、74 TFLOPS的TF32、44 TFLOPS的FP32和1 TFLOPS的FP64性能。其他規格包括支援多達7個多執行個體GPU、每個晶片60 MB L2、8路HGX配置、900GB/s的NVLINK頻寬和400W TDP。
NVIDIA從未透露過GPU核心數量,但根據最近的Geekbench 6測試,看起來我們終於知道了該晶片必須提供什麼。數據顯示NVIDIA針對中國的Hopper H20 AI GPU僅配備了78個SM,而H100 GPU共有144個SM。因此與中國以外的其他國家都可以使用的頂級晶片相比,核心數量已經減少了41%。此外GPU配備96GB HBM3,這是原始80GB HBM3型號的升級,但較新的H100配置有144GB HBM3e。
至於效能方面,NVIDIA H20 Hopper GPU在Geekbench 6 OpenCL測試中得分為248,992分,雖然GPU最初是為AI應用程式而設計的,但這也給我們暗示了效能下降的地方。 H100 80GB配置在同一測試中提供約280K分,而132 SM版本提供高達350K分。 H100 144GB配置應該會提供更高的效能,這也讓您可以了解 NVIDIA必須降級多少才能滿足美國法規。
儘管NVIDIA H20 Hopper GPU有精簡,但中國客戶似乎正在排隊購買這些解決方案。最近有報導稱儘管受到H20等符合出口標準的晶片的限制,NVIDIA的營收仍有望達到120億美元,原因是華為等國內AI晶片製造商無法跟上不斷增長的人工智慧需求。
據稱中國國內的人工智慧需求龐大,華為無法滿足每位客戶的訂單,這使得科技龍頭紛紛尋找像NVIDIA這樣的替代方案。據稱NVIDIA H20 AI GPU是一個大幅縮減的版本,但仍然比本地AI技術競爭對手提供更好的性能和軟體支援,因此這對NVIDIA團隊來說是雙贏的。
消息來源
|