為NVIDIA下一代H100加速卡提供支援的GH100晶片,紙面規格已經讓人感到十分驚訝。不過週末曝光的白皮書又讓我們對其有了更深入的了解。據悉NVIDIA正在積極利用台積電的N4(4nm EUV)先進製程來打造Hopper GPU,而H100大晶片更是被六個HBM3高頻寬顯示記憶體堆棧給環繞著。
TechPowerUp指出GH100計算晶片擁有800億個龐大的電晶體管數量,較GA100增加近50%,有趣的是在4nm EUV的加持下GH100的晶片面積卻只有814m㎡,小於採用7nm DUV(N7)製程製造的GA100(826 m㎡)。
由圖可知NVIDIA GH100的結構與上一代類似,主要數學運算部分被佈置到了144組串流處理器(SM)上。GH100擁有18432個FP32(單精度)/ 9216個FP64 (雙精度)CUDA 核心,輔以576個第四代Tensor核心,此外晶片上其中一組GPC有光柵單元。
鑑於GH100有6144-bit的HBM3顯示記憶體頻寬,NVIDIA為其標配80GB VRAM,預計頻寬可超3TB/s(且有ECC加持)。主機接口也迎來了重大升級,且SXM 外形的PCB板上配備了最新一代NVLink界面(有900GB/s的頻寬)。AIC插卡版本則是採用了PCIe 5.0 x16(128 GB/s),且兩者都導入了資源池(resource-pooling)功能。
最後NVIDIA正在用更高的功耗來壓榨更多的性能—— 可知H100的典型功率值為700W,而A100僅為400W 。不過H100並非滿血型號,即使高密度的SXM外形版本,也只啟用了144組SM單元中的132個。PCIe插卡版本更是僅啟用了114個SM單元,且兩者的最高速率都是1.80GHz 。
消息來源 |