NVIDIA Ampere GA100 GPU官方詳解-世界最大的7nm GPU,8192個核心,48GB HBM2(1.6 TB / s)
NVIDIA正式揭開了迄今為止最大,最強大的GPU 7nm Ampere GPU的帷幕。首款採用新型Ampere架構的產品是稱為GA100的GPU,該晶片是目前使用TSMC的7nm製程上生產的最大GPU。Ampere GA100 GPU是迄今為止設計最大的7nm GPU。GPU完全針對HPC市場而設計,支援科學研究,人工智慧,深度神經網路和AI推理等應用。首先NVIDIA將以各種尺寸形式提供NVIDIA Ampere GA100 GPU。從單一的模組卡到全長PCIe 4.0顯示卡尺寸不等。GPU還擁有多種配置,但NVIDIA今天重點介紹的是Tesla G100,它將用於DGX A100和HGX A100系統。
說到核心規格NVIDIA的Ampere GA100 GPU絕對是一個龐然大物。尺寸為826mm2,比Volta GV100 GPU的815mm2還要大。GPU還擁有540億個電晶體管,是其前身的21.1的兩倍多。鑑於管芯尺寸和電晶體管數量,Ampere GA100 GPU是單晶片忠最密集的GPU。
儘管Tesla A100由於早期7nm的成品率而有降低規格,但考慮到這種“超級GPU”的尺寸看起來仍然不錯,但我們首先要看的是擁有全規格版本的NVIDIA Ampere GA100 GPU。
NVIDIA Ampere GA100擁有128個SM和8192個CUDA核心,還擁有我們所見過的最大的單GPU核心數量。它配備了8192個FP32核心,4096個FP64核心和512張量核心。GPU上有8個顯示處理集群,每個集群有16個SM單元和8個TPC。GA100 GPU的Tesla A100型號的TDP為400W。
NVIDIA Ampere GA100 GPU的其他規格包括巨大的6144位元記憶體匯流排,分散在GPU周圍的六個HBM2堆棧中擁有多達48GB的HBM2e記憶體。每個堆棧每個Die擁有2GB VRAM容量,因此要達到48 GB,您將需要4層堆棧。每個4-hi堆棧將由8GB容量和6個堆棧(等於48 GB容量)組成。據稱該記憶體以超過2.0 Gbps的引腳速度執行,這將有約1.6 Tbps的頻寬。
NVIDIA Ampere GPU將配備多種HBM記憶體配置,但最大容量為48 GB,除非NVIDIA將來希望提供6或8hi的版本,這會將記憶體容量提高到72甚至96GB。NVIDIA的Tesla V100S已經將Tesla V100的HBM容量提高了一倍,提供32GB和16GB,因此NVIDIA完全有可能在Tesla A100的未來版本中做到這一點。
講完了NVIDIA Ampere GA100 GPU的規格後,讓我們來談談Tesla A100顯示加速器本身。Tesla A100為Ampere GA100 GPU的簡化版本,可提供108個SM,擁有6912個FP32核心,3456個FP64核心和432個Tensor核心。該卡帶有5120位元記憶體匯流排,最大VRAM容量為40GB HBM2。這很有趣因為40GB HBM2會採用似乎不太可能的5-hi堆棧設計,或者每個堆棧上有缺陷DRAM的6-hi堆棧。
在性能方面NVIDIA Ampere GA100 GPU提供了1個Peta-OP,與Volta GV100 GPU相比增加了20倍。雙精度性能比NVIDIA的Volta GV100 GPU高出2.5倍,後者的最終輸出應該約為19.5 TFLOP FP64,因為Volta擁有大約8 TFLOP FP64計算能力。這意味著單精度性能的額定值超過19.5個標準,並且高達156個TFLOP(FP32),這對於HPC市場來說是令人震驚的。
消息來源
頁:
[1]