NVIDIA Ampere GA100 GPU官方詳解-世界最大的7nm GPU，8192個核心，48GB HBM2（1.6 TB / s）

sxs112.tw 發表於 2020-5-15 00:18:16

NVIDIA Ampere GA100 GPU官方詳解-世界最大的7nm GPU，8192個核心，48GB HBM2（1.6 TB / s）

NVIDIA正式揭開了迄今為止最大，最強大的GPU 7nm Ampere GPU的帷幕。首款採用新型Ampere架構的產品是稱為GA100的GPU，該晶片是目前使用TSMC的7nm製程上生產的最大GPU。

Ampere GA100 GPU是迄今為止設計最大的7nm GPU。GPU完全針對HPC市場而設計，支援科學研究，人工智慧，深度神經網路和AI推理等應用。首先NVIDIA將以各種尺寸形式提供NVIDIA Ampere GA100 GPU。從單一的模組卡到全長PCIe 4.0顯示卡尺寸不等。GPU還擁有多種配置，但NVIDIA今天重點介紹的是Tesla G100，它將用於DGX A100和HGX A100系統。

說到核心規格NVIDIA的Ampere GA100 GPU絕對是一個龐然大物。尺寸為826mm2，比Volta GV100 GPU的815mm2還要大。GPU還擁有540億個電晶體管，是其前身的21.1的兩倍多。鑑於管芯尺寸和電晶體管數量，Ampere GA100 GPU是單晶片忠最密集的GPU。

儘管Tesla A100由於早期7nm的成品率而有降低規格，但考慮到這種“超級GPU”的尺寸看起來仍然不錯，但我們首先要看的是擁有全規格版本的NVIDIA Ampere GA100 GPU。

NVIDIA Ampere GA100擁有128個SM和8192個CUDA核心，還擁有我們所見過的最大的單GPU核心數量。它配備了8192個FP32核心，4096個FP64核心和512張量核心。GPU上有8個顯示處理集群，每個集群有16個SM單元和8個TPC。GA100 GPU的Tesla A100型號的TDP為400W。

NVIDIA Ampere GA100 GPU的其他規格包括巨大的6144位元記憶體匯流排，分散在GPU周圍的六個HBM2堆棧中擁有多達48GB的HBM2e記憶體。每個堆棧每個Die擁有2GB VRAM容量，因此要達到48 GB，您將需要4層堆棧。每個4-hi堆棧將由8GB容量和6個堆棧（等於48 GB容量）組成。據稱該記憶體以超過2.0 Gbps的引腳速度執行，這將有約1.6 Tbps的頻寬。

NVIDIA Ampere GPU將配備多種HBM記憶體配置，但最大容量為48 GB，除非NVIDIA將來希望提供6或8hi的版本，這會將記憶體容量提高到72甚至96GB。NVIDIA的Tesla V100S已經將Tesla V100的HBM容量提高了一倍，提供32GB和16GB，因此NVIDIA完全有可能在Tesla A100的未來版本中做到這一點。

講完了NVIDIA Ampere GA100 GPU的規格後，讓我們來談談Tesla A100顯示加速器本身。Tesla A100為Ampere GA100 GPU的簡化版本，可提供108個SM，擁有6912個FP32核心，3456個FP64核心和432個Tensor核心。該卡帶有5120位元記憶體匯流排，最大VRAM容量為40GB HBM2。這很有趣因為40GB HBM2會採用似乎不太可能的5-hi堆棧設計，或者每個堆棧上有缺陷DRAM的6-hi堆棧。

在性能方面NVIDIA Ampere GA100 GPU提供了1個Peta-OP，與Volta GV100 GPU相比增加了20倍。雙精度性能比NVIDIA的Volta GV100 GPU高出2.5倍，後者的最終輸出應該約為19.5 TFLOP FP64，因為Volta擁有大約8 TFLOP FP64計算能力。這意味著單精度性能的額定值超過19.5個標準，並且高達156個TFLOP（FP32），這對於HPC市場來說是令人震驚的。

消息來源

頁: [1]

XFastest 最夯的電腦領域's Archiver

NVIDIA Ampere GA100 GPU官方詳解-世界最大的7nm GPU，8192個核心，48GB HBM2（1.6 TB / s）