NVIDIA推出了GA100 GPU,這是他們的第一個,也是採用下一代Ampere GPU架構的世界上最大的7nm晶片。Ampere的性能是其上一代Volta GPU的20倍,開創了高性能計算的新紀元,它是世界上第一個為AI/DNN提供的峰值計算能力超過每秒1 Peta-Ops的GPU。
借助下一代Ampere GPU架構,Tesla A100對於HPC市場來說是令人印象深刻的產品。我們必須談論的任何HPC GPU的第一件事就是它的規格,而Ampere則是晶片中的龐然大物。NVIDIA全力以赴採用7nm製程,使GA100成為生產中最大的7nm晶片,但這還不是全部,它還是目前業界最先進的功能性晶片。
Ampere GA100 GPU再次採用尖端的7nm製程,並且內部裝有540億個電晶體管。預計該晶片將封裝128個SM單元,相當於總共8192個CUDA核心。僅此一項核心總數便增加了50%。對於記憶體,我們可以看到六個HBM堆棧,這些堆棧擁有6144位元記憶體匯流排。記憶體肯定來自三星,因為三星是NVIDIA以HPC為中心的GPU的戰略記憶體合作夥伴。
在性能方面Ampere GA100 GPU提供了1個Peta-OP,比Volta GV100 GPU高出20倍。雙精度性能比NVIDIA的Volta GV100 GPU高出2.5倍,後者的最終精度應約為20個TFLOP FP64,因為Volta擁有大約8個TFLOP FP64計算能力。這意味著單精度性能的額定值超過40個TFLOP(FP32),這對於HPC市場而言是驚人的。
NVIDIA的Ampere GA100還擁有一個新的Tensor操作計算指標,稱為Tensor Float 32或TF32,它採用第三代Tensor Core,提供了更高的AI/DNN核心輸出。Tensor核心本身還支援雙精度計算,這使GA100 GPU的性能比其前代產品提高了2.5倍。
最終NVIDIA將發布其下一代DGX-A100系統,該系統幾天前由Jensen Huang曝光過。DGX-A100擁有六個採用Ampere的Tesla A100 GPU將提供5 Petaflops的峰值性能。
該系統本身比以前採用NVIDIA Volta GPU架構的DGX快20倍。參考集群設計擁有140個DGX-A100 GPU和200 Gbps Mellanox Infiniband互連。整個系統的起價為199,000美元,今天開始發貨。
消息來源
|