昨晚NVIDIA發布了7nm Ampere GPU,首發的是Tesla A100加速卡,製程及架構全面升級。不過有一點大家可能猜到了,6912個CUDA核心的Tesla A100並不是完整版的,NVIDIA依然在首發產品了留了一刀。
之前的架構解析中Tesla A100加速卡目前所用的核心有6912個CUDA核心,算下來是108組SMX單元,儘管現在的6912個CUDA核心相比GV100的5120個CUDA核心已經提升了35%,但它依然不是GA100大核心的完整體,這差不多也是NVIDIA每次發布新卡的保留節目了,首發產品要割一刀。
從官方給出的結構來看GA100核心完整版是128組SMX單元,也就是8192個CUDA核心,比現在差不多要多出15-20%的規模,後續的潛力很大。至於為什麼首發的Tesla A100核心這麼保守,可能是NVIDIA希望後續再出更高階的產品,也有可能跟現在的產品功耗已經達到400W有關,為此頻率都降低到了1400MHz了,比GV100核心的1.5- 1.6GHz還要低。
完整版的GA100大核心不知道什麼時候解鎖,後續優化了功耗之後,GA100大核心的性能恐怕要再上一層樓了,big Navi大核心不知道能不能追上了。
消息來源
|