NVIDIA Pascal架構的首款產品為Tesla P100計算卡,採用GP100代號核心晶片組,屬於Pascal旗艦級晶片組,推測頂級顯示卡將會使用同一核心,發表時日也越來越近。
Pascal GP100採用TSMC台積電16nm FinFET製程生產,雖然晶片組面積比起Maxwell GM200大9mm2,但其Transistors電晶體卻多上許多,Pascal GP100 15.3 billion電晶體,而Maxwell GM200電晶體則是8 billion,在製程進步對於核心晶片有了很大的幫助。
完整的Pascal架構具有60個SMs,每個SM內會有64個 CUDA核心,因此總共會有3840個,每個SM內會有64個單精度CUDA核心和32個雙精度CUDA核心,TPCs計算處理群集為30個(每個裡面有兩個SMs),還具有240個紋理單元,具有八個512 bit記憶體控制器,總共4096 bit,且每個記憶體控制器具512KB L2快取,全核心共4096KB L2快取,比起前幾代L2都還大,降低對DRAM的需求來提升整體效能。
從這張比較表可以發現Tesla P100計算卡的GP100核心僅開啟56個SMs,並非完整開啟60 SMs,因此總CUDA核心為3584個,紋理單元為224個,核心頻率1382MHz,Boost頻率1480MHz,使用4096 bit HBM2記憶體傳輸介面,記憶體容量16GB,TDP為300W。
作為計算卡,這張Tesla P100擁有10600 GFLOPs單精度運算能力,具有5300 GFLOPs雙精度運算能力,從表上看來效能高出前兩代許多。 |
組圖打開中,請稍候......
|