NVIDIA今年會推出新一代Pascal顯示卡,最快4月份的GTC 2016大會上就能見到針對高性能伺服器市場的Tesla版GP100 核心顯示卡。只不過NVIDIA這次的保密工作做到太好了,除了官方公佈過的3D顯示記憶體、FinFET製程之外,Pascal顯示卡的規格還是非常神秘。還好NVIDIA功虧一簣,日前曝光的一份文件中顯示Pascal顯示卡配備的3D顯示記憶體頻寬高達1024GB/s,單精度浮點性能12TFLOPS,雙精度浮點性能4TFLOPS,是GK110核心的三倍之多。
3DCenter論壇有網友找到了NVIDIA公司CUDA院士Manuel Ujaldon去年6月份發布的一份演講文件,他本身也是西班牙大學教授,這份文檔裡對比了Intel、AMD及NVIDIA公司不同處理器、顯示卡的頻寬及計算性能,我們來看最關鍵的Pascal與Teslak K20X的對比。
K20X使用的是GK110核心,14組SMX單元,2688個CUDA核心,384bit記憶體頻寬,頻寬25GB/s,單精度浮點性能3.95TFLOPS,雙精度浮點性能1.31TFLOPS。Pascal顯示卡規格沒提,但應該是GP100核心,配備3D顯示記憶體,頻寬1024GB/s,單精度浮點性能12TFLOPS,雙精度浮點性能4TFLOPS。
GK110與Pascal之間隔了Maxwell架構,不過Maxwell顯示卡之所以高效,很大一部分原因是閹割了雙精度單元,所以在這一點上它實際上連GK110核心都不如,這可能是GM200核心沒有加入對比的原因。只看GK110與Pascal的GP100核心,GP100的性能是GK110核心的三倍,單精度及雙精度差不多都是這樣。雖然缺少與GM200核心的直接對比,但GM200核心的Tesla M40單精度性能是7TFLOPS,以此計算的話GP100性能依然是GM200核心的1.7倍,也就是性能提升了70%。
消息來源 |