在昨天的北京GTC大會上,NVIDIA發佈了三款重量級新產品,包括面向AI人工智慧的兩款顯卡——Tesla P40、Tesla P4,還有單晶片系統的Drive PX2自動駕駛平臺。在這其中,Tesla P40使用的是P102大核心,而且是完整版的3840核心,搭配24GB顯存,這也是繼Tesla P100(分為NV Link和PCI-E兩種版本)、Quadro P6000、Titan X顯卡之後第四款GP100/102核心產品了。
NVIDIA發佈面向AI計算的Tesla P40和P4顯卡
NVIDIA的Pascal家族顯卡中旗艦版產品多使用GP100大核心,中高端則使用GP104核心,其中GP100大核心才真正是全新架構,計算性能提升很大,而GP10X核心更多地像是Maxwell架構的16nm工藝版,架構變化並不大,SM單元設計甚至是一樣的。
這次發佈的兩款新卡主要面向AI計算,包括語音啟動的應用、電影及產品搜索推薦等,與單純的CPU加速相比,NVIDIA宣稱他們的GPU加速方案性能、效能是前者的45倍之多。
這次發佈的Tesla P40、Tesla P40顯卡分別使用了GP102、GP104核心,主要取代Maxwell架構的Tesla M40、M4加速卡,具體規格如下:
NVIDIA Tesla P40/P4顯卡主要規格(來源於Anandtech網站)
Tesla P40基於完整版GP100核心,這也是Quadro M6000之後第二款完整版GP100大核心產品,3840個CUDA核心,基礎頻率1303MHz,加速頻率1531MHz,這主要是考慮到被動散熱,NVIDIA降低了GPU頻率。
此外,P40顯卡還有384bit GDDR5位元寬,頻率7.2Gbps,總容量24GB——其實這卡跟面向工作站的Tesla P6000很可能是一樣的,規格基本相似,浮點性能都是12TFLOPS,TDP 250W。
至於Tesla P4,它使用的是GP104核心,跟GTX 1080是一樣的,擁有2560個CUDA核心,不過頻率也低得多,基礎810MHz,加速頻率1063MHz(幾乎只有GTX 1080一半頻率了),配備256bit 8GB顯存,但該卡最大的亮點是TDP只有50-75W,完全不需要輔助供電了。
值得注意的是,Tesla P40、P4顯卡都支援INT8計算,浮點性能分別高達47TFLPS、22TFLOPS,這是Maxwell加速卡不具備的能力。
此外,NVIDIA這次還發佈了單晶片的Drive PX2自動駕駛平臺,今年CES上發佈的Drive PX2使用的是雙路Tegra“Parker”處理器+雙路Pascal顯卡,性能倒是很逆天,不過雙路CPU+GPU也提高了成本,這次的單路Drive PX2直接使用了最新的Tegra SoC處理器,換句話說NVIDIA這次的新品是Drive PX2砍掉了獨顯和一組處理器之後的產物。
單晶片Drive PX2預計今年Q4季度出貨,標準版Drive PX2今天起開始出貨——話說Drive PX2都發佈8個多月了,現在才出貨啊!
資料來源
|