NVIDIA下一代GPU架構為Maxwell,最快將在明年Q1季度問世。日前Maxwell的詳細架構也曝光了,其中旗艦GM100將有6144個CUDA核心,512bit位寬顯存,顯存容量達到了更誇張的8GB。
NVIDIA目前一代的顯卡有GK104和GK110兩大分支,它們的側重點不同,但都是基於Kepler(開普勒,天文學家)架構的,下一代架構名為Maxwell(麥克斯韋爾,物理學家),根據之前的傳聞Maxwell最快將在明年Q1季度問世,制程有可能繼續使用TSMC的28nm工藝。現在網上又流傳開Maxwell的架構設計了,旗艦GM100將有6144個CUDA核心,512bit位寬顯存,顯存容量達到了更誇張的8GB。
介紹Maxwell之前最好瞭解一下Kepler架構,相關介紹可以參閱之前的文章:3倍性能從哪裡來,GK110的SMX單元升級3.5代。目前Kepler架構中每組SMX單元有192個CUDA核心,Maxwell的SMX單元將進一步提升CUDA核心數到256個,不過DP雙精度浮點單元的比例會從目前的1:3降低到1:4,算起來DP單元總數是保持不變的。256個CUDA核心的SMX單元將大幅增加Maxwell的CUDA總數,而DP雙精度單元不用時是可以關閉的,這樣也能降低能耗。
紋理單元方面,每組SMX單元會繼續維持16個TMU單元,跟Kepler是一樣的。
Maxwell的緩存設計也會進一步增強,每組SMX單元會額外增加2個寄存器,大量寄存器執行緒現在也可以並行運行了。L1緩存從Kepler架構的64kb增加到了128kb,而且可以作為共用記憶體使用,並且可以32/96、64/64、96/32的比例分配成緩存、共用記憶體。
L1緩存之外,每個GPC單元還會獨享768kb L2緩存作為指令緩存。
具體的四款Maxwell晶片的詳細架構如下所示:
GM110核心
目前的GK104核心有4組GPC單元,GK110是5組GPC單元,而GM110擁有8組GPC單元,每個GPC單元有三組SMX單元,每組SMX單元又有256個CUDA核心,這樣總計有6144個CUDA核心,384個紋理單元,8MB L3緩存,64個ROP單元,512bit顯存位元寬,顯存容量則達到誇張的8GB。
GM100無疑將取代GK110的旗艦地位,同時用於Tesla和GeForce高端產品線,不過這兩個市場的GM100核心也有所不同:GeForce領域中的GM110核心頻率在930MHz左右,加速頻率1GHz左右,而Tesla中的GM110核心頻率約為850MHz,雙精度浮點性能達到了2.61TFLOPS。(作為對比的是GTX Titan目前的單精確度性能是4.5FLOPS,雙精度是1.3TFLOPS)
GM104核心
GM104核心將取代目前的GK104核心,後者的代表產品是GTX 680和GTX 770。
GM104的GPC單元數量降低到5組,擁有3840個CUDA核心,240個TMU紋理單元,40個ROP光柵單元,顯存位元寬降低到320bit,顯存容量3GB,也可能是跟Fermi一樣的2.5GB,不過顯存位元寬降低也使得頻率可以更高,顯存頻率在7GHz左右,核心頻率1GHz左右。
GM106核心
GM106核心將取代目前249美元以內的GK106核心的顯卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。
不過GM106相對來說提升也是非常大的,CUDA核心將從目前的960個暴增到2304個,4MB L3緩存,144個紋理單元,24個ROP單元,顯存位元寬192bit,容量3GB,頻率也能達到7GHz。
GM108核心
GM108之前其實還有GM107核心,目前後者的架構未知,不過驅動資訊中已經有GM107存在的暗示了。
目前的ES樣品顯示GM108有576個CUDA核心,48個紋理單元,8個ROP單元,64bit顯存位寬,核心面積跟GF117差不多。
丹佛計畫將從Maxwell升級版時代開始?
在NVIDIA最神秘的計畫中,Preject Denver丹佛計畫最為引人注目,因為它將整合NVIDIA的GPU和ARM的CPU,有關這個處理器的進度一直沒有明確消息。最新洩露的消息顯示NIVIDIA在Maxwell升級版階(GM11x)段推出丹佛計畫,因為NVIDIA一直在等新的FinFET工藝成熟。這個說法跟NVIDIA在之前的GTC 2013大會上公佈的進度有些相符。
丹佛處理器將整合64位ARM CPU核心,其中只有GM110會搭配8核丹佛處理器,GM110實際上應該被成為GM110 SoC處理器,已經不是單一的GPU或者CPU了。消費級的GM110將有4個CPU核心,整合的GPU則是GM114。整合GM116圖形核心的丹佛則只會搭配2個CPU核心。洩露的報告沒提到GM118核心整合什麼丹佛核心,因此它很可能並不會使用新的架構。
丹佛處理器將有一致性匯流排(coherent link )用於連接CPU和GPU核心,並會在二者之間分配不同負載。爆料者稱NVIDIA認為丹佛計畫及相應的驅動優化會使他們的顯卡比AMD為GCN架構優化的私有Mantle API更強。
目前最重要但是還不能確認的就是這些晶片是否能在2014年上半年發佈,因為TSMC預計在2014年2月份才能量產20nm工藝,而且AMD預計在未來兩個季度內使用14nm FinFET工藝流片新處理器,不過真正發佈要等到2014年底甚至2015年初。這意味著2014年上半年最可能發佈的還是他們的移動晶片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌上出版有可能到2014年下半年才能發佈了。
2016年,NVIDIA會進入Vlota架構時代,根據之前在GTC 2013大會上公佈的官方消息,Volta架構的頻寬可達1TB/s。
|