Maxwell架構曝光：6144個CUDA核心，8GB顯存，512位寬

wu.hn8401 · 發表於 2013-10-23 11:42:42

　　NVIDIA下一代GPU架構為Maxwell，最快將在明年Q1季度問世。日前Maxwell的詳細架構也曝光了，其中旗艦GM100將有6144個CUDA核心，512bit位寬顯存，顯存容量達到了更誇張的8GB。
　　NVIDIA目前一代的顯卡有GK104和GK110兩大分支，它們的側重點不同，但都是基於Kepler（開普勒，天文學家）架構的，下一代架構名為Maxwell（麥克斯韋爾，物理學家），根據之前的傳聞Maxwell最快將在明年Q1季度問世，制程有可能繼續使用TSMC的28nm工藝。現在網上又流傳開Maxwell的架構設計了，旗艦GM100將有6144個CUDA核心，512bit位寬顯存，顯存容量達到了更誇張的8GB。

　　介紹Maxwell之前最好瞭解一下Kepler架構，相關介紹可以參閱之前的文章：3倍性能從哪裡來，GK110的SMX單元升級3.5代。目前Kepler架構中每組SMX單元有192個CUDA核心，Maxwell的SMX單元將進一步提升CUDA核心數到256個，不過DP雙精度浮點單元的比例會從目前的1：3降低到1：4，算起來DP單元總數是保持不變的。256個CUDA核心的SMX單元將大幅增加Maxwell的CUDA總數，而DP雙精度單元不用時是可以關閉的，這樣也能降低能耗。
　　紋理單元方面，每組SMX單元會繼續維持16個TMU單元，跟Kepler是一樣的。
　　Maxwell的緩存設計也會進一步增強，每組SMX單元會額外增加2個寄存器，大量寄存器執行緒現在也可以並行運行了。L1緩存從Kepler架構的64kb增加到了128kb，而且可以作為共用記憶體使用，並且可以32/96、64/64、96/32的比例分配成緩存、共用記憶體。
　　L1緩存之外，每個GPC單元還會獨享768kb L2緩存作為指令緩存。
　　具體的四款Maxwell晶片的詳細架構如下所示：
GM110核心
　　目前的GK104核心有4組GPC單元，GK110是5組GPC單元，而GM110擁有8組GPC單元，每個GPC單元有三組SMX單元，每組SMX單元又有256個CUDA核心，這樣總計有6144個CUDA核心，384個紋理單元，8MB L3緩存，64個ROP單元，512bit顯存位元寬，顯存容量則達到誇張的8GB。
　　GM100無疑將取代GK110的旗艦地位，同時用於Tesla和GeForce高端產品線，不過這兩個市場的GM100核心也有所不同：GeForce領域中的GM110核心頻率在930MHz左右，加速頻率1GHz左右，而Tesla中的GM110核心頻率約為850MHz，雙精度浮點性能達到了2.61TFLOPS。（作為對比的是GTX Titan目前的單精確度性能是4.5FLOPS，雙精度是1.3TFLOPS）
GM104核心
　　GM104核心將取代目前的GK104核心，後者的代表產品是GTX 680和GTX 770。
　　GM104的GPC單元數量降低到5組，擁有3840個CUDA核心，240個TMU紋理單元，40個ROP光柵單元，顯存位元寬降低到320bit，顯存容量3GB，也可能是跟Fermi一樣的2.5GB，不過顯存位元寬降低也使得頻率可以更高，顯存頻率在7GHz左右，核心頻率1GHz左右。
GM106核心
　　GM106核心將取代目前249美元以內的GK106核心的顯卡，比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。
　　不過GM106相對來說提升也是非常大的，CUDA核心將從目前的960個暴增到2304個，4MB L3緩存，144個紋理單元，24個ROP單元，顯存位元寬192bit，容量3GB，頻率也能達到7GHz。
GM108核心
　　GM108之前其實還有GM107核心，目前後者的架構未知，不過驅動資訊中已經有GM107存在的暗示了。
　　目前的ES樣品顯示GM108有576個CUDA核心，48個紋理單元，8個ROP單元，64bit顯存位寬，核心面積跟GF117差不多。
丹佛計畫將從Maxwell升級版時代開始？
　　在NVIDIA最神秘的計畫中，Preject Denver丹佛計畫最為引人注目，因為它將整合NVIDIA的GPU和ARM的CPU，有關這個處理器的進度一直沒有明確消息。最新洩露的消息顯示NIVIDIA在Maxwell升級版階（GM11x）段推出丹佛計畫，因為NVIDIA一直在等新的FinFET工藝成熟。這個說法跟NVIDIA在之前的GTC 2013大會上公佈的進度有些相符。

　　丹佛處理器將整合64位ARM CPU核心，其中只有GM110會搭配8核丹佛處理器，GM110實際上應該被成為GM110 SoC處理器，已經不是單一的GPU或者CPU了。消費級的GM110將有4個CPU核心，整合的GPU則是GM114。整合GM116圖形核心的丹佛則只會搭配2個CPU核心。洩露的報告沒提到GM118核心整合什麼丹佛核心，因此它很可能並不會使用新的架構。
　　丹佛處理器將有一致性匯流排（coherent link ）用於連接CPU和GPU核心，並會在二者之間分配不同負載。爆料者稱NVIDIA認為丹佛計畫及相應的驅動優化會使他們的顯卡比AMD為GCN架構優化的私有Mantle API更強。
　　目前最重要但是還不能確認的就是這些晶片是否能在2014年上半年發佈，因為TSMC預計在2014年2月份才能量產20nm工藝，而且AMD預計在未來兩個季度內使用14nm FinFET工藝流片新處理器，不過真正發佈要等到2014年底甚至2015年初。這意味著2014年上半年最可能發佈的還是他們的移動晶片，AMD是Crystal系列，NVIDIA是GTX 800M系列，而桌上出版有可能到2014年下半年才能發佈了。

　　2016年，NVIDIA會進入Vlota架構時代，根據之前在GTC 2013大會上公佈的官方消息，Volta架構的頻寬可達1TB/s。

文章分享：

+ MORE精選文章：

+ MORE活動推薦：

Micron Crucial T710 SSD 玩家開箱體驗分享

COUGAR ULTIMUS PRO玩家開箱體驗分享活動

COUGAR AIRFACE 180 玩家開箱體驗分享活動

COUGAR GR 750/GR 850 玩家開箱體驗分享活

[顯示卡器] Maxwell架構曝光：6144個CUDA核心，8GB顯存，512位寬

瀏覽過的版塊