找回密碼註冊
作者: wu.hn8401
查看: 7854
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

打印 上一主題 下一主題

[顯示卡器] Maxwell架構曝光:6144個CUDA核心,8GB顯存,512位寬

[複製鏈接]| 回復
跳轉到指定樓層
1#
wu.hn8401 發表於 2013-10-23 11:42:42 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
  NVIDIA下一代GPU架構為Maxwell,最快將在明年Q1季度問世。日前Maxwell的詳細架構也曝光了,其中旗艦GM100將有6144個CUDA核心,512bit位寬顯存,顯存容量達到了更誇張的8GB。
  NVIDIA目前一代的顯卡有GK104和GK110兩大分支,它們的側重點不同,但都是基於Kepler(開普勒,天文學家)架構的,下一代架構名為Maxwell(麥克斯韋爾,物理學家),根據之前的傳聞Maxwell最快將在明年Q1季度問世,制程有可能繼續使用TSMC的28nm工藝。現在網上又流傳開Maxwell的架構設計了,旗艦GM100將有6144個CUDA核心,512bit位寬顯存,顯存容量達到了更誇張的8GB。
roadmap2a.png

  介紹Maxwell之前最好瞭解一下Kepler架構,相關介紹可以參閱之前的文章:3倍性能從哪裡來,GK110的SMX單元升級3.5代。目前Kepler架構中每組SMX單元有192個CUDA核心,Maxwell的SMX單元將進一步提升CUDA核心數到256個,不過DP雙精度浮點單元的比例會從目前的1:3降低到1:4,算起來DP單元總數是保持不變的。256個CUDA核心的SMX單元將大幅增加Maxwell的CUDA總數,而DP雙精度單元不用時是可以關閉的,這樣也能降低能耗。
  紋理單元方面,每組SMX單元會繼續維持16個TMU單元,跟Kepler是一樣的。
  Maxwell的緩存設計也會進一步增強,每組SMX單元會額外增加2個寄存器,大量寄存器執行緒現在也可以並行運行了。L1緩存從Kepler架構的64kb增加到了128kb,而且可以作為共用記憶體使用,並且可以32/96、64/64、96/32的比例分配成緩存、共用記憶體。
  L1緩存之外,每個GPC單元還會獨享768kb L2緩存作為指令緩存。
  具體的四款Maxwell晶片的詳細架構如下所示:
GM110核心
  目前的GK104核心有4組GPC單元,GK110是5組GPC單元,而GM110擁有8組GPC單元,每個GPC單元有三組SMX單元,每組SMX單元又有256個CUDA核心,這樣總計有6144個CUDA核心,384個紋理單元,8MB L3緩存,64個ROP單元,512bit顯存位元寬,顯存容量則達到誇張的8GB。
  GM100無疑將取代GK110的旗艦地位,同時用於Tesla和GeForce高端產品線,不過這兩個市場的GM100核心也有所不同:GeForce領域中的GM110核心頻率在930MHz左右,加速頻率1GHz左右,而Tesla中的GM110核心頻率約為850MHz,雙精度浮點性能達到了2.61TFLOPS。(作為對比的是GTX Titan目前的單精確度性能是4.5FLOPS,雙精度是1.3TFLOPS)
GM104核心
  GM104核心將取代目前的GK104核心,後者的代表產品是GTX 680和GTX 770。
  GM104的GPC單元數量降低到5組,擁有3840個CUDA核心,240個TMU紋理單元,40個ROP光柵單元,顯存位元寬降低到320bit,顯存容量3GB,也可能是跟Fermi一樣的2.5GB,不過顯存位元寬降低也使得頻率可以更高,顯存頻率在7GHz左右,核心頻率1GHz左右。
GM106核心
  GM106核心將取代目前249美元以內的GK106核心的顯卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。
  不過GM106相對來說提升也是非常大的,CUDA核心將從目前的960個暴增到2304個,4MB L3緩存,144個紋理單元,24個ROP單元,顯存位元寬192bit,容量3GB,頻率也能達到7GHz。
GM108核心
  GM108之前其實還有GM107核心,目前後者的架構未知,不過驅動資訊中已經有GM107存在的暗示了。
  目前的ES樣品顯示GM108有576個CUDA核心,48個紋理單元,8個ROP單元,64bit顯存位寬,核心面積跟GF117差不多。
丹佛計畫將從Maxwell升級版時代開始?
  在NVIDIA最神秘的計畫中,Preject Denver丹佛計畫最為引人注目,因為它將整合NVIDIA的GPU和ARM的CPU,有關這個處理器的進度一直沒有明確消息。最新洩露的消息顯示NIVIDIA在Maxwell升級版階(GM11x)段推出丹佛計畫,因為NVIDIA一直在等新的FinFET工藝成熟。這個說法跟NVIDIA在之前的GTC 2013大會上公佈的進度有些相符。
roadmap1b.jpg

  丹佛處理器將整合64位ARM CPU核心,其中只有GM110會搭配8核丹佛處理器,GM110實際上應該被成為GM110 SoC處理器,已經不是單一的GPU或者CPU了。消費級的GM110將有4個CPU核心,整合的GPU則是GM114。整合GM116圖形核心的丹佛則只會搭配2個CPU核心。洩露的報告沒提到GM118核心整合什麼丹佛核心,因此它很可能並不會使用新的架構。
  丹佛處理器將有一致性匯流排(coherent link )用於連接CPU和GPU核心,並會在二者之間分配不同負載。爆料者稱NVIDIA認為丹佛計畫及相應的驅動優化會使他們的顯卡比AMD為GCN架構優化的私有Mantle API更強。
  目前最重要但是還不能確認的就是這些晶片是否能在2014年上半年發佈,因為TSMC預計在2014年2月份才能量產20nm工藝,而且AMD預計在未來兩個季度內使用14nm FinFET工藝流片新處理器,不過真正發佈要等到2014年底甚至2015年初。這意味著2014年上半年最可能發佈的還是他們的移動晶片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌上出版有可能到2014年下半年才能發佈了。
roadmap3c.jpg

  2016年,NVIDIA會進入Vlota架構時代,根據之前在GTC 2013大會上公佈的官方消息,Volta架構的頻寬可達1TB/s。

您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-25 13:17 , Processed in 0.108009 second(s), 34 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表