GTX 680已經來了,但是它留給人們的懸念還沒有完全解開,雖然性能上憑藉較高的預設頻率小幅超過HD 7970,但是在計算性能上卻敗給了後者,這明顯不像NVIDIA的風格,難道NVIDIA還留了一手?以前我是不相信還是GK110的,現在我信了,不在通用計算上扳回來NVIDIA就不再是NVIDIA了。
實際上GK104的定位相當於目前的GF114,並非最頂級顯卡,只不過NVIDIA發現了有機可乘將之命名為GTX 680。真正的旗艦單卡還是GK110,雖然之前多次有過小道消息,但是這一次終於詳細的規格信息了。目前的GK104基本規格為294mm2核心面積,35.4億晶體管,擁有4組GPC,8組SMX單元,每組SMX有192個CUDA核心和16個紋理單元,256bit/2GB記憶體,總計1536個CUDA核心, 128個紋理單元,32個ROP單元,計算能力為3.09TFlops,但是雙精度運算能力只有單精度的1/12,紋理填充率128.8GT/s。
GK110將擁有兩個不同的核心,二者的架構有一定區別(也可能是不同的信息來源所致,個人覺得兩種核心的可能性不大)。一種是8組GPC單元,每組GPC下轄4組SMX,每組SMX擁有92個CUDA核心和4個紋理單元,總計3072個CUDA核心,128個紋理單元,64個ROP單元,頻率為850MHz ,計算能力為5.222TFlops,比目前GTX 680的3.09TFlops大幅提升,而且雙精度運算提升到單精度的1/2,追上了Tesla級的Fermi的水平,比GTX 580的1/4還高。不過因為頻率的降低,紋理填充率只有108.8GT/s,低於目前的GTX 680。另一種核心不妨稱之為GK110-2,它有6組GPC,每組GPC擁有4組SMX,每組SMX有128個CUDA核心和8個紋理單元,總計有3072個CUDA核心,192個紋理單元,64個ROP單元,頻率也是850MHz,計算能力為5.222TFlops,雙精度為2.611TFlops,當然紋理填充率提高到163.2GT/s。無論那種核心都有550mm2核心面積,恐怖的60億晶體管,L2緩存從Fermi的768KB、GK104的512KB大幅增加到2MB,位寬跨過384bit直接達到512bit,據稱性能水平起碼要比GK104高50 %,GK110已經在三月份成功流片,量產時間應該不遠。
|