Rogame發現了AMD的Radeon Instinct Arcturus GPU,它將擁有CDNA架構並瞄準伺服器市場。CDNA架構採用在下一代Radeon Instinct顯示卡中,將利用其經過計算優化的GPU設計為數據中心提供最高性能的Compute功能。
在AMD的Arcturus GPU大約在2018年曝光,這是AMD公司在推出任何7nm的GPU之前。而Radeon VII和Navi系列於2019年推出,並配備了7nm GPU,Navi是針對大眾消費市場的產品。
後來AMD透漏的下一代HPC和AI GPU將與消費類晶片分開設計。這意味著Arcturus GPU將只保留給數據中心市場。AMD最近在其Radeon CDNA架構路線圖中證實,所有採用CDNA的GPU都是專門為HPC和數據中心市場設計的,而Radeon RDNA GPU將為消費市場提供動力。
規格方面,先前AMD曾宣布Arcturus GPU將具有增加的快取,並且CU的數量將是Vega的兩倍。在擁有新CDNA架構的Radeon Instinct卡中,可以預期到Arcturus GPU將會支援數據中心以及其特定功能,例如XDLOP,Rapid Packed Math,New Vector ALU和BFloat16。
這部分的訊息是採用原型樣品的,因此最終規格可能會有所不同,但這是關鍵點:
採用Arcturus XL GPU
測試板的TDP為200W
高達32GB HBM2
HBM2記憶體時脈在1000-1200 MHz之間
日前Rogame再次發現了一塊採用Arcturus CDNA GPU的測試板,從它的外觀來看,該版本可提供120個CU,總共7680個處理器,GPU速度為878 MHz(750 MHz SOC)時脈)。該版本還擁有1200 MHz頻率的HBM2記憶體,因此如果我們看的是4096位元記憶體匯流排,那麼應該獲得1.2TB/s的頻寬,這是三星Aquabolt能夠提供的頻寬。但是NVIDIA和AMD很有可能最終會採用更快的HBM2E“ Flashbolt”標準,該標準將於今年投入生產,並能夠提供高達1.8TB/s的頻寬。
說到時脈速度,測試板的878 MHz相當的慢,因為我們看到過去的版本高達1334 MHz。以上述速度該晶片將擁有大約13.5 TFLOP的FP32計算能力,低於Radeon Instinct MI60以及我們在先前原型樣品中獲得的21 TFLOP。另外根據預計在今年晚些時候發佈的Ampere GPU,看來NVIDIA的Tesla 7nm GPU可能在計算性能方面佔據上風,因為據推測它們將的FP32將達到近36 TFLOP和FP64的18 TFLOP計算能力。
到目前為止AMD宣布CDNA的主要重點將是數據中心市場的性能,效率,功能和可擴充性。目前AMD的GCN架構已在這一市場中服務,但藉助CDNA,AMD將創建專門針對高性能計算,機器學習和HPC而優化的GPU。第一代CDNA GPU將採用第二代Infinity架構,並將利用ROCm(Radeon開放式計算平台)通過關鍵的優化和增強的可擴充性為數據中心提供動力。第二代Infinity架構將在單個節點中實現4-8 Way GPU連接,從而使新的Radeon Instinct可和諧執行。
AMD證明了他們可以以具有競爭力的價格提供更多FLOP,因此也許正是Arcturus的目標。目前尚無關於Arcturus何時發佈的消息,但AMD暗示將於今年晚些時候推出Radeon Instinct產品,該產品將採用其第一代CDNA架構。
消息來源 |