中國GPU製造商Moore Threads推出了全新MTT S4000顯示卡,可提供200 TOP的AI運算和運算能力。LLM需要48GB記憶體。
在一次活動中Moore Threads推出了全新的MTT S4000顯示卡,採用第三代MUSA核心架構。該卡專為支援人工智慧工作負載而設計,並為大型語言模型提供非常大的記憶體容量。
就規格而言Moore Threads MTT S4000配備48GB GDDR6,頻率為16Gbps,可提供768GB/s頻寬。 GPU配備了最新的MTLink 1.0介面技術,讓客戶可以同時運行多張卡。將其視為Moore Threads GPU的NVLINK解決方案。該卡還採用PCIe Gen5協議。該公司是迄今為止唯一一家提供符合Gen5標準的消費級硬體的公司。
據該公司本身稱分享的一些計算數據展示了FP32的25 TFLOP、TF32的50 TFLOP、FP16/BF16的100 TFLOP以及INT8性能的200 TOPS。這比AMD Ryzen 8040 系列和Intel Core Ultra系列等AI PC上最快的NPU+CPU+GPU組合快了5倍。可惜的是該公司尚未分享核心數量和其他技術方面的資訊。
值得注意的一件有趣的事情是儘管MTT S4000是一款AI加速卡,但它確實有四個顯示輸出,並且最多可以支援8K顯示器。該卡還支援96個同步1080p串流,並配備了最新的USIFY開發工具,可充分利用NVIDIA採用CUDA的軟體。
該卡本身採用標準的兩插槽被動散熱解決方案,並利用12VHPWR電源連接器進行啟動。相比之下,上一代MTT S3000提供32GB記憶體。峰值FP32計算為15.2 TFLOP。因此記憶體容量增加了50%,FP32運算能力增加了64%。
Moore Threads MTT S4000顯示卡也被整合到KUAE運算解決方案中,類似於NVIDIA的DGX系統。 Kuae MCCX D800系統採用8個MTT S4000 GPU,還有從單機到多卡和多個AI系統的無縫擴充。 MTT S4000顯示卡和Kuae系統均支援LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、Yuyan等最新LLM,可輕鬆處理1,300億個參數。首批1000個MTT S4000 GPU將安裝在中國第一個大規模運算叢集內,為人工智慧工作負載提供動力。
與其他兩款Moore Threads GPU一樣,MTT S80和MTT S70 ,MTT S4000預計將以極具競爭力的價格提供。另一方面我們只有在獲得實際結果後才能真正了解其性能,因為儘管該公司大肆吹噓其遊戲性能,但前兩張卡的表現卻非常平淡。
消息來源 |