AMD透露他們收到了一項詢價,要求建造一台擁有120萬個資料中心GPU的大型超級電腦,考慮到目前市場動態,這個數字是荒謬的。
好吧,AMD可能已經找到了下一個大客戶,因為該公司表示他們可能會參與建立一個擁有多達120萬個GPU的AI叢集。 AMD執行副總裁兼資料中心解決方案事業部總經理Forrest Norrod在接受The Next Platform採訪時表示AMD收到了未知客戶的詢問,要求提供大量AI加速器,這一點在他接受採訪後得到了證實。
TPM: 有人認真關注的最大的人工智慧訓練集群是什麼——你不必指名道姓。有人來找你說,對於MI500,我需要120萬個GPU或其他什麼。
Forrest Norrod: 在這個範圍內嗎?是的。
TPM: 你不能只說「在這個範圍內」。實際最大的數字是多少?
Forrest Norrod: 我是認真的,就在這個範圍內。
TPM: 對於一台機器。
Forrest Norrod: 是的,我說的是一台機器。
TPM: 這有點令人難以置信,你知道嗎?
Forrest Norrod: 我明白。正在考慮的事情的規模令人震驚。現在這一切都會實現嗎?我不知道。但有公開報導稱有人正在考慮花費數百億甚至千億美元用於培訓。
Forrest Norrod - AMD 執行副總裁(來自 The Next Platform)
讓我們稍微回憶一下。如果你還認為120萬個GPU並不是一個巨大的數字,那麼目前世界上最大的超級電腦Frontier使用了大約38,000個GPU,而擁有120萬個GPU意味著僅從GPU來看,顯示運算方面的差距跟目前最大的超級電腦相比就差30倍,這是令人震驚的。而且如果您只考慮如此大的顯示堆疊的互連性,這簡直令人難以置信,並且考慮到現代技術可能是不可能的。
我們是否認為在AI叢集中擁有120萬個GPU是不可能的?嗯,不。背後的原因是,隨著人工智慧的發展,對足夠運算能力的需求迅速增長,正如Forrest自己所說,已經有人已經準備好花費數十億美元建造大型資料中心來滿足當前的需求。
如果你為超級電腦配備120萬個AMD Instinct MI300X AI加速器,如果單一單位的成本約為15,000美元,那麼光是GPU的成本就大約為180億美元,。而且您甚至沒有考慮到這樣一個超級叢集的功率需求。如果人工智慧繼續以與現在相同的速度加速發展,那麼我們可以期待這種超級電腦在全球出現。這將是一項巨大的投資,需要數年時間才能完成,但最終完成後,這些將成為地球上最快的運算平台。
NVIDIA CEO黃仁勳表示資料中心領域預計將在未來幾年發展成為萬兆美元的市場,有傳言稱微軟和OpenAI計劃建造一台價值1000 美元的超級電腦Stargate,因此120萬個GPU這個數字並非完全沒有記錄。但大型科技公司會選擇AMD而不是NVIDIA嗎?這是只有時間才能回答的問題。
消息來源 |