據Kopite7kimi稱NVIDIA針對HPC和AI客戶的下一代Blackwell GB100 GPU據稱將全面採用小晶片設計。
最新傳言指出了兩件事,第一是NVIDIA現在預計將其首款小晶片設計用於現代數據中心領域。回顧一下,NVIDIA Blackwell GPU最初被認為是第一個走小晶片路線的系列,直到有傳言稱該公司決定反對它,並打算使用更標準的單Die設計。小晶片和單Die設計都有各自的優點和缺點,但考慮到當今實現性能提升所需的成本和效率,小晶片和其他先進的封裝技術正在被AMD和Intel等競爭對手所採用。
迄今為止NVIDIA已經證明該行業無需使用小晶片也能向前發展,其Hopper和Ada Lovelace GPU均擅長提供該公司有史以來的最佳每W性能和最高利潤。但展望未來,這種情況將會改變,從Blackwell開始,我們可能會看到NVIDIA的第一個晶片組封裝設計。Blackwell GPU到目前為止計劃於2024年針對數據中心和人工智慧領域發布。
Kopite7kimi在談論Blackwell時強調了數據中心和AI GPU。這表明NVIDIA可能尚未轉向代號為Ada-Next的遊戲GPU的小晶片,但在其數據中心和AI GPU中融入了一定程度的優勢封裝技術,以最大限度地提高晶片輸出。如上所述小晶片也有其缺點,這些缺點通常在於尋找合適的工廠來封裝這些晶片。
台積電的CoWoS是AMD和NVIDIA等GPU客戶可以使用的關鍵封裝技術之一,但看起來兩家公司可能正在爭奪台積電的頂級技術。戰鬥通常取決於誰能提供最多的現金,而NVIDIA團隊目前正在人工智慧資金中有大筆金錢。但此外還需要採購其他關鍵零件,具體取決於NVIDIA希望使用採用晶片的整合級別。AMD和Intel都在開發一些先進的小晶片封裝,將多個IP整合在單個晶片封裝上,因此了解NVIDIA在Blackwell上的第一代小晶片架構的設計有多先進將會很有趣。
故事的第二部分歸結為Blackwell GPU的內部架構結構。據悉Blackwell GPU內的GPC、TPC等單元數量與Hopper相比並沒有太大變化,但內部單元結構可能暗示 SM/CUDA/Cache/NVLINK/Tensor/RT數量發生了顯著變化。此前我們已經看到至少兩款GPU洩露,其中包括Blackwell GB100和GB102。第二個可以是數據中心或遊戲GPU,但Kopite7kimi已經表示消費(遊戲)產品將屬於GB200系列,而不是GB100系列。
還有傳言稱NVIDIA正在評估三星3GAA (3nm)製程,該製程可能會在2025年進入量產,但Kopite7kimi認為NVIDIA可能不會改變計劃並堅持使用台積電生產下一代GPU。同一泄密者此前曾報導Blackwell將不會使用3nm製程,鑑於NVIDIA自推出Pascal GPU以來在人工智慧和數據中心方面取得的進步,以及Ampere和Hopper GPU的巨大成功,Blackwell將標誌著NVIDIA晶片系列的一項重大進步,推動該公司進入人工智慧和計算的下一個時代。
消息來源 |