Intel針對Aurora超級電腦有了進一步詳細說明,該超級電腦將裝有下一代Xe HPC 'Ponte Vecchio GPU和Sapphire Rapids Xeon處理器 。而明年推出的Aurora超級電腦將在Argonne國家實驗室中使用。
Aurora超級電腦為擁有Intel 2021年的高性能計算產品,從技術角度來看既快速又令人印象深刻。在ECP年會上超級電腦的更多細節被揭示出來,指出了具體的機架配置和硬體規格。
Aurora超級電腦計劃於2021年在Argonne國家實驗室使用,並將擁有超過1 Exaflop性能。該機器將配備Intel的Xe HPC(7nm)'Ponte Vecchio'GPU和Sapphire Rapids(10nm ++)Xeon處理器。每個節點將包含6個Xe HPC GPU和2個Sapphire Rapids Xeon CPU。6個Ponte Vecchio(PVC)GPU將擁有超低延遲和高頻寬特性的全方位連接。統一的記憶體架構將在CPU和GPU之間可用。
在記憶體,儲存和頻寬方面,我們可以看到大於10 PB的系統記憶體以及Cray Slingshot Fabric互連(Shasta平台)。Aurora超級電腦上的每個節點總共有8個Slingshot Fabric Endpoints。該系統將擁有兩個不同的文件系統,其中一個是DAOS (Distributed Asynchronous Object Store) ,另一個是Lustre。
Cray將為其Shasta系統的一部分設計一個單一的Aurora機架,該機架支援各種CPU,並擁有針對密度,散熱和高網路頻寬的比例優化機櫃。Cray還提供了自己的軟體堆棧,以改善模組化,同時提供統一的高性能互連。Slingshot本身是第八代互連結構,擁有諸如擁塞管理,3跳蜻蜓和流量類別的功能。它使用Rosetta高頻寬交換機,每個交換機提供高達25.6Tb/s的頻寬(每個方向25GB/s)。
Xe HPC 'Ponte Vecchio' GPU-到目前為止我們所知道的
Intel Xe HPC 'Ponte Vecchio' GPU將採用Foveros 3D封裝技術的MCM設計。每個MCM GPU將透過EMIB連接到高密度HBM DRAM上,並在它們附近擁有一個更快的Rambo Cache,該快取將通過Foveros連接。最後當Slingshot提供節點之間的互連時,Intel的Xe Link將把6個Xe HPC GPU互連在一起。
Intel此前曾詳細介紹過其Xe HPC GPU將擁有數千個EU。到目前為止我們只看到Xe LP有96個EU,它們構成了總共768個核心。目前Intel每個子功能有8個EU。第12代GPU中的Slices類似於GPC中的NVIDIA SM單元或Shader Engine中的AMD CU。Intel目前在其9.5代和11代GPU上每個Slices擁有8個EU,因此如果保持相同的架構,我們可以看到大量由許多Slices組成的Super-Slices。第11代和第9.5代EU也包含8個ALU,從外觀上來看它們在第12代上也將保持相同的設計。
所以一個擁有1000 EU的晶片將構成8000個核心,但1000只是基本值,實際核心數要大得多。之前已經曝光了擁有2048個EU或16,384個核心的4塊Xe HP GPU,因此HPC產品的尺寸可能會更大。以下是Intel的各種採用MCM的Xe HP GPU的資訊
Intel Xe HP (12.5) 1-Tile GPU: 512 EU [Est: 4096 Cores, 12.2 TFLOPs assuming 1.5GHz, 150W]
Intel Xe HP (12.5) 2-Tile GPU: 1024 EUs [Est: 8192 Cores, 20.48 assuming 1.25 GHz, TFLOPs, 300W]
Intel Xe HP (12.5) 4-Tile GPU: 2048 EUs [Est: 16,384 Cores, 36 TFLOPs assuming 1.1 GHz, 400W/500W]
Intel Sapphire Rapids Xeon CPU-到目前為止我們所知道的
Sapphire Rapids平台有望利用更新的Willow Cove核心架構,它將取代Sunny Cove。Sapphire Rapids系列產品將使用8通道DDR5記憶體,並在Eagle Stream平台上支援PCIe Gen 5.0。Eagle Stream平台還將推出LGA 4677插槽,它將取代Intel即將推出Whitley平台的LGA 4189插槽,該平台將支援Cooper Lake-SP和Ice Lake-SP處理器。
如果Milan最終在即將到來的EPYC Rome平台上重用DDR4和PCIe Gen 4,這將使Intel能夠與AMD的EPYC產品匹敵甚至超越。但這還有待觀察。Intel的Sapphire Rapids系列將在同一年推出。該平台將與AMD採用Zen 4的EPYC Genoa系列競爭,後者將轉移到稱為SP5的較新平台。AMD承諾為Genoa系列提供新的記憶體和新功能,其中包括對DDR5,PCIe 5.0等的支援。我們不知道新產品陣容還將包括哪些其他功能,但Intel透過8通道DDR5記憶體和Eagle Stream平台的新互連實現了同樣的功能。 |