HotChips 2023會議拉開帷幕,Intel解釋了現代數據中心的需求如何不斷擴展並變得越來越以工作負載為中心。您可以擁有各種HPC、AI、計算密集型、高密度和通用工作負載,這意味著單一類型的核心並不總是完成所有這些工作的最佳選擇。因此Intel已經承諾為AMD的Zen 4和Zen 4C戰略提供自己的答案,並配備P核和E核特定的Xeon CPU。
P-Core Xeon CPU的品牌屬於Granite Rapids系列,針對計算密集型和AI工作負載進行了優化,而E-Core Xeon CPU的品牌屬於Sierra Forest系列,針對高密度和規模的效率進行了優化。兩個CPU系列共享共同的平台基礎和共享的軟體,這意味著它們在同一平台上彼此相容。
深入探討其下一代SoC架構的模組化方面,Intel詳細介紹了其Xeon CPU(尤其是Granite Rapids)將如何採用獨立的計算和IO晶片。這些小晶片將使用同一封裝上的EMIB結構互連,提供高頻寬和低延遲路徑通道。
談到平台,Intel Granite Rapids-SP Xeon CPU將擴展到1S和8S平台,而Sierra Forest將擴展到1S和2S解決方案。這兩款CPU都將配備一系列有可變核心數量和散熱目標的型號。下一代Xeon CPU平台還將支援12通道DDR/MCR (1-2DPC)記憶體、多達136個PCIe Gen 5通道和6個UPI (CXL 2.0)。
渲染中顯示的一些型號讓我們了解了三種可能的配置,其中包括有兩個IO小晶片的單個計算晶片、雙計算小晶片和雙IO小晶片配置,以及最後的頂部三個計算小晶片和雙IO小晶片配置。
Intel將使用模組化網狀結構來訪問所有小晶片,從而實現:
- 邏輯上的整體網格允許插槽的代理之間直接訪問
- 最後一級高速快取在所有核心之間共享,並且可以劃分為每個晶片的Sub-numa集群
- EMIB技術將高速結構擴展到封裝中的所有晶片
- 模組化和靈活的佈線允許按晶片定義行和列
- Fabric將IO流量分配到多個列以緩解擁塞
- 全球基礎設施是模組化/分層的
Intel Xeon Granite Rapids上的計算晶片將利用最新的Intel 3製程來實現更高的性能和效率,並實現靈活的行/列結構。Core Tile本身將由採用Redwood Cove架構和L2快取的CPU核心、LLC+SF+CHA以及網狀結構組成。
Core Tile可適用於P核和E核。此外同一晶片上還有高級記憶體系統,有通用控制器/IO並完全支援CXL連接記憶體。
有E核 (Sierra Forest) 的Intel Xeon處理器經過增強,能夠以最節能的方式提供密度優化的計算。有E核的Xeon處理器可提供一流的功耗性能密度,為雲端原生和超大規模工作負載提供獨特的優勢。
- 機架密度提高2.5倍,每W性能提高2.4倍。
- 支援1S和2S伺服器,每個CPU支援高達144C,TDP低至200W。
- 現代指令集有強大的安全性、虛擬化和帶AI擴展的AVX。
- 所有Xeon CPU中的基本記憶體RAS功能(例如機器檢查和數據快取ECC標準)。
有P核 (Granite Rapids) 的Intel Xeon處理器經過優化,可為高核性能敏感型工作負載和通用計算工作負載提供最低的總擁有成本 (TCO)。如今Xeon可實現比任何其他CPU更好的AI性能,而Granite Rapids將進一步增強AI性能。內建加速器可以進一步提升目標工作負載,從而實現更高的性能和效率。
- 混合AI工作負載的性能提高2-3倍。
- 增強型Intel AMX,支援新的FP16指令。
- 更高的記憶體頻寬、核心數量和快取,適用於計算密集型工作負載。
- 插槽可擴展性從1個插槽到8個插槽。
對於E-Core Xeon系列Sierra Forest,CPU的核心塊將為每個模組提供2-4個核心,其中將利用共享L2、共享頻率/電壓域和共享網狀結構。每個核心都是單線程的,因此頂級型號的計算塊中有144個核心和144個線程,封裝在36個核心塊中。LLC在插槽中的所有核心之間共享,並提供高頻寬管道。因此我們獲得了高達144 MB的L2快取和108MB LLC。
根據當前的路線圖,Intel的第五代Emerald Rapids Xeon CPU將於2023年第四季推出,隨後Sierra Forest將於2024年上半年推出,P核驅動的Granite Rapids系列也將很快推出。
消息來源 |