AMD週二(6月13日)推出了EPYC 9004 Bergamo128核/256線程高密度計算伺服器處理器,並隨之推出了全新的Zen4c CPU架構。在昨天發布之前關於Zen4c 的消息很多,例如有傳言稱它是Zen4精簡版核心,有較小的運算能力,因此IPC較低。但事實證明它既不是Zen4的精簡版,也不是E-core,而是Zen4核心的物理壓縮版,有相同的數位運算機制。
首先Zen4c有與Zen4完全相同的IPC(即在給定時脈速度下的性能)。這是因為它的前端、執行階段、加載/儲存零件和內部快取層次結構完全相同。它有相同的 88深加載隊列、64深儲存隊列、相同的675,000 µop快取、完全相同的10+6 INT+FP發布寬度、完全相同的INT寄存器文件、相同的調度和快取延遲。L1I和L1D 快取的大小與Zen4相同,均為32 KB,專用的L2也是1MB。
唯一發生變化的是每個核心的有效L3已從8核Zen4 CCD上的4MB減少到2MB。雖然常見的8核Zen4 CCD有八個Zen4核心共享32MB L3,但AMD與Bergamo一起推出的新16核Zen4c CCD看到小晶片包含兩個8核CCX (CPU 核心複合體),每個都有16MB的L3高速快取,由CCX的8個核心共享。在這方面Zen4c CCD的末級快取和CPU核心組織與Zen2 CCD(使用兩個4核 CCX)有一些相似之處。
有趣的是16核Zen4c CCD並不是AMD這一代產品中第一款每核末級快取較低的產品。Ryzen 7040系列行動處理器中使用的Phoenix APU看到八個Zen4核心共享一個16MB L3。對於記憶體佔用較少的數學密集型計算工作負載,Zen4c提供與Zen4相同的性能,但是較小的L3快取應該會影響有大型數據集的頻寬敏感型工作負載的性能。
消息來源
|