IBM推出了下一代Telum II處理器和Spyre AI加速器,適用於支援AI的最新IBM Z大型主機系統。
今天IBM 首次公佈了Telum II處理器和Spyre加速器的架構細節,這些細節旨在推動專為AI工作負載設計的下一代IBM Z大型主機上的AI工作負載。這些新的人工智慧大型主機將使用全新的人工智慧整合方法與LLM一起加速傳統人工智慧工作負載。
Telum II處理器擁有8個頻率為5.5GHz的高效能核心,每個核心有36MB L2,On Die上快取容量增加40%,總計360MB。每個處理器有2.88GB的虛擬L4快取比上一代增加了40%。整合的人工智慧加速器可實現低延遲、高吞吐量的交易中人工智慧推理,例如增強金融交易期間的詐欺檢測,並且每個晶片的運算能力比上一代增加四倍。
新的I/O加速單元DPU也整合到Telum II晶片中。它旨在透過提高50%的I/O密度來改善數據處理。這項進步提高了IBM Z的整體效率和可擴展性,使其非常適合處理當今企業的大規模AI工作負載和資料密集型應用程式。
Spyre Accelerator展示了一款專門建置的企業級加速器,為複雜的人工智慧模型和生成式人工智慧用例提供可擴展的功能。它有高達1TB的記憶體,可在常見IO屜的八張卡上協同工作,支援整個大型主機上的AI模型工作負載,同時每張卡的功耗不超過75W。每個晶片將擁有32個運算核心,支援 int4、int8、fp8和fp16資料類型,適用於低延遲和高吞吐量的AI應用。
透過IBM
從細節開始,我們首先看到IBM Telum II處理器,它由CPU核心、快取、DPU和AI加速器組成。該晶片本身採用三星5HPP製程,在600mm2的晶片尺寸中搭載了 430億個電晶體。
這款CPU採用8核心設計,頻率提高至5.5GHz,每核心專用36MB L2的高速快取增加,晶片高速快取增加40%,使快取達到360MB。該晶片還有每個處理器2.88GB(48.5ns延遲)的虛擬L4快取,這也比第一代Telum晶片增加了40% 。 IBM表示這些新核心有全新的分支預測改進,暫存器大小增加到160個,整體大小減少了20%,功耗降低了15%。效能提升20%。
每個Telum II處理器都配備整合的AI加速器,可提供低延遲和高吞吐量的AI推理效能。該加速器提供每個晶片24 TOPS、每個機架192 TOPS以及每個系統768 TOPS。其他新增功能包括I/O加速單元DPU,它已整合到Telum II晶片中,可改善資料處理使I/O密度提高50%。 DPU也將IO管理功耗降低了70%。
IBM今天為其IBM Z大型主機推出的第二款AI晶片是Spyre AI 加速器,它是一款企業級解決方案,提供300+ TOPS AI性能,有128GB LPDDR5容量和8個卡上的1 TB記憶體,可插入使用Telum II處理器的IBM Z大型主機。
每個Spyre AI加速器均有32個運算核心,支援INT4、INT8、FP8和FP16資料類型,並採用75W TDP卡。每張卡均專為低延遲和高吞吐量的人工智慧應用而設計。
IBM 預計其配備Telum II處理器的Z大型主機AI系統將於2025年向客戶提供,而Spyre AI加速器目前處於技術預覽階段,預計也將於2025年推出。
消息來源 |