AMD 為大規模資料處理推出採用 Versal HBM 單晶片的 Alveo V80 運算加速卡
針對大規模資料處理,AMD 特別推出採用 Versal HBM 自適應單晶片的 Alveo V80 運算加速卡,提供高速的網路與記憶體頻寬,並可為開發人員簡化開發流程。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_21.jpg
隨著數位轉型與新興的 AI 應用熱潮下,讓許多人更重視資料的分析與運用並做決策。除此之外,還有許多大型科學應用會使用極大量的資料做運算,如天文研究等,當資料量龐大時,系統中各種組件都需要擁有高效能才能讓資量順利處理,一旦環節中有效能瓶頸就讓系統效能降低。
針對各種大規模資料處理應用,AMD 宣布專為被記憶體受限的大型資料集應用推出採用 Versal HBM 自適應單晶片的 Alveo V80 運算加速卡,比前一代產品擁有高達二倍的頻寬與運算密度,並可為使用 AMD Vivado 設計套件的 FPGA 開發人員簡化開發流程。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_02.jpg
網路與記憶體頻寬是許多大規模資料處理系統的瓶頸
在現今大型資料處理應用中,處理器性能與周邊連接因為半導體製程的進步以及更高速的新世代 PCI Express 匯流排大幅提升運算以及連接的性能,整個系統中性能瓶頸變成網路以及記憶體存取。而 AMD Alveo V80 即是運用自適應單晶片搭配高頻寬記憶體(HBM)以及高速的網路連接能力,大幅提升系統的性能,適合應用於高速運算(HPC)、大型資料分析、金融科技、網路安全、AI 運算上。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_04.jpg
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_14.jpg
AMD Alveo V80 運算加速卡
Alveo V80 採用介面卡式設計,主要核心採用 AMD Versal HBM 自適應單晶片以及搭配的 32GB HBM2e 高速記憶體,頻寬可高達 820GB/s,並有 DDR4 記憶體模組插槽可擴充 32GB 的容量。另外還有支援 PCIe Gen5 規格的 MCIO x4 與 x8 的擴充連接器,可用來連接 NVMe。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_05.jpg
AMD Versal HBM 單晶片內部架構,包括可程式邏輯單元、DSP引擎、Arm 處理器以及多種硬體化功能
Versal HBM 自適應晶片中具有 260萬個 LUT 可程式化邏輯單元的 FPGA 架構,以及 10,890個 DSP 運算邏輯片(slice)提供比前一代產品 2~3 倍的 DSP 性能,另外還整合雙核心的 Arm Cortex-A72 應用處理器以及雙核心 Arm Cortex-R5F 即時處理器。網路連接部分則具有四個 QSFP56 光纖收發模組插槽,可支援多種速度,單一速度最高可達200Gb,也就是最高能提供高達800Gb的網路頻寬。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_06.jpg
Versal HBM 晶片中採用許多硬體化設計以連接資料中心的基礎架構
由於 Versal HBM 晶片中採用許多硬體化設計,包括記憶體控制器、乙太網路以及 PCI Express 匯流排等以連接資料中心的基礎架構。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_07.jpg
和前一代加速卡相比,Alveo V80 擁有多項性能大幅提升
和前一代的 AMD Alveo U55C 運算加速卡相比,Alveo V80 不僅具有最高達二倍的邏輯密度,加上記憶體、網路與 PCI Express 頻寬的提升,將可擁有強大的運算叢集,同時讓多張加速卡、伺服器以及機架空間達到最佳化。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_11.jpg
Alveo V80 高速處理能力與網路性能可做為下世代網路防火牆之用
Alveo V80 加速卡的硬體靈活度可廣泛應用於橫跨多元的客製化工作負載,其 4x200G 網路附接加速卡設計,可即時處理大量傳入資料,避開 GPU 遇到的 PCIe 連接限制。而且可透過乙太網路擴展到數百個節點實現運算叢集,非常適合基因定序、分子動力學、感測器處理等一系列高效能運算(HPC)應用。在網路安全方面,內建 400G 加密引擎和 600G 乙太網路硬體化區塊,加上 FPGA 的靈活度,也讓 Alveo V80 加速卡適用於線速(line-rate)封包偵測和 AI 支援的異常檢測。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_12.jpg
Alveo V80 適合運用於金融科技
另外 Alveo V80 也非常適合運算儲存和資料分析,能夠在同一張卡上整合壓縮和查詢加速,即可增加有效儲存容量,同時更快獲得洞察。各種金融科技應用包括策略回溯測試、期權定價以及金融建模與模擬也非常合適。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_16.jpg
Alveo V80 具有便於開發的設計
除了具有高性能的硬體設計,Alveo V80 加速卡經由 Alveo Versal範例設計(AVED)完全可為傳統硬體開發人員使用,現已在 GitHub 上提供。AVED 基於常見的 Vivado工具並利用傳統 FPGA 和 RTL 流程簡化開發。
在系統層面上,Alveo V80 運算加速卡簡化系統整合並提供快速的量產路徑,透過使用預先驗證的部署卡,設計團隊可以避開 PCB 整合、庫存管理和產品生命周期管理。
https://p.xfastest.com/~kenny.kuan/2024/20240608/v80_15.jpg
CSIRO 的天線陣列具 131000支天線產生大量資料,預估採用 Alveo V80 加速卡可減少伺服器數量與空間並減少耗電量
參與建造全球最大無線電天文學天線陣列的澳洲聯邦科學和工業研究組織(Commonwealth Scientific and Industrial Research Organization,CSIRO),此天線陣列具有高達 131,000 支天線,每秒中可產生高達 15Tb 的連續性資料以研究早期宇宙並探索銀河系演化。
如此的巨量資料目前利用 21台伺服器共420張 Alveo U55C 加速卡來處理,在機櫃空間有限且需要縮滅伺服器占用空間,CSIRO 預估改用 Alveo V80 加速卡就僅要 140片, 伺服器數量也可降至 14台,將可大幅降低耗電量,降低總持有成本達 20%以上。
頁:
[1]