AMD談論RDNA 3 GPU和XDNA NPU的AI功能：Radeon RX 7900 XT比Ryzen 7 8700G快8倍

sxs112.tw · 發表於 2024-5-4 20:42:57

AMD分享了一些有關RDNA 3 GPU和XDNA NPU硬體在以消費者為中心的人工智慧工作負載中的功能的有趣數據。

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_2-1456x819.png

毫無疑問，AMD透過在Ryzen APU實施XDNA NPU，在向更廣泛的PC用戶提供AI功能方面一直處於領先地位。第一款NPU於2023年與Phoenix Ryzen 7040 APU一起推出，最近又透過Hawk Point Ryzen 8040系列進行了更新。除了NPU之外，AMD的RDNA 3 GPU架構還整合了大量可以處理這些工作負載的專用AI核心，該公司正試圖透過其ROCm軟體套件來鞏固其勢頭。

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_4-1456x819.png

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_3-1456x819.png

在最新的與專家會面網路研討會上，AMD討論了RDNA 3系列等Radeon顯示卡如何為遊戲玩家、創作者和開發人員提供一系列優化的工作負載，其中包括：

視訊品質增強
背景噪音消除
文字轉圖像 (GenAI)
大型語言模式 (GenAI)
圖片修改
影片編輯
升級
文字到圖像
模型訓練（Linux）
ROCm 平台 (Linux)

從AMD RDNA 3架構開始，Radeon RX 7000 GPU和Ryzen 7000/8000 CPU上配備的最新GPU提供了超過2倍的AI效能提升。

這些GPU產品提供多達192個AI加速器，這些加速器針對FP16工作負載進行了優化，在Microsoft DirectML、Nod.AI Shark和ROCm等多個ML框架中進行了優化，並有大型專用VRAM池，這對於處理大型資料集至關重要（高達48GB），並且還有透過Infinity Cache技術提升的更快頻寬。

AMD表示PC平台上的大多數AI用例包括LLM和Diffusion模型，這些模型主要依賴所運行硬體的FP16運算和記憶體功能。某些模型（例如SDXL（擴散））受計算限制，需要大約4-16GB記憶體，而Llama2-13B和Mistral-8x 7B受記憶體限制，最多可使用23GB記憶體。

如前所述AMD擁有多種有專用AI加速功能的硬體。即使該公司的Radeon RX 7600 XT（售價329美元）也擁有16GB VRAM，在性能方面，它比LM Studio中的Ryzen 7 8700G提升了3.6倍，而RX 7900 XT則比RX 7900 XT快8倍。

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_9-1456x819.png

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_10-1456x819.png

LM Studio 效能（越高越好）：

Ryzen 7 8700G NPU: 11 Tokens/second
RX 7600 XT 16 GB: 40 Tokens/second
RX 7900 XT 20 GB: 85 Tokens/second

AMUSE 擴散（越低越好）：

Ryzen 7 8700G NPU: 2.6 second/image
RX 7600 XT 16 GB: 0.97 second/image
RX 7900 XT 20 GB: 0.6 second/image

AMD也與NVIDIA的GeForce RTX進行了一個小小的比較，NVIDIA團隊稱之為Premium AI PC平台。兩個系列都提供類似的支援，但AMD展示了其16GB GPU的售價較低，為329美元(7600 XT)，而NVIDIA最入門級的16GB GPU起價約為500美元(4060 TI 16 GB )。該公司還擁有可擴展至48GB記憶體的高階產品。AMD先前也曾在AI方面以更好的價值展現出與Intel Core Ultra相比的強勁性能。

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_22-1456x819.png

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_21-1456x819.png

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_20-1456x819.png

展望未來，AMD討論了ROCm 6.0的進展情況，以及開源如何獲得對Radeon RX 7900 XTX、7900 XT、7900 GRE、PRO W7900和PRO W7800等消費級硬體的支援。 ROCm 6.0在Ubuntu 22.03.3 (Linux) 作業系統上支援PyTorch和ONNX Runtime ML模型和演算法，並透過為更複雜的模型添加INT8來提高互通性。

該公司還試圖透過為開發人員提供一系列軟體堆疊和硬體文件來使ROCm更加開源。