AMD分享了一些有關RDNA 3 GPU和XDNA NPU硬體在以消費者為中心的人工智慧工作負載中的功能的有趣數據。
毫無疑問,AMD透過在Ryzen APU實施XDNA NPU,在向更廣泛的PC用戶提供AI功能方面一直處於領先地位。第一款NPU於2023年與Phoenix Ryzen 7040 APU一起推出,最近又透過Hawk Point Ryzen 8040系列進行了更新。除了NPU之外,AMD的RDNA 3 GPU架構還整合了大量可以處理這些工作負載的專用AI核心,該公司正試圖透過其ROCm軟體套件來鞏固其勢頭。
在最新的與專家會面網路研討會上,AMD討論了RDNA 3系列等Radeon顯示卡如何為遊戲玩家、創作者和開發人員提供一系列優化的工作負載,其中包括:
- 視訊品質增強
- 背景噪音消除
- 文字轉圖像 (GenAI)
- 大型語言模式 (GenAI)
- 圖片修改
- 影片編輯
- 升級
- 文字到圖像
- 模型訓練(Linux)
- ROCm 平台 (Linux)
從AMD RDNA 3架構開始,Radeon RX 7000 GPU和Ryzen 7000/8000 CPU上配備的最新GPU提供了超過2倍的AI效能提升。
這些GPU產品提供多達192個AI加速器,這些加速器針對FP16工作負載進行了優化,在Microsoft DirectML、Nod.AI Shark和ROCm等多個ML框架中進行了優化,並有大型專用VRAM池,這對於處理大型資料集至關重要(高達48GB),並且還有透過Infinity Cache技術提升的更快頻寬。
AMD表示PC平台上的大多數AI用例包括LLM和Diffusion模型,這些模型主要依賴所運行硬體的FP16運算和記憶體功能。某些模型(例如SDXL(擴散))受計算限制,需要大約4-16GB記憶體,而Llama2-13B和Mistral-8x 7B受記憶體限制,最多可使用23GB記憶體。
如前所述AMD擁有多種有專用AI加速功能的硬體。即使該公司的Radeon RX 7600 XT(售價329美元)也擁有16GB VRAM,在性能方面,它比LM Studio中的Ryzen 7 8700G提升了3.6倍,而RX 7900 XT則比RX 7900 XT快8倍。
LM Studio 效能(越高越好):
- Ryzen 7 8700G NPU: 11 Tokens/second
- RX 7600 XT 16 GB: 40 Tokens/second
- RX 7900 XT 20 GB: 85 Tokens/second
AMUSE 擴散(越低越好):
- Ryzen 7 8700G NPU: 2.6 second/image
- RX 7600 XT 16 GB: 0.97 second/image
- RX 7900 XT 20 GB: 0.6 second/image
AMD也與NVIDIA的GeForce RTX進行了一個小小的比較,NVIDIA團隊稱之為Premium AI PC平台。兩個系列都提供類似的支援,但AMD展示了其16GB GPU的售價較低,為329美元(7600 XT),而NVIDIA最入門級的16GB GPU起價約為500美元(4060 TI 16 GB )。該公司還擁有可擴展至48GB記憶體的高階產品。AMD先前也曾在AI方面以更好的價值展現出與Intel Core Ultra相比的強勁性能。
展望未來,AMD討論了ROCm 6.0的進展情況,以及開源如何獲得對Radeon RX 7900 XTX、7900 XT、7900 GRE、PRO W7900和PRO W7800等消費級硬體的支援。 ROCm 6.0在Ubuntu 22.03.3 (Linux) 作業系統上支援PyTorch和ONNX Runtime ML模型和演算法,並透過為更複雜的模型添加INT8來提高互通性。
該公司還試圖透過為開發人員提供一系列軟體堆疊和硬體文件來使ROCm更加開源。
AMD及其ROCm正在與主導的NVIDIA CUDA和TensorRT競爭,而Intel也憑藉自己的OneAPI AI取得了進展。這是PC平台上的人工智慧工作負載需要關注的三種力量,因此預計未來現有和下一代硬體將出現大量創新和最佳化。
消息來源 |