找回密碼註冊
作者: sxs112.tw
查看: 5835
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

打印 上一主題 下一主題

[顯示卡器] AMD談論RDNA 3 GPU和XDNA NPU的AI功能:Radeon RX 7900 XT比Ryzen 7 8700G快8倍

[複製鏈接]| 回復
跳轉到指定樓層
1#
AMD分享了一些有關RDNA 3 GPU和XDNA NPU硬體在以消費者為中心的人工智慧工作負載中的功能的有趣數據。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_2-1456x819.png

毫無疑問,AMD透過在Ryzen APU實施XDNA NPU,在向更廣泛的PC用戶提供AI功能方面一直處於領先地位。第一款NPU於2023年與Phoenix Ryzen 7040 APU一起推出,最近又透過Hawk Point Ryzen 8040系列進行了更新。除了NPU之外,AMD的RDNA 3 GPU架構還整合了大量可以處理這些工作負載的專用AI核心,該公司正試圖透過其ROCm軟體套件來鞏固其勢頭。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_4-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_3-1456x819.png

在最新的與專家會面網路研討會上,AMD討論了RDNA 3系列等Radeon顯示卡如何為遊戲玩家、創作者和開發人員提供一系列優化的工作負載,其中包括:
  • 視訊品質增強
  • 背景噪音消除
  • 文字轉圖像 (GenAI)
  • 大型語言模式 (GenAI)
  • 圖片修改
  • 影片編輯
  • 升級
  • 文字到圖像
  • 模型訓練(Linux)
  • ROCm 平台 (Linux)

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_5.png

從AMD RDNA 3架構開始,Radeon RX 7000 GPU和Ryzen 7000/8000 CPU上配備的最新GPU提供了超過2倍的AI效能提升。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_6.png

這些GPU產品提供多達192個AI加速器,這些加速器針對FP16工作負載進行了優化,在Microsoft DirectML、Nod.AI Shark和ROCm等多個ML框架中進行了優化,並有大型專用VRAM池,這對於處理大型資料集至關重要(高達48GB),並且還有透過Infinity Cache技術提升的更快頻寬。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_7.png

AMD表示PC平台上的大多數AI用例包括LLM和Diffusion模型,這些模型主要依賴所運行硬體的FP16運算和記憶體功能。某些模型(例如SDXL(擴散))受計算限制,需要大約4-16GB記憶體,而Llama2-13B和Mistral-8x 7B受記憶體限制,最多可使用23GB記憶體。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_8.png

如前所述AMD擁有多種有專用AI加速功能的硬體。即使該公司的Radeon RX 7600 XT(售價329美元)也擁有16GB VRAM,在性能方面,它比LM Studio中的Ryzen 7 8700G提升了3.6倍,而RX 7900 XT則比RX 7900 XT快8倍。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_9-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_10-1456x819.png

LM Studio 效能(越高越好):
  • Ryzen 7 8700G NPU: 11 Tokens/second
  • RX 7600 XT 16 GB: 40 Tokens/second
  • RX 7900 XT 20 GB: 85 Tokens/second


AMUSE 擴散(越低越好):
  • Ryzen 7 8700G NPU: 2.6 second/image
  • RX 7600 XT 16 GB: 0.97 second/image
  • RX 7900 XT 20 GB: 0.6 second/image

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_11.png

AMD也與NVIDIA的GeForce RTX進行了一個小小的比較,NVIDIA團隊稱之為Premium AI PC平台。兩個系列都提供類似的支援,但AMD展示了其16GB GPU的售價較低,為329美元(7600 XT),而NVIDIA最入門級的16GB GPU起價約為500美元(4060 TI 16 GB )。該公司還擁有可擴展至48GB記憶體的高階產品。AMD先前也曾在AI方面以更好的價值展現出與Intel Core Ultra相比的強勁性能。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_22-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_21-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_20-1456x819.png

展望未來,AMD討論了ROCm 6.0的進展情況,以及開源如何獲得對Radeon RX 7900 XTX、7900 XT、7900 GRE、PRO W7900和PRO W7800等消費級硬體的支援。 ROCm 6.0在Ubuntu 22.03.3 (Linux) 作業系統上支援PyTorch和ONNX Runtime ML模型和演算法,並透過為更複雜的模型添加INT8來提高互通性。

該公司還試圖透過為開發人員提供一系列軟體堆疊和硬體文件來使ROCm更加開源。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_12-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_13-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_14-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_18-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_19-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_23-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_24-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_25-1456x819.png

AMD及其ROCm正在與主導的NVIDIA CUDA和TensorRT競爭,而Intel也憑藉自己的OneAPI AI取得了進展。這是PC平台上的人工智慧工作負載需要關注的三種力量,因此預計未來現有和下一代硬體將出現大量創新和最佳化。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-13 21:57 , Processed in 0.085894 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表