找回密碼註冊
作者: sxs112.tw
查看: 6142
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    SAMSUNG T7 Shield 移動固態硬碟

    [*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

    GEX PRO 850W玩家開箱體驗分享活動

    卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

    體驗極速WiFi 7!MSI Roamii BE Lite Mesh

    第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

    極致效能 為遊戲而生 990 PRO SSD 玩家體驗

    [*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

    打印 上一主題 下一主題

    [顯示卡器] AMD談論RDNA 3 GPU和XDNA NPU的AI功能:Radeon RX 7900 XT比Ryzen 7 8700G快8倍

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    AMD分享了一些有關RDNA 3 GPU和XDNA NPU硬體在以消費者為中心的人工智慧工作負載中的功能的有趣數據。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_2-1456x819.png

    毫無疑問,AMD透過在Ryzen APU實施XDNA NPU,在向更廣泛的PC用戶提供AI功能方面一直處於領先地位。第一款NPU於2023年與Phoenix Ryzen 7040 APU一起推出,最近又透過Hawk Point Ryzen 8040系列進行了更新。除了NPU之外,AMD的RDNA 3 GPU架構還整合了大量可以處理這些工作負載的專用AI核心,該公司正試圖透過其ROCm軟體套件來鞏固其勢頭。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_4-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_3-1456x819.png

    在最新的與專家會面網路研討會上,AMD討論了RDNA 3系列等Radeon顯示卡如何為遊戲玩家、創作者和開發人員提供一系列優化的工作負載,其中包括:
    • 視訊品質增強
    • 背景噪音消除
    • 文字轉圖像 (GenAI)
    • 大型語言模式 (GenAI)
    • 圖片修改
    • 影片編輯
    • 升級
    • 文字到圖像
    • 模型訓練(Linux)
    • ROCm 平台 (Linux)

    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_5.png

    從AMD RDNA 3架構開始,Radeon RX 7000 GPU和Ryzen 7000/8000 CPU上配備的最新GPU提供了超過2倍的AI效能提升。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_6.png

    這些GPU產品提供多達192個AI加速器,這些加速器針對FP16工作負載進行了優化,在Microsoft DirectML、Nod.AI Shark和ROCm等多個ML框架中進行了優化,並有大型專用VRAM池,這對於處理大型資料集至關重要(高達48GB),並且還有透過Infinity Cache技術提升的更快頻寬。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_7.png

    AMD表示PC平台上的大多數AI用例包括LLM和Diffusion模型,這些模型主要依賴所運行硬體的FP16運算和記憶體功能。某些模型(例如SDXL(擴散))受計算限制,需要大約4-16GB記憶體,而Llama2-13B和Mistral-8x 7B受記憶體限制,最多可使用23GB記憶體。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_8.png

    如前所述AMD擁有多種有專用AI加速功能的硬體。即使該公司的Radeon RX 7600 XT(售價329美元)也擁有16GB VRAM,在性能方面,它比LM Studio中的Ryzen 7 8700G提升了3.6倍,而RX 7900 XT則比RX 7900 XT快8倍。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_9-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_10-1456x819.png

    LM Studio 效能(越高越好):
    • Ryzen 7 8700G NPU: 11 Tokens/second
    • RX 7600 XT 16 GB: 40 Tokens/second
    • RX 7900 XT 20 GB: 85 Tokens/second


    AMUSE 擴散(越低越好):
    • Ryzen 7 8700G NPU: 2.6 second/image
    • RX 7600 XT 16 GB: 0.97 second/image
    • RX 7900 XT 20 GB: 0.6 second/image

    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_11.png

    AMD也與NVIDIA的GeForce RTX進行了一個小小的比較,NVIDIA團隊稱之為Premium AI PC平台。兩個系列都提供類似的支援,但AMD展示了其16GB GPU的售價較低,為329美元(7600 XT),而NVIDIA最入門級的16GB GPU起價約為500美元(4060 TI 16 GB )。該公司還擁有可擴展至48GB記憶體的高階產品。AMD先前也曾在AI方面以更好的價值展現出與Intel Core Ultra相比的強勁性能。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_22-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_21-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_20-1456x819.png

    展望未來,AMD討論了ROCm 6.0的進展情況,以及開源如何獲得對Radeon RX 7900 XTX、7900 XT、7900 GRE、PRO W7900和PRO W7800等消費級硬體的支援。 ROCm 6.0在Ubuntu 22.03.3 (Linux) 作業系統上支援PyTorch和ONNX Runtime ML模型和演算法,並透過為更複雜的模型添加INT8來提高互通性。

    該公司還試圖透過為開發人員提供一系列軟體堆疊和硬體文件來使ROCm更加開源。
    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_12-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_13-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_14-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_18-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_19-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_23-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_24-1456x819.png


    AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_25-1456x819.png

    AMD及其ROCm正在與主導的NVIDIA CUDA和TensorRT競爭,而Intel也憑藉自己的OneAPI AI取得了進展。這是PC平台上的人工智慧工作負載需要關注的三種力量,因此預計未來現有和下一代硬體將出現大量創新和最佳化。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2024-12-23 04:07 , Processed in 0.184071 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表