找回密碼註冊
作者: sxs112.tw
查看: 885
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    SAMSUNG T7 Shield 移動固態硬碟

    [*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

    GEX PRO 850W玩家開箱體驗分享活動

    卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

    體驗極速WiFi 7!MSI Roamii BE Lite Mesh

    第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

    極致效能 為遊戲而生 990 PRO SSD 玩家體驗

    [*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

    打印 上一主題 下一主題

    [軟體遊戲] AMD的痛點是ROCm軟體,NVIDIA的CUDA軟體在AI開發方面仍然優越

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    正如大多數讀者所知資料中心的AI加速之戰競爭異常激烈,NVIDIA提供了頂級軟體。然而AMD近年來試圖透過其用於AI和HPC的Instinct MI300X加速器系列來獲取超大規模廠商和OEM願意花費的部分收入。儘管擁有不錯的硬體,但該公司在軟體方面與競爭對手NVIDIA的差距還差得遠。根據研究和諮詢公司SemiAnalysis的最新報告他們使用Instinct MI300X進行了為期五個月的實驗,用於訓練和測試。結果令人驚訝:即使有更好的硬體,AMD的軟體(包括 ROCm)也嚴重降低了AMD的效能。
    Ps8C8zXdm2RggTRH.jpg

    SemiAnalysis指出在NVIDIA的GPU與AMD的MI300X進行比較時,我們發現由於AMD公開發布的軟體中缺乏以及AMD的測試不足,MI300X的優勢並未實現。進一步補充AMD的軟體體驗充滿了錯誤,無法透過AMD進行開箱即用的訓練。我們希望AMD能夠在訓練工作負載方面成為NVIDIA的強大競爭對手,但可惜的是截至目前情況還很糟糕。

    NVIDIA的巨大優勢在於該軟體功能齊全。 SemiAnalysis報告指出在AMD試圖填補CUDA護城河的同時,NVIDIA工程師也在加班加點地通過新功能、資料庫和性能更新來加深護城河。Tinybox和Tinybox Pro的開發者Tinygrad也在他們的X配置中多次證實了這一點,該配置文件過去也存在AMD軟體的嚴重問題。

    在審視2023年的AMD Instinct MI300X和NVIDIA H100/H200晶片時,MI300X在性能方面明顯成為贏家。 FP16計算的速度達到1,307 TFLOP/s,超過了 NVIDIA H100的989 TFLOP/s。 MI300X擁有192GB HBM3,記憶體頻寬為5.3TB/s。這些規格甚至有利於NVIDIA的H200,它提供141GB HBM3e記憶體和4.8TB/s記憶體頻寬。 AMD晶片甚至具有更低的總擁有成本模型,光是網路費用就便宜40%。從理論上講AMD晶片看起來優於NVIDIA的Hopper產品,但實際上並沒有那麼好。

    AMD的內部團隊幾乎無法使用GPU來開發和完善ROCm軟體。 Tensorwave是最大的AMD GPU雲端供應商之一,它擁有自己的GPU,免費為 AMD 工程師提供按需硬體,以便修復軟體。這一切都是Tensorwave為AMD GPU付費,將自己的GPU免費租回給AMD的情況。最後SemiAnalysis指出AMD軟體已根據他們的建議進行了改進。儘管如此該公司要達到NVIDIA的CUDA穩定性和性能水平還有很長的路要走。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2024-12-24 10:17 , Processed in 0.765878 second(s), 34 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表