找回密碼註冊
作者: lin.sinchen
查看: 52546
回復: 0

精華與得獎推薦: 圖檔下載

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    SAMSUNG T7 Shield 移動固態硬碟

    [*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

    GEX PRO 850W玩家開箱體驗分享活動

    卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

    體驗極速WiFi 7!MSI Roamii BE Lite Mesh

    第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

    極致效能 為遊戲而生 990 PRO SSD 玩家體驗

    [*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

    打印 上一主題 下一主題

    [NVIDIA] LEADTEK NVIDIA RTX 6000 Ada Generation 專業繪圖卡開箱測試 / 生成 AI 算圖、Omniverse 創作

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    Leadtek-NVIDIA-RTX-6000-Ada-Generation_774x300.jpg


    NVIDIA 新一代專業繪圖卡「NVIDIA RTX™ 6000 Ada Generation」,採用最新 Ada Lovelace 架構、升級 CUDA 核心、第三代 RT 核心與第四代 Tensor 核心,並擁有 48GB ECC 視訊記憶體、3 組支援 AV1 的編解碼引擎、虛擬化、Quadro Sync II、RTX Desktop 與企業專屬功能,滿足當代的影像輸出、AI、繪圖、運算等專業工作任務。而專業繪圖卡的銷售與支援服務,則交由 NVIDIA 長期的合作伙伴麗臺科技 LEADTEK 為各位服務。

    規格
    GPU 架構:NVIDIA Ada Lovelace
    CUDA 平行處理核心:18176
    NVIDIA Tensor 核心:568
    NVIDIA RT 核心:142
    單精度效能:91.1 TFLOPS
    RT Core 效能:210.6 TFLOPS
    Tensor 效能:1457 TFLOPS2
    GPU 記憶體:48 GB GDDR6 ECC
    記憶體介面:384-bit
    記憶體頻寬:960 GB/s
    最大功耗:300 W
    繪圖匯流排:PCI Express 4.0 x16
    顯示連接器:DP 1.4 x4
    尺寸:4.4" H x 10.5" L 雙寬度
    重量:1.18kg
    外部電源連接器:1x PCIe 12+4 pin
    同步輸出:支援 Quadro Sync II
    編解碼引擎:3x encode, 3x decode (+AV1 encode/decode)


    幾乎滿血的 AD102 核心 NVIDIA RTX 6000 Ada 世代專業繪圖卡

    新一代 NVIDIA Ada Lovelace 架構,帶來更強悍的 CUDA、RT 與 Tensor 等核心的升級,以及意想不到 DLSS 3 的 AI 補幀加速技術,藉由 Optical Flow Accelerator 捕捉像素的方向,對於需要即時光線追蹤渲染的專業應用,可藉助 DLSS 3 的 AI 推論生成 7/8 的影像,大幅提升整體效能。

    而 NVIDIA RTX 專業繪圖卡也推出新一代「NVIDIA RTX™ 6000 Ada Generation」,採用 AD102 核心幾乎滿血的 142 組 SM 配置,有著 18176 CUDA、568 Tensor、142 RT 等核心規格,相比 RTX 4090 的 128 組 SM 規格要高了一些。


    ↑ RTX 6000 Ada Generation 與 RTX 4090 規格比較。


    說道 NVIDIA RTX 專業繪圖卡與 GeForce RTX 遊戲顯卡的差異,從規格來看 RTX 6000 具備超大的 48GB GDDR6 記憶體,並支援記憶體 ECC 錯誤修正碼的功能,但相對記憶體頻寬略低於 GR6X 的規格;此外顯卡的 TGP 也降至 300W。

    但是,RTX 6000 支援著更多的企業專業應用,像是 RTX 虛擬工作站(vWS)、3 組第五代 NVDEC 解碼引擎與第八代 NVENC 編碼引擎、Mosaic 多顯示器、RTX 桌面管理軟體、Quadro Sync II,以及企業管理工具等。

    此外,NVIDIA 專業繪圖卡主要都由合作伙伴銷售,像是麗臺科技銷售的專業繪圖卡產品,享有「三年保固」,保固內提供「到府收送」的服務,並提供「0800-600-206」技術服務專線,能給予企業、客戶完整的技術支援與服務;這也是與遊戲顯卡差異最大的地方。


    ↑ 3 年保固、到府收送、免付費客服專線。


    同時 NVIDIA 提供專業繪圖卡「正式分支 / Studio」與「新功能分支」的驅動分支版本。簡單來說,「正式分支 / Studio」提供最佳穩定性與效能,以及 ISV 認證、較長的生命週期、安全性更新等最穩定的版本;而「新功能分支」則是提供最新的驅動功能、錯誤修正與作業系統支援。


    ↑ NVIDIA RTX 驅動下載。


    NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡開箱 / 26.7cm 長、2-Slot、鼓風扇工作站設計

    NVIDIA RTX 6000 Ada Generation 專業繪圖卡,採用 26.7cm 長、2-Slot 安裝空間、單鼓風扇散熱的工作站設計,畢竟高階工作站、伺服器都有著強勁的散熱氣流替主機散熱,因此專業繪圖卡也維持著相同的散熱氣流設計,而這設計也對多 GPU 擴充更佳友善。

    RTX 6000 採用高質感的鏡面黑外殼,側面則有著這代 DGX 的金色邊框,以及 NVIDIA 與 RTX 6000 的字樣。供電接頭則移至顯卡前方,採用單 PCIe 16 pin 12VHPWR 供電。


    ↑ NVIDIA RTX 6000 Ada Generation 外包裝。


    RTX 6000 採用傳統鼓風扇散熱設計,全黑的鏡面表面搭配金圈點綴,而側面的金色邊框與迷人的曲線,讓專業繪圖有著與眾不同的設計感。


    ↑ RTX 6000 專業繪圖卡。


    ↑ 正面是全黑的鏡面表面。


    顯卡側面左上角則有著 Quadro Sync II 的連接介面。而顯卡的前方,則有著 PCIe 16 pin 12VHPWR 供電插座。


    ↑ Quadro Sync II 連接介面。


    ↑ PCIe 16 pin 12VHPWR 供電。


    RTX 6000 專業繪圖卡提供 4 個 DisplayPort 1.4 連接埠,同時配件中則有 DP 1.4 轉 HDMI 的接頭可使用。最高可同時輸出 4 個 4K@120Hz 或 5K@60Hz 的專業顯示器,當然也可支援 2 個 8K@60Hz 的超高解析度螢幕輸出。


    ↑ 4 個 DisplayPort 1.4 連接埠。


    ↑ 配件則有 PCIe 16 pin 12VHPWR 轉 2 個 PCIe 6 pin 轉接頭,以及 DisplayPort 1.4 轉 HDMI 轉接頭。


    NVIDIA Control Center、ECC、Mosaic、RTX Desktop

    RTX 6000 採用 48GB GDDR6 ECC 記憶體,預設上已啟用 ECC 功能。若要調整則可在 NVIDIA Control Center 將 ECC 狀態設定為關閉。畢竟專業工作的運算、模擬都需要花費長時間進行,因此藉由記憶體的錯誤修正碼 ECC,能為工作站提高計算精確度與可靠性。


    ↑ ECC state。


    對於專業工作站的多 GPU、多螢幕連接情境下,NVIDIA Control Center 也提供 Topology 資訊,從系統驅動版本、專業繪圖卡的 4 個螢幕輸出埠,以及目前正在連接的外接螢幕資訊,讓用戶可以更有效的管理工作站目前使用的 GPU 與外接螢幕。


    ↑ System Topology。


    NVIDIA Mosaic 多顯示器技術,支援最多 4 個 GPU、16 個顯示器的畫面整合,用戶可依據使用環境來排列顯示器,並整合作為單一桌面使用,並提供螢幕邊框校正、投影機重疊等進階的多螢幕整合功能。


    ↑ NVIDIA Mosaic。


    RTX 桌面管理軟體,則是更強大的桌面視窗排列、管理的工具軟體,而且可直接在軟體中控制多螢幕內的所有視窗排列,並可將目前的視窗配置儲存為 Profile,並提供預設的幾種 GRID 分割方式,讓多螢幕工作情境可更有效的管理。


    ↑ RTX 桌面管理軟體,可以直接在軟體中排列每個螢幕的視窗位置。


    ↑ 並提供 GRID 分割畫面。


    ↑ 也可將設定儲存為 Profile。


    而在 Control Center 當中也可以調整 GPU 的使用模式,預設是繪圖、運算都會使用的模式,倘若是指做繪圖功能也可切換至專注繪圖任務的 GPU 模式。


    ↑ GPU 使用模式。


    NVIDIA RTX™ 6000 Ada Generation 創作、渲染效能測試

    效能評估方面則使用專業領域會參考的 SPECviewperf、Blender、Vray 與 OCTANEBENCH 等工具,來測試 RTX 6000 專業繪圖卡的渲染、運算效能,同時也加入 DaVinci Resolve 18 影音輸出測試、Omniverse Creator 與 Stable Diffusion 等測試。

    測試平台
    處理器:Intel Core i9-13900K
    主機板:ASUS ROG MAXIMUS Z790 HERO
    記憶體:KLEVV DDR5-7200 16GBx2
    顯示卡:NVIDIA RTX™ 6000 Ada Generation
    系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
    散熱器:NZXT 360mm 水冷
    電源供應器:Seasonic VERTEX GX-1000
    作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
    驅動版本:NVIDIA 528.89


    GPU-Z 檢視 RTX 6000 資訊,採用 4nm 製程的 AD102 GPU,有著 18176 個渲染 CUDA 核心,以及 46080 MB GDDR6(Samsung)記憶體,而 GPU 預設時脈 915 MHz、Boost 2505 MHz。


    ↑ GPU-Z。


    DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。


    ↑ DaVinci Resolve 18。


    首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。

    Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色標示;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。

    SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。

    RTX 6000 多達 3 組第八代 NVENC 編碼引擎,對於 4K 影音輸出工作有著相當快的處理能力,即便 4 個 HD 拼成 4K 輸出也只需 1 分 10 秒即可完成任務,其餘輸出則都在 1 分鐘之內就完成。


    ↑ DaVinci Resolve 18 影音輸出。


    第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。

    輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。


    ↑ 8K、AV1 測試專案。


    對於 RTX 6000 來說輸出 4K 專案確實相當輕鬆,而若升級到 8K 影片輸出,不論 HEVC 或 AV1 編碼都能有相當快的輸出效能。


    ↑ DaVinci Resolve 18 影音輸出。


    Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.5.0 進行 Demo 專案的渲染工作測試。

    Blender Benchmark 測試 RTX 6000 在 monster 場景達到 5643.302 分、junkshop 場景 2614.596 分、classroom 場景 2708.850 分,滿足 3D 創作所需的渲染效能。


    ↑ Blender。


    V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。

    V-Ray 測試,RTX 6000 採用 CUDA 運算可達到每秒 3166 vpath 的計算量,而採用 RTX 運算則可達到每秒 3904 vray 的運算效能。


    ↑ V-Ray CUDA。


    ↑ V-Ray RTX。


    OctaneBench 是快速且獨立的渲染測試工具,其核心為 OTOY Octane Render,可充分利用 RTX 與 CUDA 技術,並支援主流的 3D 應用程式,讓創作者能有著快速高品質的渲染輸出。

    測試中包含 4 種場景與 Info channels、direct lighting、path tracing 等核心,RTX 6000 能提供相當可觀的運算速度,滿足創作者所需的快速渲染能力。


    ↑ OctaneBench。


    SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。

    測試為 3840 x 2160 解析度、成績為 FPS,可見 RTX 6000 在各項工作中都能有著相當高的 FPS 表現,讓專業工作者在創作、模擬、運算時也有足夠的繪圖效能。


    ↑ SPECviewperf 2020。


    Procyon AI Inference 測試,提供多種 AI 引擎的推論測試,並採用常見的神經網路像是 MobileNet、ResNet 50、Inception V4、DeepLab V3、YOLO V3、Real-ESRGAN 來進行推論測試,除了 Procyon 提供的總成績外,也可分別檢視各個推論項目的平均推論時間與推論數量。

    RTX 6000 採用 TensorRT 引擎、float32 精度在 MobileNet V3 達到 0.47ms 的推論時間、ResNet 50 平均 1.08ms、Inception V4 平均 3.35ms、DeepLab V3 平均 2.73ms、YOLO V3 平均 2.69ms、Real-ESRGAN 平均 91.57ms 的推論時間。


    ↑ Procyon AI Inference、TensorRT 引擎、float32 精度。


    ↑ 推論成績。


    NVIDIA RTX™ 6000 Ada Generation Omniverse Creator 測試

    NVIDIA Omniverse 加速 3D 設計的協作平台,不僅能無縫支援業界主流的 3D apps,讓來自世界各地的創作者能同時創作 3D 專案,並得到即時的渲染效果呈現,更具備 Digital Twin、機器人訓練模擬等功能。

    此次測試主要以 Omniverse Create 的專案來進行即時光追渲染、DLSS 3 加速的 FPS 效能測試。測試的專案則包含:Campfire_Main_03_Flow3 模擬營火燃燒的物理效果、Flowers4 測試 Instanced geometry and particle flow animation、Incense_Main 測試煙霧模擬與反射材料變化、JadeTiger 測試場景包含玉的高級材料的細緻模型、Warehouse_Physics_Stage 測試場景則是模擬倉庫貨架倒塌的骨牌效應。


    ↑ Omniverse Create。


    RTX 6000 在 UHD ViewPort 與 DLSS3 Quality 設定下,Campfire 平均 43.87 FPS、Flowers4 平均 38.97 FPS、Incense_Main 平均 61.15 FPS、JadeTiger 平均 27.17 FPS、Warehouse_Physics_Stage 平均 24.24 FPS 的效能表現。


    ↑ Omniverse Create 測試。


    NVIDIA RTX™ 6000 Ada Generation AI 算圖 Stable Diffusion 測試

    現在很紅的 AI 深度學習文字到圖像的生成模型 Stable Diffusion,經過手動安裝於 Automatic1111 Web UI 發行的版本,加入最新 cuDNN DLLs 讓 Stable Diffusion 能夠獲得最佳的 GPU 加速效能,藉此來比較 GPU 的 AI 運算能力。


    ↑ Stable Diffusion。


    測試的設定與咒語可參考圖片下方說明,通過測試 RTX 6000 可達到每分鐘 17.91 張的圖片生成速度。


    ↑ Stable Diffusion 測試。


    NVIDIA RTX™ 6000 Ada Generation 功耗與溫度測量

    顯卡的功耗與溫度測試,使用 Omniverse 與 DaVinci Resolve 18 測試的專案運行 3 次後記錄 GPU 溫度與功耗,而最高功耗則藉由 Furmark 來進行燒機測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。

    顯卡溫度方面,RTX 6000 最高溫度壓在 83.4°C,Omniverse 3D 渲染則在 75.4°C、DaVinci Resolve 18 的 8K 影音輸出則更低僅 63.9°C 的溫度表現。可見即便標準尺寸的鼓風扇也能替 GPU 帶來不錯的散熱表現。

    顯卡 TBP 功耗測試,在 Furmark 壓力測試達到最高 287W 的平均功耗,而 Omniverse 3D 渲染則維持在 263.2W、DaVinci Resolve 18 的 8K 影音輸出僅 150W 的功耗表現。


    ↑ GPU 溫度測試。


    ↑ GPU 功耗測試。


    總結

    NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡,有著相當強悍的效能與工作站相容的散熱設計,不論是 DaVinci Resolve 18 的 8K AV1 影音輸出、Omniverse Creator 的即時光追 UHD 模擬渲染、生成式 AI 的 Stable Diffusion 文字推論圖片,都能有著相當出色的效能表現。

    RTX 6000 能滿足專業用戶穩定的效能需求,更何況 48GB GDDR6 ECC 記憶體,更可滿足大專案的記憶體使用量,像是 Omniverse 的 Warehouse_Physics_Stage 專案在 QHD Viewport 就佔用 17GB 的視訊記憶體,這記憶體需求絕非一般 GeForce RTX 遊戲顯卡能滿足的需求。

    NVIDIA 給予專業用戶完整的軟硬體生態系,像是 GPU 虛擬化、Mosaic、RTX 桌面管理,以及由 NVIDIA 開發的 SDK 軟體工具等整合,橫跨 AI、資料科學、資料中心、雲端、設計、模擬、機器人、高效能運算、自駕車等不同領域,讓各行各業的難題都可通過 GPU 加速迎刃而解。

    最後,NVIDIA 的專業繪圖卡產品,由麗臺科技則提供完善的售後服務,不僅享有 3 年到府收送的保固服務,更有著免付費的客服專線「0800-600-206」,提供各領域的專業用戶最安心、穩定的創作、運算體驗。
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2024-12-22 15:57 , Processed in 0.111227 second(s), 67 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表