LEADTEK NVIDIA RTX 6000 Ada Generation 專業繪圖卡開箱測試 / 生成 AI 算圖、Omniverse 創作
NVIDIA 新一代專業繪圖卡「NVIDIA RTX™ 6000 Ada Generation」,採用最新 Ada Lovelace 架構、升級 CUDA 核心、第三代 RT 核心與第四代 Tensor 核心,並擁有 48GB ECC 視訊記憶體、3 組支援 AV1 的編解碼引擎、虛擬化、Quadro Sync II、RTX Desktop 與企業專屬功能,滿足當代的影像輸出、AI、繪圖、運算等專業工作任務。而專業繪圖卡的銷售與支援服務,則交由 NVIDIA 長期的合作伙伴麗臺科技 LEADTEK 為各位服務。
規格
GPU 架構:NVIDIA Ada Lovelace
CUDA 平行處理核心:18176
NVIDIA Tensor 核心:568
NVIDIA RT 核心:142
單精度效能:91.1 TFLOPS
RT Core 效能:210.6 TFLOPS
Tensor 效能:1457 TFLOPS2
GPU 記憶體:48 GB GDDR6 ECC
記憶體介面:384-bit
記憶體頻寬:960 GB/s
最大功耗:300 W
繪圖匯流排:PCI Express 4.0 x16
顯示連接器:DP 1.4 x4
尺寸:4.4" H x 10.5" L 雙寬度
重量:1.18kg
外部電源連接器:1x PCIe 12+4 pin
同步輸出:支援 Quadro Sync II
編解碼引擎:3x encode, 3x decode (+AV1 encode/decode)
幾乎滿血的 AD102 核心 NVIDIA RTX 6000 Ada 世代專業繪圖卡
新一代 NVIDIA Ada Lovelace 架構,帶來更強悍的 CUDA、RT 與 Tensor 等核心的升級,以及意想不到 DLSS 3 的 AI 補幀加速技術,藉由 Optical Flow Accelerator 捕捉像素的方向,對於需要即時光線追蹤渲染的專業應用,可藉助 DLSS 3 的 AI 推論生成 7/8 的影像,大幅提升整體效能。
而 NVIDIA RTX 專業繪圖卡也推出新一代「NVIDIA RTX™ 6000 Ada Generation」,採用 AD102 核心幾乎滿血的 142 組 SM 配置,有著 18176 CUDA、568 Tensor、142 RT 等核心規格,相比 RTX 4090 的 128 組 SM 規格要高了一些。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-1.jpg
↑ RTX 6000 Ada Generation 與 RTX 4090 規格比較。
說道 NVIDIA RTX 專業繪圖卡與 GeForce RTX 遊戲顯卡的差異,從規格來看 RTX 6000 具備超大的 48GB GDDR6 記憶體,並支援記憶體 ECC 錯誤修正碼的功能,但相對記憶體頻寬略低於 GR6X 的規格;此外顯卡的 TGP 也降至 300W。
但是,RTX 6000 支援著更多的企業專業應用,像是 RTX 虛擬工作站(vWS)、3 組第五代 NVDEC 解碼引擎與第八代 NVENC 編碼引擎、Mosaic 多顯示器、RTX 桌面管理軟體、Quadro Sync II,以及企業管理工具等。
此外,NVIDIA 專業繪圖卡主要都由合作伙伴銷售,像是麗臺科技銷售的專業繪圖卡產品,享有「三年保固」,保固內提供「到府收送」的服務,並提供「0800-600-206」技術服務專線,能給予企業、客戶完整的技術支援與服務;這也是與遊戲顯卡差異最大的地方。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-3.jpg
↑ 3 年保固、到府收送、免付費客服專線。
同時 NVIDIA 提供專業繪圖卡「正式分支 / Studio」與「新功能分支」的驅動分支版本。簡單來說,「正式分支 / Studio」提供最佳穩定性與效能,以及 ISV 認證、較長的生命週期、安全性更新等最穩定的版本;而「新功能分支」則是提供最新的驅動功能、錯誤修正與作業系統支援。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-33.jpg
↑ NVIDIA RTX 驅動下載。
NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡開箱 / 26.7cm 長、2-Slot、鼓風扇工作站設計
NVIDIA RTX 6000 Ada Generation 專業繪圖卡,採用 26.7cm 長、2-Slot 安裝空間、單鼓風扇散熱的工作站設計,畢竟高階工作站、伺服器都有著強勁的散熱氣流替主機散熱,因此專業繪圖卡也維持著相同的散熱氣流設計,而這設計也對多 GPU 擴充更佳友善。
RTX 6000 採用高質感的鏡面黑外殼,側面則有著這代 DGX 的金色邊框,以及 NVIDIA 與 RTX 6000 的字樣。供電接頭則移至顯卡前方,採用單 PCIe 16 pin 12VHPWR 供電。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-2.jpg
↑ NVIDIA RTX 6000 Ada Generation 外包裝。
RTX 6000 採用傳統鼓風扇散熱設計,全黑的鏡面表面搭配金圈點綴,而側面的金色邊框與迷人的曲線,讓專業繪圖有著與眾不同的設計感。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-5.jpg
↑ RTX 6000 專業繪圖卡。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-6.jpg
↑ 正面是全黑的鏡面表面。
顯卡側面左上角則有著 Quadro Sync II 的連接介面。而顯卡的前方,則有著 PCIe 16 pin 12VHPWR 供電插座。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-7.jpg
↑ Quadro Sync II 連接介面。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-8.jpg
↑ PCIe 16 pin 12VHPWR 供電。
RTX 6000 專業繪圖卡提供 4 個 DisplayPort 1.4 連接埠,同時配件中則有 DP 1.4 轉 HDMI 的接頭可使用。最高可同時輸出 4 個 4K@120Hz 或 5K@60Hz 的專業顯示器,當然也可支援 2 個 8K@60Hz 的超高解析度螢幕輸出。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-10.jpg
↑ 4 個 DisplayPort 1.4 連接埠。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-11.jpg
↑ 配件則有 PCIe 16 pin 12VHPWR 轉 2 個 PCIe 6 pin 轉接頭,以及 DisplayPort 1.4 轉 HDMI 轉接頭。
NVIDIA Control Center、ECC、Mosaic、RTX Desktop
RTX 6000 採用 48GB GDDR6 ECC 記憶體,預設上已啟用 ECC 功能。若要調整則可在 NVIDIA Control Center 將 ECC 狀態設定為關閉。畢竟專業工作的運算、模擬都需要花費長時間進行,因此藉由記憶體的錯誤修正碼 ECC,能為工作站提高計算精確度與可靠性。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-12.jpg
↑ ECC state。
對於專業工作站的多 GPU、多螢幕連接情境下,NVIDIA Control Center 也提供 Topology 資訊,從系統驅動版本、專業繪圖卡的 4 個螢幕輸出埠,以及目前正在連接的外接螢幕資訊,讓用戶可以更有效的管理工作站目前使用的 GPU 與外接螢幕。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-13.jpg
↑ System Topology。
NVIDIA Mosaic 多顯示器技術,支援最多 4 個 GPU、16 個顯示器的畫面整合,用戶可依據使用環境來排列顯示器,並整合作為單一桌面使用,並提供螢幕邊框校正、投影機重疊等進階的多螢幕整合功能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-14.jpg
↑ NVIDIA Mosaic。
RTX 桌面管理軟體,則是更強大的桌面視窗排列、管理的工具軟體,而且可直接在軟體中控制多螢幕內的所有視窗排列,並可將目前的視窗配置儲存為 Profile,並提供預設的幾種 GRID 分割方式,讓多螢幕工作情境可更有效的管理。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-16.jpg
↑ RTX 桌面管理軟體,可以直接在軟體中排列每個螢幕的視窗位置。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-17.jpg
↑ 並提供 GRID 分割畫面。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-18.jpg
↑ 也可將設定儲存為 Profile。
而在 Control Center 當中也可以調整 GPU 的使用模式,預設是繪圖、運算都會使用的模式,倘若是指做繪圖功能也可切換至專注繪圖任務的 GPU 模式。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-15.jpg
↑ GPU 使用模式。
NVIDIA RTX™ 6000 Ada Generation 創作、渲染效能測試
效能評估方面則使用專業領域會參考的 SPECviewperf、Blender、Vray 與 OCTANEBENCH 等工具,來測試 RTX 6000 專業繪圖卡的渲染、運算效能,同時也加入 DaVinci Resolve 18 影音輸出測試、Omniverse Creator 與 Stable Diffusion 等測試。
測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO
記憶體:KLEVV DDR5-7200 16GBx2
顯示卡:NVIDIA RTX™ 6000 Ada Generation
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:NZXT 360mm 水冷
電源供應器:Seasonic VERTEX GX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 528.89
GPU-Z 檢視 RTX 6000 資訊,採用 4nm 製程的 AD102 GPU,有著 18176 個渲染 CUDA 核心,以及 46080 MB GDDR6(Samsung)記憶體,而 GPU 預設時脈 915 MHz、Boost 2505 MHz。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-19.jpg
↑ GPU-Z。
DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-20.jpg
↑ DaVinci Resolve 18。
首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。
Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色標示;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。
SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。
RTX 6000 多達 3 組第八代 NVENC 編碼引擎,對於 4K 影音輸出工作有著相當快的處理能力,即便 4 個 HD 拼成 4K 輸出也只需 1 分 10 秒即可完成任務,其餘輸出則都在 1 分鐘之內就完成。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-34.jpg
↑ DaVinci Resolve 18 影音輸出。
第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。
輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-21.jpg
↑ 8K、AV1 測試專案。
對於 RTX 6000 來說輸出 4K 專案確實相當輕鬆,而若升級到 8K 影片輸出,不論 HEVC 或 AV1 編碼都能有相當快的輸出效能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-35.jpg
↑ DaVinci Resolve 18 影音輸出。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.5.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 測試 RTX 6000 在 monster 場景達到 5643.302 分、junkshop 場景 2614.596 分、classroom 場景 2708.850 分,滿足 3D 創作所需的渲染效能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-23.jpg
↑ Blender。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
V-Ray 測試,RTX 6000 採用 CUDA 運算可達到每秒 3166 vpath 的計算量,而採用 RTX 運算則可達到每秒 3904 vray 的運算效能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-24.jpg
↑ V-Ray CUDA。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-25.jpg
↑ V-Ray RTX。
OctaneBench 是快速且獨立的渲染測試工具,其核心為 OTOY Octane Render,可充分利用 RTX 與 CUDA 技術,並支援主流的 3D 應用程式,讓創作者能有著快速高品質的渲染輸出。
測試中包含 4 種場景與 Info channels、direct lighting、path tracing 等核心,RTX 6000 能提供相當可觀的運算速度,滿足創作者所需的快速渲染能力。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-26.jpg
↑ OctaneBench。
SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。
測試為 3840 x 2160 解析度、成績為 FPS,可見 RTX 6000 在各項工作中都能有著相當高的 FPS 表現,讓專業工作者在創作、模擬、運算時也有足夠的繪圖效能。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-28.jpg
↑ SPECviewperf 2020。
Procyon AI Inference 測試,提供多種 AI 引擎的推論測試,並採用常見的神經網路像是 MobileNet、ResNet 50、Inception V4、DeepLab V3、YOLO V3、Real-ESRGAN 來進行推論測試,除了 Procyon 提供的總成績外,也可分別檢視各個推論項目的平均推論時間與推論數量。
RTX 6000 採用 TensorRT 引擎、float32 精度在 MobileNet V3 達到 0.47ms 的推論時間、ResNet 50 平均 1.08ms、Inception V4 平均 3.35ms、DeepLab V3 平均 2.73ms、YOLO V3 平均 2.69ms、Real-ESRGAN 平均 91.57ms 的推論時間。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-29.jpg
↑ Procyon AI Inference、TensorRT 引擎、float32 精度。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-30.jpg
↑ 推論成績。
NVIDIA RTX™ 6000 Ada Generation Omniverse Creator 測試
NVIDIA Omniverse 加速 3D 設計的協作平台,不僅能無縫支援業界主流的 3D apps,讓來自世界各地的創作者能同時創作 3D 專案,並得到即時的渲染效果呈現,更具備 Digital Twin、機器人訓練模擬等功能。
此次測試主要以 Omniverse Create 的專案來進行即時光追渲染、DLSS 3 加速的 FPS 效能測試。測試的專案則包含:Campfire_Main_03_Flow3 模擬營火燃燒的物理效果、Flowers4 測試 Instanced geometry and particle flow animation、Incense_Main 測試煙霧模擬與反射材料變化、JadeTiger 測試場景包含玉的高級材料的細緻模型、Warehouse_Physics_Stage 測試場景則是模擬倉庫貨架倒塌的骨牌效應。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-22.jpg
↑ Omniverse Create。
RTX 6000 在 UHD ViewPort 與 DLSS3 Quality 設定下,Campfire 平均 43.87 FPS、Flowers4 平均 38.97 FPS、Incense_Main 平均 61.15 FPS、JadeTiger 平均 27.17 FPS、Warehouse_Physics_Stage 平均 24.24 FPS 的效能表現。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-37.jpg
↑ Omniverse Create 測試。
NVIDIA RTX™ 6000 Ada Generation AI 算圖 Stable Diffusion 測試
現在很紅的 AI 深度學習文字到圖像的生成模型 Stable Diffusion,經過手動安裝於 Automatic1111 Web UI 發行的版本,加入最新 cuDNN DLLs 讓 Stable Diffusion 能夠獲得最佳的 GPU 加速效能,藉此來比較 GPU 的 AI 運算能力。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-27.jpg
↑ Stable Diffusion。
測試的設定與咒語可參考圖片下方說明,通過測試 RTX 6000 可達到每分鐘 17.91 張的圖片生成速度。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-36.jpg
↑ Stable Diffusion 測試。
NVIDIA RTX™ 6000 Ada Generation 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Omniverse 與 DaVinci Resolve 18 測試的專案運行 3 次後記錄 GPU 溫度與功耗,而最高功耗則藉由 Furmark 來進行燒機測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 6000 最高溫度壓在 83.4°C,Omniverse 3D 渲染則在 75.4°C、DaVinci Resolve 18 的 8K 影音輸出則更低僅 63.9°C 的溫度表現。可見即便標準尺寸的鼓風扇也能替 GPU 帶來不錯的散熱表現。
顯卡 TBP 功耗測試,在 Furmark 壓力測試達到最高 287W 的平均功耗,而 Omniverse 3D 渲染則維持在 263.2W、DaVinci Resolve 18 的 8K 影音輸出僅 150W 的功耗表現。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-38.jpg
↑ GPU 溫度測試。
https://p.xfastest.com/~sinchen/Leadtek-NVIDIA-RTX-6000-Ada/Leadtek-NVIDIA-RTX-6000-Ada-39.jpg
↑ GPU 功耗測試。
總結
NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡,有著相當強悍的效能與工作站相容的散熱設計,不論是 DaVinci Resolve 18 的 8K AV1 影音輸出、Omniverse Creator 的即時光追 UHD 模擬渲染、生成式 AI 的 Stable Diffusion 文字推論圖片,都能有著相當出色的效能表現。
RTX 6000 能滿足專業用戶穩定的效能需求,更何況 48GB GDDR6 ECC 記憶體,更可滿足大專案的記憶體使用量,像是 Omniverse 的 Warehouse_Physics_Stage 專案在 QHD Viewport 就佔用 17GB 的視訊記憶體,這記憶體需求絕非一般 GeForce RTX 遊戲顯卡能滿足的需求。
NVIDIA 給予專業用戶完整的軟硬體生態系,像是 GPU 虛擬化、Mosaic、RTX 桌面管理,以及由 NVIDIA 開發的 SDK 軟體工具等整合,橫跨 AI、資料科學、資料中心、雲端、設計、模擬、機器人、高效能運算、自駕車等不同領域,讓各行各業的難題都可通過 GPU 加速迎刃而解。
最後,NVIDIA 的專業繪圖卡產品,由麗臺科技則提供完善的售後服務,不僅享有 3 年到府收送的保固服務,更有著免付費的客服專線「0800-600-206」,提供各領域的專業用戶最安心、穩定的創作、運算體驗。
頁:
[1]