Tesla 使用 NVIDIA A100 GPU 的超級電腦於訓練自駕車的 AI 網路
https://news.xfastest.com/wp-content/uploads/2020/05/NVIDIA-A100-1.jpg特斯拉 (Tesla) 人工智慧部門資深總監 Andrej Karpathy 於CVPR 2021 大會中,說道自家用於訓練自動輔助駕駛與自動駕駛功能的深度神經網路超級電腦,採用 NVIDIA A100 GPU。
而這台超級電腦叢集有著 720 個節點,每個節點搭載 8 顆 NVIDIA A100 Tensor 核心 GPU,總共有著 5,760 個,以及 1.8 exaflops 的運算效能、10PB "hot tier" NVMe 儲存設備達到 1.6TBps 的速度,並有著 640Tbps 的總切換能力。
特斯拉在其開發週期的核心,為汽車產業提供前所未有的運算水準,讓自動駕駛車的工程師們能夠以最先進的技術,高效率地完成傾注畢生心血的工作。
特斯拉的開發週期始於汽車。以「影子模式 (shadow mode)」運行的深度神經網路,在不實際控制車輛的情況下,會在汽車的行駛過程中悄悄進行感知並做出預測。
此時這些預測內容與錯誤或誤判的情況會被記錄下來,接著,特斯拉的工程師使用這些執行個體,建立一個複雜且多元場景的訓練資料集,讓深度神經網路 (DNN) 更加完善。
特斯拉收集了約一百萬個以 36 FPS 錄製的十秒鐘畫面,累計出高達 1.5PB 的資料量。接著,深度神經網路在資料中心反覆執行這些場景,直到未出現任何錯誤。最後,再將訓練完的深度學習神經網路送回車輛,並再次展開這個過程。
除了全面且完整的訓練外,特斯拉的超級電腦亦提供自動駕駛車的工程師們,擁有在開發過程中進行實驗和反覆運算所需的效能。
接著,這些深度神經網路能以較過去快速反覆運算的速度還要更快的方式,運行訓練資料集。
https://news.xfastest.com/wp-content/uploads/2021/06/Tesla_slide.png
觀看完整的 CVPR 議程內容
頁:
[1]