找回密碼註冊
作者: lin.sinchen
查看: 5235
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

Micron Crucial PRO D5 6400超頻版 玩家開

解銷更快的遊戲速度! 利用低延遲遊戲記憶體的強大功能 利用 Cruci ...

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

打印 上一主題 下一主題

[業界新聞] NVIDIA Maxine 雲端 AI 視訊技術 Vid2Vid Cameo 讓會議畫面更完美

[複製鏈接]| 回復
跳轉到指定樓層
1#


NVIDIA 研究人員所開發的 AI 工具 NVIDIA Maxine SDK 當中,有著相當多的深度學習模型其中包含 Vid2Vid Cameo,這模型利用生成對抗網路 (GAN),只需你的一張平面照片,就能產生出不同角度、立體的頭像。

就像 NVIDIA 敬致 Netflix 播出的《紙房子》影集中視訊的畫面,由 NVIDIA 研究人員來說明 Vid2Vid Cameo 可提供給視訊會議更完美的人體頭像,參與者只需要在加入視訊通話前先上傳一張參考圖片,可以是自己的真實照片或卡通圖片,就能使用這項功能。



Vid2Vid Cameo 只需要兩個元素,便能建立出用於視訊會議的逼真 AI 對話頭像,包含一張使用者的臉部照片以及一個視訊串流內容,該模型在 NVIDIA DGX 系統上使用 18 萬個高品質對話頭像的資料集來進行訓練。

Vid2Vid Cameo 的模式能夠辨識臉部的二十個關鍵點,這些關鍵點針對包括眼睛、嘴巴和鼻子在內的特徵位置進行編碼,接著模型會從通話者的參考圖片中擷取這些關鍵點,通話者的圖片可以事先發送給其他參與視訊會議的人,或從過往的會議中重複使用。

如此一來,視訊會議平台只需發送說話者臉部關鍵點的動作資料,而不用在每一個與會者之間發送龐大的即時視訊串流內容;對接收者來說,GAN 模型在接收端使用這些資訊來合成一個模仿參考圖片外觀的視訊內容。





利用 Vid2Vid Cameo 後,視訊會議只需傳送會議者臉部的位置及關鍵點,而並即時的在所有與會者電腦中,藉由 AI 來模擬出會議者的立體頭像,讓整體視訊會議品質可更佳流暢,且不影響視訊畫質。

NVIDIA 的研究人員發現,Vid2Vid Cameo 可以產生更為真實清晰的結果,不管參考圖片和視訊內容是否出自同一個人,還是當 AI 把一個人的動作轉移到另一個人的參考圖片上,它的表現都比最先進的模型更出色。



Vid2Vid Cameo 模型論文的作者為 NVIDIA 研究人員 Arun Mallya 和兩位來自台灣的 Ting-Chun Wang、和 Ming-Yu Liu。NVIDIA Research 團隊由全球兩百多名科學家組成,專注於 AI、電腦視覺、自動駕駛車、機器人和繪圖等領域。

在此特別感謝於 Netflix 播出的《紙房子》影集中,替教授進行英語配音的演員 Edan Moses,感謝他為上述我們最新的 AI 研究成果影片所做出的貢獻。

更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-14 20:51 , Processed in 0.094531 second(s), 34 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表