近日Meta發布了Voicebox AI模型,它在音效模擬方面有著顯著優勢。據悉Voicebox只需要一段2秒鐘的音效樣本,即可準確辨別出音效細節、音色,並採用文字結果轉換為語音輸出。 同時它還可以採用語音片段的前後內容,自 ...