【AI聲音克隆工具推薦】微軟出品VALL-E X模型:只需上傳三秒個(gè)人錄音,即可輕松克隆你的聲線,離線包解壓直接部署
之前給大家分享過一款網(wǎng)易有道出品的AI語音生成工具EmotiVoice,很多人表示挺有用的,但它只有預(yù)設(shè)的2000多種語音,能玩一年,但暫時(shí)不能定向訓(xùn)練專屬音色。
相關(guān)閱讀?:
喂飯級(jí)教程丨離線部署的網(wǎng)易有道出品的開源AI語音合成工具EmotiVoice:合成不同情感的數(shù)字語音,解壓可用
AI合成語音,相信大家都不陌生。最近,網(wǎng)易有道開源了一款A(yù)I語音合成工具EmotiVoice,我這里第一時(shí)間制作了懶人包,可離線本地使用哦~
最近的確接到不少的反饋,后臺(tái)私信咨詢我:有沒有那種可以投喂自己上傳的音頻,然后生成專屬聲音的AI工具。
寵粉如我,肯定就要盡快支持啦!
今天就來分享一款有趣的開源項(xiàng)目:VALL-E X,它號(hào)稱只需要三秒錄音,即可克隆你的聲音,而且為大家制作了一款懶人包。
VALL-E X是微軟開源的一款語音處理模型,只需要源語言中的一些語音語句作為提示,就可以生成高質(zhì)量的目標(biāo)語言的語音片段,同時(shí)還能保留源語言中說話者的聲音、情感和聲學(xué)環(huán)境。只需要上傳一段3~10 秒的語音作為音頻提示,然后輸入你想要合成的文本,即可快速生成語音。
而且,這個(gè)模型還能有效解決外語口音問題,使生成的語音非常逼真。
下載解壓整合包到本地,雙擊“一鍵啟動(dòng)-VALL-E X.exe”:
之后會(huì)打開一個(gè)命令提示窗口,等待項(xiàng)目加載。
加載成功后,會(huì)自動(dòng)打開一個(gè)網(wǎng)頁,就可以快樂地玩耍了(如果沒有自動(dòng)打開,請(qǐng)?jiān)跒g覽器自行輸入以下網(wǎng)址訪問“http://127.0.0.1:7860”):
使用非常簡(jiǎn)單:只需要上傳一段語音,輸入需要的文本,然后點(diǎn)擊“生成”按鈕,等待一會(huì)即可獲得需要的語音文件。
生成的聲音是基于上傳的語音文件訓(xùn)練所得,理論上只要有3秒的原始音頻,即可無限生成你想要的任何聲音,簡(jiǎn)直不要太爽!建議多生成幾次,選擇效果最好的使用。
Hugging Face上也上線了這款大模型提供體驗(yàn):
、注意事項(xiàng):
①首次運(yùn)行需要下載部分模型,請(qǐng)使用魔法以免下載失敗;
沒有具備魔法的朋友,可以自行下載模型,并放置到以下目錄中“C:\Users\你的用戶名\”這個(gè)路徑下。
模型下載地址:
②該項(xiàng)目需要顯存6G,過低顯存可能無法使用這款軟件。
點(diǎn)擊我的頭像,關(guān)注我的微信公眾號(hào),私信發(fā)送關(guān)鍵詞段【VALL-E X】,免費(fèi)獲得本文資源~
近期文章
更多