亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-06-07 11:53

Stability AI發(fā)布開源AI音頻生成大模型Stable Audio Open:支持一句話生成鼓點、樂器等音效,需授權(quán)商用

AI奇點網(wǎng)6月7日報道丨當(dāng)?shù)貢r間6月5日,Stability AI 對外發(fā)布了 Stable Audio Open 1.0,這是其音頻領(lǐng)域的新一款生成 AI 大模型。盡管Stability AI最近負面不斷,但是該公司依然在推動新產(chǎn)品的推出,的確可圈可點。

Stable Audio Open 繼續(xù)沿襲 Stability AI 一貫的開源路線,這是一款文本轉(zhuǎn)音頻模型,可生成長達47秒的樣本和音效。用戶可以創(chuàng)建鼓點、樂器重復(fù)樂段、環(huán)境聲音、擬音和制作元素。該模型支持音頻樣本的音頻變化和風(fēng)格轉(zhuǎn)換。

雖然 Stability AI 以穩(wěn)定擴散文本到圖像生成的 AI 繪畫技術(shù)而聞名,但是他們的工程師發(fā)現(xiàn),擴散模型可以應(yīng)用在其他媒介形態(tài)的內(nèi)容生成。

該公司在2023年首次推出了 Stable Audio,這是一種文本到音頻的生成 AI 工具。最近發(fā)布的 Stable Audio 2.0 則提高了生成音頻的清晰度和長度。

與完整版 Stable Audio 可用于生成長達 3 分鐘的商用級音頻不同,Stable Audio Open 的應(yīng)用場景更為局限,只能生成較短的音效片段,而非完整的一首歌曲。

顧名思義,Stable Audio Open 聽起來雖然是開源模型,但是它仍然需要獲得 Stability AI 的非商業(yè)研究社區(qū)協(xié)議的授權(quán)許可。

Stability AI 音頻研究主管 Zach Evans 表示:“我們推出 Stable Audio Open 的目標(biāo),是讓音頻研究人員和制作人能夠親身體驗我們的生成音頻模型之一,以加速這些令人難以置信的新工具的研究、采用和實際創(chuàng)造性使用。”

你可以在Hugging Face社區(qū)進行試玩:

1
查看相關(guān)話題: #Stability AI #AI音樂 #AI音頻生成

相關(guān)文章