亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁 > 資訊 > 文章

2024-06-07 11:53

Stability AI發(fā)布開源AI音頻生成大模型Stable Audio Open：支持一句話生成鼓點、樂器等音效，需授權(quán)商用

AI奇點網(wǎng)6月7日報道丨當(dāng)?shù)貢r間6月5日，Stability AI 對外發(fā)布了 Stable Audio Open 1.0，這是其音頻領(lǐng)域的新一款生成 AI 大模型。盡管Stability AI最近負面不斷，但是該公司依然在推動新產(chǎn)品的推出，的確可圈可點。

Stable Audio Open 繼續(xù)沿襲 Stability AI 一貫的開源路線，這是一款文本轉(zhuǎn)音頻模型，可生成長達47秒的樣本和音效。用戶可以創(chuàng)建鼓點、樂器重復(fù)樂段、環(huán)境聲音、擬音和制作元素。該模型支持音頻樣本的音頻變化和風(fēng)格轉(zhuǎn)換。

雖然 Stability AI 以穩(wěn)定擴散文本到圖像生成的 AI 繪畫技術(shù)而聞名，但是他們的工程師發(fā)現(xiàn)，擴散模型可以應(yīng)用在其他媒介形態(tài)的內(nèi)容生成。

Stable Diffusion開發(fā)商Stability AI推出文本生成音頻工具Stable Audio：根據(jù)提示詞自動生成90秒音樂

Stability AI對外推出了一款全新的AIGC生成式工具：Stable Audio。該工具可以基于用戶輸入的文本內(nèi)容提示詞，自動生成對應(yīng)風(fēng)格的音樂、音頻文件。

閱讀文章

該公司在2023年首次推出了 Stable Audio，這是一種文本到音頻的生成 AI 工具。最近發(fā)布的 Stable Audio 2.0 則提高了生成音頻的清晰度和長度。

與完整版 Stable Audio 可用于生成長達 3 分鐘的商用級音頻不同，Stable Audio Open 的應(yīng)用場景更為局限，只能生成較短的音效片段，而非完整的一首歌曲。

顧名思義，Stable Audio Open 聽起來雖然是開源模型，但是它仍然需要獲得 Stability AI 的非商業(yè)研究社區(qū)協(xié)議的授權(quán)許可。

Stability AI 音頻研究主管 Zach Evans 表示：“我們推出 Stable Audio Open 的目標(biāo)，是讓音頻研究人員和制作人能夠親身體驗我們的生成音頻模型之一，以加速這些令人難以置信的新工具的研究、采用和實際創(chuàng)造性使用。”

你可以在Hugging Face社區(qū)進行試玩：

https://huggingface.co/stabilityai/stable-audio-open-1.0

查看相關(guān)話題： #Stability AI #AI音樂 #AI音頻生成

相關(guān)文章

Kardashian

工作人員

一打雜的

作者已發(fā)布 419 篇文章

近期文章

OpenAI明年將推出計算機控制智能體Operator丨小米成立AI平臺部，醞釀智能眼鏡丨傳聞蘋果正在研發(fā)AI智能家居中控

李彥宏：文心大模型日調(diào)用量超15億丨百度發(fā)布文心「iRAG」文生圖技術(shù)丨小度AI智能眼鏡發(fā)布，搭載大模型邊走邊問

字節(jié)跳動內(nèi)測豆包通用圖像編輯模型SeedEdit丨Grok聊天機器人免費版內(nèi)測丨月之暗面Kimi創(chuàng)始人被提起仲裁

微軟推出首個AI天氣預(yù)報系統(tǒng)Aurora，比傳統(tǒng)的數(shù)值天氣預(yù)報模型快5000倍

網(wǎng)頁產(chǎn)品設(shè)計工具Figma集成GPT-4o能力，支持一鍵全自動生成網(wǎng)頁前端設(shè)計