AI視頻再度進化,再也不是無聲電影丨11Labs的AI音效實時測評
還記得在Sora在2月16號發(fā)布之后,AI聲音屆的巨頭,11Labs,直接來了一次鬼才營銷。
他們把第一波的Sora視頻,直接配上了音效,然后做了一個剪輯放了出來。
而最關(guān)鍵的,就是這個音效了。
全部是由11Labs的AI直出,這可能也是第一個正式踏入大家眼簾的AI音效產(chǎn)品。
其實坦率的講,在我心里,音效設(shè)計,一直是一個非常重要、難度極高但又容易被大家忽視的領(lǐng)域。
一部片子或者游戲能讓你沉浸進去,你可能更多的會夸他的劇情、畫面、配樂,但是很少有人會去夸他的音效,比如夸你這個關(guān)門聲關(guān)的真真實等等...除非你是比如戰(zhàn)地或者PUBG這種,游戲體驗很大比例是聽槍聲反饋的...
但是音效,是沉浸感中絕對重要的一環(huán),而做一個優(yōu)秀的音效,有時候難度更是超高,比如《哥斯拉》里面經(jīng)典的吼聲。
制作團隊用了很多種方法去做哥斯拉的吼,比如用干冰升華時在金屬通風管道中造成的震動和尖叫制作出了哥斯拉金屬質(zhì)感的長嘯,比如他們在拋光過的地板上用大木箱拖動,拖出了那一陣陣令人毛骨悚然的胸腔共鳴。
這才有了這史上最著名的怪獸的驚鴻一瞥。
我說這些,是想告訴大家,好的音效設(shè)計,真的很難,也很貴。
而這,卻正好讓AI,有了用武之地。
在11Labs2月18號放出視頻,并給出排隊鏈接后,我當然是第一時間果斷去排隊了。
網(wǎng)址在此:https://form.typeform.com/to/gg0xzZW4?typeform-source=t.co
然后就...石沉大海,毫無音訊了。。
直到今天,在隔了將近1個月之后,我終于收到了11Labs的郵件。
終于有機會,來玩一玩,這個最強的AI聲音公司11Labs的,AI音效了。
11Labs的官網(wǎng)在此:https://elevenlabs.io/
打開他們的頁面,其實還是...挺簡單的。。。
一個Prompt輸入框,就,啥也沒了。。
隨便寫一句Prompt:
On the concrete floor, a big fat man walked from a distance, getting closer and closer(水泥地上,一個大胖子從遠處走來,越走越近)
大概不到10秒時間,音效就生成了,速度相當快。
11labs的做法也非常AI,一次性給你5個,你挑吧。反正都是要roll的,不如讓你體驗好一點。。
這一個prompt我roll了大概30條,個人感覺,勉強能用的比例大概在10%~20%左右,首先至少得是腳步聲,再次是水泥地和大胖子,再次是越走越近。
有將近40%的比例我都聽不出來是腳步聲,更別提后面的兩個細致要求了。
我這種非專業(yè)選手,能用的比例都這么低,更別提一些專業(yè)選手了。。。所以如此看下來,11Labs選擇一次性放5條還是有道理的。
但是成本確實是低,roll的很快。
于是,我決定,不如復刻一下11Labs自己的營銷做法。
用幾個Sora發(fā)布的最新視頻,AI音效配個音,讓大家直觀感受一下,效果到底怎么樣。
標準是,每個Prompt我roll20條,然后選我認為的最優(yōu)音效。
首先是:
"一只狗快速敲擊鍵盤"
,時長00:10
"一輛F1賽車在賽道上飛馳"
,時長00:10
"用茶壺將水倒入水杯中"
,時長00:05
"外星人走在城市中,繁華的商業(yè)街,嘈雜的人群"&"汽車的鳴笛聲"
,時長00:09
我個人跑了2個多小時,最直觀的感受就是,真實感、聲音的清晰度度還是差了一些,Prompt的語義理解也不是那么的好,有時候需要把Prompt拆開去跑,最后合一下才能用,不過畢竟是疊音軌,拆開跑我覺得不是很嚴重的問題。
整體上,離真正的可商用可交付,我覺得還是有不少距離需要走?,F(xiàn)在類似于MJV2左右的水平。
無獨有偶,11Lbas除了在自己的產(chǎn)品上,推了這個AI音效的功能之外,也在積極的跟一些AI視頻公司合作。
比如PIKA昨天就剛上了AI音效。
雖然這次沒說是用的哪家公司的API,但是猜也能猜到,大概率是接的11Labs的。
可以直接在生成視頻的時候,帶上音效,這個我覺得就非常非常的好用,且體驗極佳。
整體上,AI音效,我覺得還不成熟,但是當視頻卷的飛起的視頻,AI聲音,這個非常重要的賽道,不可能不卷的。
首當其沖的就是三塊:AI配音、AI音樂、AI音效。
AI配音前有微軟TTS后有11Labs,一群大模型公司又開始進場卷的飛起;AI音樂也有SunoAI初步走出來;AI音效,倒是一個沒怎么被人卷過的領(lǐng)域。
但是未來,那可就不好說了。
作為半個聲控,我還是希望這個領(lǐng)域,能發(fā)光發(fā)熱。
給我們帶來一些,在音效上的。
小小的震撼。
近期文章
更多