ChatGPT向全體用戶開放Voice語音交互功能,開通使用ChatGPT語音功能保姆級教程
AI奇點網(wǎng)11月22日報道丨當(dāng)?shù)貢r間11月21日,OpenAI對外發(fā)布了ChatGPT Voice語音交互聊天服務(wù),并且將這項此前由ChatGPT Plus(GPT-4)獨占的功能,下放到全體ChatGPT APP用戶。用戶只需注冊ChatGPT賬戶,下載APP,就可以使用這項服務(wù)。需要注意的是,免費版的用戶只能使用基于GPT-3.5的人工智能語音生成交互服務(wù);ChatGPT Plus訂閱用戶則基于GPT-4。
OpenAI 于今年 9 月發(fā)布了基于 ChatGPT 的文本轉(zhuǎn)語音功能,基于GPT的神經(jīng)網(wǎng)絡(luò)模型,從生成的文本內(nèi)容轉(zhuǎn)成類似人類的語音。該功能此前僅面向 ChatGPT Plus 訂閱用戶提供,現(xiàn)在向所有沒有訂閱付費的用戶推出。
該系統(tǒng)通過采樣配音演員錄制的幾秒鐘音頻,能夠創(chuàng)建具有不同口音和風(fēng)格的自定義聲音。OpenAI 與專業(yè)的配音演員合作錄制了聲紋特征,然后使用開源的語音識別系統(tǒng) Whisper 將口頭語音轉(zhuǎn)制為文本,獲得這種數(shù)字合成的仿真聲音。
ChatGPT Voice語音交互功能,說白了就是能直接通過人說話,以自然語言最直接的語音與 ChatGPT 完成對話交互。讓人震驚的是,ChatGPT的聲線真實感和回答的邏輯性讓人有一種《鋼鐵俠》電影當(dāng)中“賈維斯”的錯覺。
此功能仍然屬于測試階段,通過蘋果應(yīng)用商店或者安卓應(yīng)用商店下載ChatGPT APP版本,打開ChatGPT Voice語音功能即可體驗。
打開ChatGPT APP的設(shè)置。
進(jìn)入設(shè)置頁面,點擊 Beta Features
點擊 Beta Features,開啟 Voice conversations
開啟 Voice conversations(語音對話)。
然后點擊主頁的房子圖標(biāo),回到對話界面,找到右上角的耳機(jī)圖標(biāo)。
點擊主頁圖標(biāo),開啟語音對話。
你也可以查看對話的歷史聊天記錄,與聊天機(jī)器人的每一輪語音對話,均會以文本的形式呈現(xiàn)在聊天對話記錄當(dāng)中展示,方便隨時進(jìn)行查看。OpenAI還為用戶提供了ChatGPT Voice的多項小功能,包括暫停、中斷對話,更換人物的音色等功能,有五種音色可供選擇。
雖然只是GPT-3.5,不過全新的語音交互方式確實很新鮮很真實,令人直覺的交互體驗。事不宜遲,快去調(diào)戲ChatGPT吧!