AI工具測(cè)評(píng):6大板塊中,有哪些真正實(shí)用且主流的AI工具?
眾所周知,我是一個(gè)什錦區(qū)的AI博主,每天都在各種AI領(lǐng)域之間反復(fù)橫跳,然后努力的分享一些很酷的AI干貨。
但是每天也都被各種朋友問:“大佬,有沒有能XXX的AI工具?大佬,這個(gè)東西是什么XXXAI做的?大佬,我能請(qǐng)教一下XXX不”
我真怕啥時(shí)候給我來一句:“大佬,你能用AI給我生個(gè)猴子?不”
...
所以,這篇文章,我想好好盤點(diǎn)一下從ChatGPT出現(xiàn)到現(xiàn)在,真正實(shí)用且主流的AI工具。
包含大語言模型、AI PPT、AI 繪圖、AI音頻、AI數(shù)字人、AI視頻這6個(gè)部分。
這近半年我作為AI什錦區(qū)博主的高強(qiáng)度的輸出,做這種盤點(diǎn),應(yīng)該還算是有點(diǎn)說服力的對(duì)吧。
所以你們想要最全最實(shí)用的AI工具大全,真的看我這一篇,就夠了。
我選出來17個(gè),基本上涵蓋了我自己也是99%以上的AI工具使用時(shí)間,全文也不含任何廣告,放心食用吧。
Top1. ChatGPT
整個(gè)AI行業(yè)無可爭(zhēng)議的No.1.現(xiàn)在估值都翻到600億美刀了。引領(lǐng)整個(gè)行業(yè)變革的大哥,無需多言,我自己絕大多數(shù)時(shí)間都是在用GPT去處理各種東西。目前支持多模態(tài)(識(shí)別圖片),傳文件,寫代碼,跑程序,畫圖片。馬上又可以原生的支持ChatPDF了,更能將各類工具混合在一起形成AI Tools,這是真的通用AGI的雛形了。
教程我也寫了太多太多,在我公眾號(hào)里搜索ChatGPT就能看到。但是我還是想放兩篇天天被問的最多的教程∶
(PS∶雖然都是幾個(gè)月前寫的,但是至今也沒失效!剛剛親測(cè),能用)
Top2. Claude
AI大語言模型領(lǐng)域的萬年老二,我已經(jīng)用的很少了,但是他支持100K的超長文本輸入還是目前獨(dú)一檔,很多超長的會(huì)議紀(jì)要、論文等等,我還是會(huì)用Claude來去做整理和總結(jié)的。
Top3. 智譜清言
國產(chǎn)替代。很多人其實(shí)因?yàn)榉N種原因,比如單位、網(wǎng)絡(luò)限制,魔法限制等等,只能用國產(chǎn),那還是推薦智譜清言,我心中的國產(chǎn)大模型No.1.基本上就是ChatGPT的國產(chǎn)平替,多模態(tài)寫代碼畫圖什么都有,而且效果都不錯(cuò),畢竟大名鼎鼎的ChatGLM在國際上還是有很強(qiáng)的影響力的。
Top1. MotionGo
MotionGo ChatPPT--AI對(duì)話式命令自動(dòng)生成PPT演示 MotionGo ChatPPT是一款由必優(yōu)科技開發(fā)的PPT動(dòng)畫插件,它可以讓你輕松地為你的PPT添加各種精美的動(dòng)畫效果,讓你的演示更加生動(dòng)有趣。Motion Go是原口袋動(dòng)畫插件的升級(jí)版,它在保留了口袋動(dòng)畫的核心功能的基礎(chǔ)上,增加了更多的創(chuàng)新和優(yōu)化,讓你的PPT動(dòng)畫制作更加高效和智能。Motion Go目前正在公測(cè)中,你可以在官網(wǎng)免費(fèi)下載試用。
大家經(jīng)常問我的另一個(gè)問題就是,大佬,做PPT有什么AI工具?MotionGo還是可以的,畢竟大部分的PPT都是演示,再做PPT之前基本上都會(huì)有一個(gè)腦圖或者文檔(不要說你沒有。。。),MotionGo支持傳word、txt、Xmind之類的直接生成PPT,這點(diǎn)還是很香的。
Top1. Midjourney
目前AI繪圖領(lǐng)域綜合效果最好、審美最強(qiáng)、最適合小白的產(chǎn)品,大部分直出的圖都可以直接拿來用,直接集成在了Discord里,操作傻瓜,目前也在急速迭代中,正在All in 3D。
Top2. Stable Diffusion
AI繪圖的奠基者之一,生態(tài)的起點(diǎn)。雖然本身的模型質(zhì)量和審美都挺拉的,但是架不住它是開源的。百萬級(jí)別的開發(fā)者和藝術(shù)家,基于源SD1.5模型,微調(diào)并訓(xùn)練了無數(shù)的優(yōu)質(zhì)模型。不僅如此,還有無數(shù)的插件應(yīng)運(yùn)而生,比如鼎鼎大名的ControlNET、AnimateDiff、Defourm等等。超強(qiáng)的自定義特征也使他最容易嵌入工作流中,上限極高。
對(duì)著公眾號(hào)私信"SD",就有秋葉大佬的SD整合包鏈接了,可以直接下載,同時(shí)再附上我寫過的幾期模型推薦:
AI繪圖StableDiffusion最強(qiáng)大模型盤點(diǎn) - 諸神亂戰(zhàn)
AI繪圖StableDiffusion最棒LoRA模型盤點(diǎn) - 小樣也能出奇跡
AI繪圖SDXL大模型推薦榜 - 重鑄開源榮光
Top3. Dalle3
OpenAI出的AI繪圖,集成在了ChatGPT上,NewBing也可以白嫖。擁有目前最強(qiáng)的語義理解能力,很多很復(fù)雜的畫面,MJ畫不了,SD可以靠草圖勉強(qiáng)實(shí)現(xiàn),但是Dalle3可以靠提示詞硬生生畫出來,語義理解目前碾壓式的領(lǐng)先。同時(shí)可以支持在畫面上生成文字,除了審美差一點(diǎn)畫風(fēng)少一點(diǎn),其他幾乎無短板。
Top4. Clipdrop
Stable Diffusion母公司Stability出的應(yīng)用,集成了很多有趣的AI功能,包括去人去物體、增強(qiáng)、扣背景、重新打燈等等,方便快捷。很久之前也寫過一篇文章介紹過:
用AI一鍵抹除照片里的人物還原場(chǎng)景 - 極致體驗(yàn)
Top1. 11Labs
目前我認(rèn)為在TTS(文字轉(zhuǎn)音頻)這個(gè)領(lǐng)域,當(dāng)之無愧的“最強(qiáng)”AI音頻。僅需30秒到5分鐘左右的極少的數(shù)據(jù)集,就可以直接克隆任何一個(gè)人的聲音,完美復(fù)刻他的說話方式、他的音色,甚至連他的情緒都復(fù)刻過來。之前我也寫過文章介紹過:
僅需30秒完美復(fù)刻任何人的聲音 - 最強(qiáng)AI音頻11Labs
Top2. So-Vits-SVC
SVC,你就把它簡(jiǎn)單的理解成一個(gè)特定人物聲音的變成器,你自己先錄一段音頻,然后把這個(gè)音頻扔給AI,AI就自動(dòng)產(chǎn)出另一個(gè)人聲音的音頻了。目前最主流效果最好的就是這個(gè) So-Vits-SVC了。對(duì)著公眾號(hào)私信"S",就有羽毛大佬做的這個(gè)項(xiàng)目的本地整合包。我也寫過兩篇教程(分別是4.0和4.1版本)介紹過:
SVC-我把我的聲音訓(xùn)練成了AI模型,并讓它唱了一首歌
用SVC做特定人物的AI配音
Top3. Stable Audio
同樣是Stable Diffusion母公司Stability出的AI音樂應(yīng)用,目前在所有AI音樂生成里面質(zhì)量最高,但是同時(shí)上手難度也挺大,畢竟那些樂理、樂器的專業(yè)名詞真的很難寫...
Top1. Heygen
作為最近最炙手可熱的AI熱門應(yīng)用,Heygen用霉霉講中文、郭德綱講音域之類的視頻出盡了風(fēng)頭。提供了照片驅(qū)動(dòng)(直接讓照片動(dòng)起來說話)、數(shù)字人訓(xùn)練(上傳5分鐘的視頻)、一鍵翻譯視頻等等。目前最全能的AI數(shù)字人六邊形戰(zhàn)士,除了貴(1個(gè)月最低29美刀15分鐘),什么都好。
偷偷說一句,Heygen的聲音技術(shù)是由11Labs提供的。
Top2. 奇妙元
AI照片驅(qū)動(dòng)的國產(chǎn)替代,在照片驅(qū)動(dòng)領(lǐng)域跟Heygen不相上下,我用的也非常多,之前我視頻號(hào)的幾個(gè)喬布斯、特朗普、巴菲特的視頻就是用11Labs+奇妙元做的:
當(dāng)喬布斯看完昨晚的蘋果發(fā)布會(huì),也終于喊出了那四個(gè)字...
Top3. 商湯如影
國內(nèi)定制數(shù)字人領(lǐng)域的王者,畢竟商湯就是做人像出身,在數(shù)字人定制這塊是Top級(jí)的,很多需要直播的群友在體驗(yàn)了市面上一些數(shù)字人產(chǎn)品后,甚至給我反向安利商湯如影...目前支持PC和APP端。
Top1. Runway
AI視頻領(lǐng)域的王者,前幾天生成模型Gen2更新以后,畫質(zhì)和穩(wěn)定性大幅提升,配合MJ效果直逼電影級(jí)畫質(zhì)。而且Runway是一個(gè)綜合站,不僅可以生成視頻,還可以視頻摳像、刪背景、運(yùn)動(dòng)追蹤啥都行。。我之前也用Runway做了兩個(gè)作品:
我用AI做了一部《流浪地球3》的預(yù)告片...
我用AI做了一部短片 - 《流浪地球3番外:致遙遠(yuǎn)的夢(mèng)》
Top2. PIKA
同樣是AI視頻領(lǐng)域的佼佼者,Runway的競(jìng)品,但是只專注于AI視頻生成,集成進(jìn)了Discord里,對(duì)語義理解很好,你的文字prompt真的是會(huì)起作用的,不像RunwayGen2油鹽不進(jìn),但是目前畫質(zhì)跟RunwayGen2相比還是差了一個(gè)世代,等他們更新2.0版本。不過優(yōu)點(diǎn)嘛,就是免費(fèi)。
如果你跟我一樣成為PIKA的超級(jí)合作者的話,生成的視頻也沒水印,還有專線嘿嘿...
Top3. Topaz Viedo AI
目前視頻畫質(zhì)增強(qiáng)、修復(fù)的最強(qiáng)AI。在超分領(lǐng)域?qū)賹?shí)萬金油。軟件我也整合好了,對(duì)著我公眾號(hào)私信"T"就有下載鏈接了。后面我也會(huì)寫一篇Topaz Vide AI的教程和參數(shù)選用,敬請(qǐng)期待~
寫在最后
以上就是我選出來的大語言模型、AI PPT、AI 繪圖、AI音頻、AI數(shù)字人、AI視頻這6個(gè)部分的17個(gè)應(yīng)用。
當(dāng)然還有很多或新或舊的其他的應(yīng)用,比如做動(dòng)捕的WonderStudio、做3D的Luma AI、AI視頻領(lǐng)域的兩個(gè)新秀Genmo和Moonvalley、SD上現(xiàn)在很火的AI視頻框架AnimateDiff、照片驅(qū)動(dòng)D-ID、PPT的Gamma等等等等。太多太多了。
但是我覺得或多或少泛用性都有點(diǎn)問題,要么打不過上面的這17個(gè),要么應(yīng)用領(lǐng)域太窄,要么上手門檻太高,對(duì)普通AI玩家意義不是很大。
上面這17個(gè),足夠支撐你在現(xiàn)在的AI時(shí)代,混的風(fēng)生水起了。
近期文章
更多