亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁(yè)  >  測(cè)評(píng)  >  文章
2023-10-09 15:19

ChatGPT迎接最強(qiáng)繪圖搭檔丨火星撞地球:DALL·E 3 vs Midjourney生圖效果對(duì)比測(cè)評(píng)

圖片

近日,全球知名人工智能大廠OpenAI發(fā)布了旗下的“文生圖”繪畫(huà)工具新版DALL·E-3。

DALL·E-3是什么?

說(shuō)實(shí)話,DALL·E這款A(yù)I繪畫(huà)產(chǎn)品,自打推出之后變化并不大,原因主要是ChatGPT的爆發(fā),占據(jù)了開(kāi)發(fā)團(tuán)隊(duì)太多的精力。

對(duì)產(chǎn)品過(guò)于保守的策略,讓同時(shí)代誕生的Midjourney很快搶占了目前在線繪畫(huà)占據(jù)主要的份額。

圖片

在以前,DALL·E-2對(duì)比Midjourney雖然沒(méi)有遜色太多,但畫(huà)風(fēng)略顯稚嫩。

時(shí)隔一年多之后,DALL·E-3突然發(fā)布,令EVA是又驚又喜。

然而,今天的Midjourney與Stable Diffusion已經(jīng)吃掉了AI繪畫(huà)領(lǐng)域的大半壁江山。

圖片

士別三日當(dāng)刮目相待,起了個(gè)大早趕了個(gè)晚集的DALL·E-3會(huì)有什么特色呢?

官網(wǎng)上貼了這么一段話:

文本生成圖像的AI系統(tǒng)往往忽略文字或描述的傾向,迫使用戶去學(xué)習(xí)如何更好地構(gòu)建提示詞句,讓產(chǎn)品的應(yīng)用門(mén)檻加高。DALL·E-3在生成與您提供的文本完全一致的圖像方面的能力上有了重大飛躍。

本質(zhì)上,這就是在吐槽Stable Diffusion專注于插件與微調(diào)模型的開(kāi)發(fā)方向,讓產(chǎn)品越來(lái)越“專業(yè)”,門(mén)檻越來(lái)越高。強(qiáng)調(diào)了自己的“文生圖”是所說(shuō)即所得。

圖片

從上邊這張官圖可以看到,DALL·E-3力求文本含義的精準(zhǔn)呈現(xiàn)。

除此之外,相較于其他產(chǎn)品,DALL·E-3更強(qiáng)大的亮點(diǎn),就是與自家的ChatGPT深度結(jié)合,可以直接在AI聊天機(jī)器人里邊調(diào)用“文生圖”能力。

比如下面這則演示視頻,展示了如何利用ChatGPT+DALL·E-3的AI創(chuàng)作能力,將兒童小說(shuō)的文段轉(zhuǎn)化為可視化的故事書(shū)插圖。

既然OpenAI在宣傳上如此地自信,那么EVA也十分好奇,究竟DALL·E-3對(duì)比Midjourney,能有怎樣的表現(xiàn)?

DALL·E-3 vs Midjourney對(duì)比測(cè)試

以下是國(guó)外內(nèi)測(cè)網(wǎng)友針對(duì)這兩款產(chǎn)品進(jìn)行的相同提示詞生成表現(xiàn)對(duì)比測(cè)試。

案例1??

提示詞:

“一幅插圖,一個(gè)鱷梨坐在心理醫(yī)生的椅子上,說(shuō)著'我只是覺(jué)得內(nèi)心空虛',中間有一個(gè)果核大小的洞。而治療師,一把匙,正在匆匆記錄著筆記。”

圖片

案例2??

提示詞:

“一幅插圖,是一個(gè)由半透明玻璃制成的人類心臟,矗立在洶涌的海洋中的基座上。陽(yáng)光穿透云層照亮了心臟,揭示出其中微小的宇宙。地平線上以粗體字刻著引言:“在你內(nèi)心找到宇宙。”

圖片

案例3??

提示詞:

“一幅插圖,一張充滿活力的黃色香蕉形狀的沙發(fā)坐在一個(gè)舒適的客廳中,它的曲線托起一堆五顏六色的靠墊。在木地板上,一塊有圖案的地毯增添了些許怪異的魅力,而一個(gè)盆栽植物坐落在角落里,朝向透過(guò)窗戶射進(jìn)來(lái)的陽(yáng)光伸展。”

圖片

案例4??

提示詞:

“一幅細(xì)致入微的油畫(huà),描繪著一位老海船長(zhǎng),正在駕駛他的船穿越風(fēng)暴。咸水濺在他的風(fēng)霜之臉上,眼中充滿了堅(jiān)決的決心。上方漩渦般的惡劣云層可見(jiàn),嚴(yán)峻的波浪威脅著將其淹沒(méi)。”

圖片

案例5??

提示詞:

“一幅古老的植物插圖,繪有精細(xì)的線條和一絲水彩的奇妙,描繪了一種奇特的百合與捕蠅草交叉的植物,其花瓣擺在那里,仿佛隨時(shí)準(zhǔn)備合上捕捉任何不經(jīng)意的昆蟲(chóng)。”

圖片

案例6??

提示詞:

“一幅廣袤的風(fēng)景畫(huà),完全由各種肉類構(gòu)成,展現(xiàn)在觀眾面前。嫩滑多汁的烤牛肉山丘、雞腿樹(shù)、培根河流和火腿巨石創(chuàng)造出一個(gè)超現(xiàn)實(shí)但令人垂涎的場(chǎng)景。天空裝點(diǎn)著辣香腸太陽(yáng)和薩拉米云朵。”

圖片

案例7??

提示詞:

“一幅富有表現(xiàn)力的油畫(huà),描繪了一個(gè)籃球運(yùn)動(dòng)員扣籃,呈現(xiàn)為一個(gè)星云的爆發(fā)。”

圖片

案例8??

提示詞:

“一部二維動(dòng)畫(huà),展現(xiàn)了一個(gè)由擬人化的秋葉組成的民謠樂(lè)隊(duì),每個(gè)葉子都演奏著傳統(tǒng)的藍(lán)草樂(lè)器,在一個(gè)充滿鄉(xiāng)村氛圍的森林背景中,柔和的收獲月光灑在其中。”

圖片

總結(jié):DALL·E-3對(duì)細(xì)節(jié)的刻畫(huà)令人贊嘆

通過(guò)以上這組提示詞的PK對(duì)比,在過(guò)去我們總是認(rèn)為Midjourney是那個(gè)更優(yōu)秀的選手。但是一旦觸摸到提示詞不夠貼合Midjourney“舒適圈”,就暴露了它的短板。

DALL·E-3針對(duì)隨性與自然語(yǔ)言的提示詞的語(yǔ)義理解和呈現(xiàn)上完爆Midjourney,相比之下,后者的表現(xiàn)力與精準(zhǔn)度都打了折扣。

圖片

但是,DALL·E-3也并非沒(méi)有問(wèn)題,在畫(huà)風(fēng)與流派風(fēng)格的表現(xiàn)上遠(yuǎn)沒(méi)有Midjourney更具多樣性。

這就好比:一個(gè)是蘋(píng)果系統(tǒng),一個(gè)是安卓系統(tǒng),一個(gè)嚴(yán)謹(jǐn)而精準(zhǔn)規(guī)范,一個(gè)風(fēng)格多樣且需要用戶更強(qiáng)的掌控力。

各有各的的優(yōu)勢(shì),最佳的工作流解決方案可能是,利用DALL·E-3生成符合文本描述的畫(huà)面結(jié)構(gòu)元素。然后利用Stable Diffusion的ControlNet模型來(lái)重繪風(fēng)格。

如何獲取DALL·E-3?

目前DALL·E-3正在內(nèi)部封測(cè)當(dāng)中。按官方的說(shuō)法,DALL·E-3將于10月初向ChatGPT Plus與ChatGPT企業(yè)版客戶提供。

獨(dú)立版本的DALL·E-3頁(yè)面,將會(huì)在今年秋季晚些時(shí)候上線。

此外,眾所周知的緣故,微軟與OpenAI為戰(zhàn)略投資關(guān)系,因此最新版本的Bing Chat聊天機(jī)器人已經(jīng)潛入DALL·E 3在線圖像生成能力。更多的體驗(yàn)可以點(diǎn)擊這篇文章了解:http://ntrq.com.cn/review/1046.html

5

相關(guān)文章