AI繪畫工具Stable Diffusion XL(SDXL) 1.0首發(fā)測評:免費在線,百億級參數(shù),超短提示詞一鍵出大片,Midjourney最強競品!
AI繪畫工具:Stable Diffusion XL(縮寫SDXL)
工具介紹:Stable Diffusion XL是一個二階段的級聯(lián)擴散模型,包括Base模型和Refiner模型。 其中Base模型的主要工作和Stable Diffusion一致,具備文生圖,圖生圖,圖像編輯等能力。它在圖像生成質量上有了極大的提升,并且模型是開源的,圖像可免費商用。
工具鏈接:http://ntrq.com.cn/sites/1269.html
終于,新王上位!正式版Stable Diffusion在線圖片生成工具上線!
當?shù)貢r間7月26日深夜,全球知名的開源AI繪畫工具開發(fā)商Stability AI官宣Stable Diffusion XL 1.0大模型(SDXL),終于摘掉了BETA的?帽子。并決定將服務器遷移至亞馬遜云(AWS)上運行。
通常來說,我們對于Midjourney和Stable Diffusion兩大AI繪畫工具的刻板印象是:前者提供在線圖片生成,訂閱使用;后者則需要購置顯卡本地部署硬件,無限續(xù)杯。
而Midjourney因為在線可用、便捷出圖深受畫師偏愛。今年4月局勢突變,Stability AI借助收購過來的「ClipDrop」AI工具網(wǎng)站打造在線“文生圖”工具,迎頭挑戰(zhàn)Midjourney。從發(fā)布至今,該網(wǎng)站已經(jīng)生成超過3500萬張圖片。
隨著產品運營的推進,SDXL“超大杯”繪畫模型也從V0.9迭代到了今天的V1.0。
SDXL 1.0只需幾句話,甚至幾個單詞,就能創(chuàng)建復雜、細致、精美的圖像,幾乎能夠勝任所有人類能夠想到的藝術繪畫創(chuàng)作。
官方在更新日志中寫道,SDXL 1.0現(xiàn)在可以生成更加鮮明準確的色彩,無論是光照效果、對比度和陰影質感都有了顯著提升,肉眼難辨真假。
SDXL 1.0使用更簡單,提示詞門檻更低
還記得那些復雜的提示詞(關鍵詞)嗎?
幾個月前,家人們都還在努力地就像考取雅思托福那般背誦。如今咱們不再需要使用華麗的辭藻對畫面進行描述,就能夠更輕松地獲得高質量的出片。
比如說,“杰作”(Masterpiece)這個提示詞是許多人常加的,現(xiàn)在不需要了。
因為SDXL 1.0大模型的基礎模型參數(shù)量已經(jīng)達到了驚人的35億,是初代的三到四倍,疊加66億的優(yōu)化模型參數(shù)量BUFF,對于生成圖像的解析解構能力更強。
具體怎么說呢?比如現(xiàn)在AI大模型可以準確區(qū)分“The Red Square”(紅場:莫斯科著名景點)和“A red square”(紅色的正方形)。
像“8K”“超高清分辨率”這些畫幅提示詞也沒必要了,因為現(xiàn)在Stable Diffusion XL 1.0能夠按照1024×1024的最大分辨率默認輸出圖像,當然也支持其他常見的圖片比例。
需要注意,SDXL工具是支持輸入中文提示詞的,但因為涉及到翻譯精度的問題,EVA這邊還是推薦大家使用英文提示詞。
此外,使用中文提示詞會造成AI系統(tǒng)默認判別用戶來自中國,就會自動調用中式的訓練素材,而Stable Diffusion模型訓練比較多的中式元素是國風畫作與漢服,亞裔面孔概率性會崩。
SDXL 1.0在線“文生圖”效果怎么樣?
事不宜遲,咱們來實戰(zhàn)吧!
EVA輸入提示詞“可愛的小女孩,站在水中央,星空,多云的天空”。因為今天體驗的用戶實在太多的緣故,SDXL 1.0花了快2分鐘才生成了四幅作品(平常平均在30秒),其中的兩幅還是相當不錯的,蠻有故事書插畫的質感。
生成一個“芭比粉”配色的童話城堡,創(chuàng)意輸出很穩(wěn)定。EVA更喜歡右邊這一幅圖表達的氛圍。
如果覺得四幅圖都不太滿意,你還可以點擊后邊的?加號追加生成四張。
輸入提示詞“羊駝,芭比粉毛發(fā),特寫”,得到了兩枚追趕今夏時尚頂流的“芭比草泥馬”頭像。
輸入提示詞“工作室內,一個白胡子老頭正在制作木雕,木雕是字母”。SDXL 1.0就返回了這樣一張亞裔老匠人正在工作的圖像,光影的質感很逼真。但很顯然,AI還是不擅長認字兒與畫手指。
你甚至可以利用SDXL 1.0制作復雜的文字藝術,比如——
事實上,迭代多次后的SDXL 1.0大模型對于亞裔面孔的把控成長了許多。比如下邊這組對比,EVA推測大概是Stability AI拿了不少日系美女的照片來訓練。
我輸入提示詞“亞裔女子,紅色耳墜,穿著紅色的旗袍,特寫”,你不說是AI生成,我以為是真實的人像寫真。可能是因為穿著旗袍的緣故,感覺更像華裔。
因為訓練參數(shù)量的增加,SDXL 1.0學會了更多人類攝影師的人像作品。生成黃昏下花叢里的人像景深“游客照”,易如反掌。
生成動物與人互動的融合場景,也更加逼真,除了狗狗的腳印?露出了Bug,但一般人應該留意不到。
SDXL 1.0提供了寫真、夢幻、折紙、透視、數(shù)字渲染、漫畫、動漫、電影、膠片、賽博朋克、像素風、扁平化、3D渲染、線條藝術等等十余種風格。
只需調整提示詞輸入框下方的風格選項,你甚至可以生成一只像素風格的柯基犬。在AI技術誕生以前,需要復雜的重新上色,簡直是畫師的美夢。
生成“3D動畫,黃昏下迪士尼風格的貓咪,特寫”,質感也非常棒。
來一點現(xiàn)實主義的人造建筑設計。比如下圖是拉斯維加斯最近落成的超人氣建筑——全球最大的單體球形外立面LED屏幕大樓MSG Sphere。EVA嘗試讓SDXL 1.0做一個復刻模仿設計。
這是SDXL 1.0設計的球形大樓,除了規(guī)模比較小之外,整體也還不錯——
甚至還設計出了這樣一棟超有科幻感的球型寫字樓,不知道力學構造是否符合現(xiàn)實呢?請屏幕前的建筑大佬指點~
生成超現(xiàn)實主義的畫作,比如魔幻題材、未來都市、賽博朋克等等,也難不倒SDXL 1.0。而這一切,在以前可是Midjourney的拿手好戲。
來一點懷舊主義的畫作?
輸入提示詞“白天,堆滿20世紀80年代老款計算機與植物花盆的房間”。AI給我輸出了這樣一幅圖像,看起來仿佛真像實際存在這樣一個房間,找不出明顯破綻。
生成一個常見的AI繪畫示范圖——穿著未來機甲的女子。左圖是V0.9版本生成的,右圖是最新的V1.0版本生成的。是錯覺嗎?看起來女子的年齡成熟了不少。怎么,AI也會長年紀??
馬斯克最近很突然地給Twitter換了一個新Logo——X。
有外媒報道稱,經(jīng)典“小藍鳥”商標的品牌估值高達40億美元,有點可惜了。咱就不按馬老師的思路走,以“小藍鳥”融合X字母,讓SDXL 1.0設計一個新Logo試試——
看起來AI的設計還蠻有科技感與社交氛圍的,現(xiàn)在的Twitter新Logo太單調。
生成一張?zhí)摌嫷?ldquo;馬斯克與扎克伯格對壘”的圖片,雖然左邊這位的發(fā)型、胡子是馬斯克的風格,但看起來更像是兩個“扎克伯格”PK。SDXL大模型還沒能解決多人同框面孔同質化的問題。?
如果家人是游戲開發(fā)工程師,你還可以利用SDXL 1.0來生成游戲里邊的場景貼圖,比如這張模仿秘魯印加文明的神廟,頗有《神秘海域》的味道。
甚至提供幾個簡單的單詞,就可以生成各種游戲道具。
SDXL 1.0可以用來做產品工業(yè)設計嗎?7月27日今天,恰好公布了2024巴黎奧運會使用的火炬。
有網(wǎng)友說,它長得像搟面杖,還有網(wǎng)友說長得像“法國武器”——法棍?,總之都沒離開吃。讓SDXL 1.0依照這個簡約風格,在不改變材質的前提下幫我們重新設計一款——
相比之下,我還是更喜歡自己通過AI設計的這款,至少不會顯得頭重腳輕。?EVA不才,教法國人做火炬。
你甚至可以馬上針對剛設計好的產品圖進行在線摳圖、畫質增強,或者參考這幅圖的構型進行重新生成。摳圖過程非常絲滑~
讓AI“幻想”巴黎埃菲爾鐵塔下慶祝奧運會開幕的游行人群,也別有一番法蘭西熱情,乍看之下頗有真實現(xiàn)場感。
好了,生成次數(shù)與文章篇幅均有限,先試玩到這吧!
SDXL 1.0平臺每天提供400張免費的生成次數(shù),也就說支持提交生成100次/天,足夠家人們玩上好一陣了。相較于最大的競爭對手Midjourney,Stability AI還是非常大方的。缺點是會生成帶水印,不過搭配EVA前幾天推薦的AI一件去水印工具,完全不是障礙。
如果你加入付費訂閱的話,就可以拿到“VIP速通券”,免除與全球用戶一起排隊生圖的困苦了。但事實上,遷移新的服務器之后,個人覺得免費生成的速度也不算太慢。
Stability AI在發(fā)布SDXL 1.0之前,將其與各款老模型進行了人氣對比調查:發(fā)現(xiàn)相較于Stable Diffusion 1.5/2.1、SDXL 0.9等等老款模型版本,人們更喜歡SDXL 1.0生成的作品。
隨著SDXL 1.0的上線,AI在線生圖會越來越卷,對于畫師盆友們無形中也是一個好消息。重點是ClipDrop網(wǎng)站無需“魔法”,自在暢游。