Stable Diffusion深度解析:關(guān)于該AI軟件在多個設(shè)計場景中的探索與應(yīng)用
一、前言
大家好!在當(dāng)今數(shù)字化時代的設(shè)計領(lǐng)域,技術(shù)的發(fā)展不斷引領(lǐng)著創(chuàng)新的方向,而StableDiffusion作為一款融合了人工智能與藝術(shù)的繪畫軟件,正為我們帶來前所未有的設(shè)計可能性。我們每天都在與圖像和文字打交道,而如何讓它們更生動、更吸引人,正是設(shè)計師們的永恒追求。在這個背景下,StableDiffusion扮演著一個重要的角色,為我們提供了一把開啟創(chuàng)作新境界的鑰匙。
本文將深入解析StableDiffusion在多個設(shè)計場景中的探索與應(yīng)用,尤其關(guān)注如何利用其制作多種商業(yè)落地案例。通過學(xué)習(xí)這些實際案例教程,我們將看到StableDiffusion的魅力,以及如何充分發(fā)揮其與Controlnet插件相結(jié)合的威力,為我們的創(chuàng)作注入新的活力。
二、品牌超級符號
本次品牌符號案例使用【抖音LOGO】演示創(chuàng)作,并進行后續(xù)的海報設(shè)計延展,操作很簡單,如果你把我上一篇《StableDiffusion制作中文字效工作流揭秘與畫質(zhì)提升的多種方法》文章吸收完之后,你會發(fā)現(xiàn)我接下來的操作都很簡單,開始:
2.1 前期準(zhǔn)備
記住一點:只要是做品牌符號、字體設(shè)計之類的圖片,那么就脫離不了Controlnet插件,重點在于精準(zhǔn)控制。
我們先準(zhǔn)備下模型、lora以及相關(guān)素材:
1、Stable Diffusion 模型:ReV Animated v1.2.2 (最新版本)
2、Lora模型:夢幻3D場景
3、controlnet插件模型以及黑白文字圖片
模型下載推薦使用civitai(國外)以及哩布哩布AI(國內(nèi)),前者需要特殊網(wǎng)絡(luò),下載也比較慢,但是模型豐富,數(shù)量極其的多。后者下載速度很快,我一般是在【civitai】上找到模型然后去【哩布哩布AI】上搜,如果有需要的模型,那就直接在【哩布哩布AI】上下載。
Controlnet插件一般用活菩薩秋葉的啟動包就會自帶,不過模型需要自己安裝一下,在往期文章我有專門介紹過Controlnet的插件安裝教程以及模型的下載方式,此處不多做說明。
圖中為【智設(shè)AIGC社區(qū)】,整理了AI繪畫的教程及其相關(guān)資源,本文所用到的模型素材都提供在里面。
準(zhǔn)備一張抖音logo白底的圖片,注意以下幾點:
1、在這一步就把圖片尺寸設(shè)置好;2、等比縮放尺寸,把這張圖片的尺寸縮小,方便后續(xù)的操作;3、圖片要求為白底黑LOGO。
2.2 關(guān)鍵詞描述
正向關(guān)鍵詞:
changjing_3d,((best quality)),((masterpiece)),no_humans,water,sky,day,ocean,blue_sky,cloud,outdoors,bubble,flower,
Changjing_3d,((最佳畫質(zhì))),((杰作)),no_human,水,天空,天,海洋,藍天,云,戶外,泡泡,花,
其中【changjing_3d】為該Lora的觸發(fā)詞。
反向關(guān)鍵詞(通用關(guān)鍵詞,哪哪都可用):
(worst quality:2),(low quality:2),(normal quality:2),lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,jpeg artifacts,signature,watermark,username,blurry,bad_pictures,DeepNegativeV1.x_V175T,nsfw,
2.3 設(shè)置Controlnet各項參數(shù)
Controlnet我們需要使用兩個預(yù)處理器及模型:【canny】和【depth】。
【canny】來控制LOGO形態(tài)不被破壞,【depth】控制LOGO的深度信息。
【canny】的權(quán)重可以保持默認(rèn) 1.【depth】的權(quán)重設(shè)置為0.8(比canny權(quán)重小一點即可)。
回到上面,使用 Euler a 采樣方法,迭代步數(shù)為 30.尺寸與上傳的圖片一致。
2.4 初步跑圖(批量)
把上述的參數(shù)調(diào)整好了之后,我們就可以進行初步的跑圖了,可以調(diào)整總批次數(shù)量(顯卡一般的控制在4左右)。
批量跑圖后你會發(fā)現(xiàn)幾個問題:
1、圖片分辨率低,不清晰;
2、細節(jié)之處處理的不行。
其實是沒關(guān)系的,我們只需要在初步跑圖的時候確定大體風(fēng)格即可,細節(jié)之處可以通過放大分辨等方式解決,接著看:
2.5 Controlnet高清修復(fù)
在上述跑出的初稿選一張自己滿意的圖片,接下來我們使用【Controlnet插件】和【Tiled Diffusion插件】來對圖片進行放大及修復(fù),我在上期教程中說過這個方法的詳細介紹,這里不多解釋。
啟動【Controlnet插件】,預(yù)處理器及模型選擇【Tile】 ,權(quán)重調(diào)整為1.2.【Tiled Diffusion 和 Tiled VAE】都都選上,并在這個插件下控制最終生圖尺寸,在 288*512基礎(chǔ)上乘以3倍,即【864*1536】。
在漫長的等待之后,我們就得到了一張被放大之后的圖片,并且這張圖片的細節(jié)之處更加豐富。這一步完成之后,SD就可以暫退了,下一步我們結(jié)合【PS Beta】略微修復(fù)下細節(jié)。
2.6 后期微調(diào)+排版
使用PS Beta等工具,進行后期的微調(diào)處理,再加上排版,一張抖音開屏頁海報即可完成。其他品牌符號也可用這個案例的思路創(chuàng)作,方法是一致的,看會了就去試試吧。
三、文字海報設(shè)計
這個案例的操作方法與上面的【品牌超級符號】有異曲同工之妙,同樣是使用Controlnet來對主體畫面進行控制,再通過高清修復(fù)等功能優(yōu)化圖片細節(jié),達到可落地項的地步,下面還是通過案例演示的方式來分享我的想法。
2.1 找參考確定風(fēng)格
在設(shè)計前期我們首先需要確定視覺風(fēng)格,可以找一些設(shè)計參考,這一步的準(zhǔn)備也是在后續(xù)通過SD關(guān)鍵詞反推中使用,你沒聽錯,SD也可以圖生文。
2.2 前期準(zhǔn)備
我們準(zhǔn)備下模型、lora以及相關(guān)素材,Lora是根據(jù)上一步風(fēng)格參考去找到符合這種風(fēng)格的lora(科技感):
1、Stable Diffusion 模型:ReV Animated v1.2.2 (最新版本)
2、Lora模型:light effect sci-fi scene
3、controlnet插件模型以及白底黑字圖片。
這個案例的墨稿圖有點特殊,因為我是需要做一個數(shù)字的中間是鏤空的效果,所以在數(shù)字上采取描邊的形式來到控制后續(xù)的生圖精準(zhǔn)度。
2.3 關(guān)鍵詞反推
把參考圖的文字清除掉,然后放到【W(wǎng)D 1.1標(biāo)簽器】里進行圖生文。
點擊【發(fā)送到 文生圖】即可(簡單三步搞定)。
關(guān)鍵詞:no humans, science fiction, cable, scenery, indoors(沒有人,科幻小說,有線電視,風(fēng)景,室內(nèi))
2.4 補充關(guān)鍵詞
正向關(guān)鍵詞加上lora觸發(fā)詞及l(fā)ora,補充一些風(fēng)格畫質(zhì)的關(guān)鍵詞即可:
no humans,science fiction,cable,scenery,indoors,(masterpiece, best quality:1.3),hd,8k,super details,science fiction,scenery,round stage,,
無人、科幻、有線、風(fēng)景、室內(nèi)、(杰作、最佳畫質(zhì):1.3)、高清、8k、超細節(jié)、科幻、風(fēng)景、圓舞臺
反向關(guān)鍵詞(通用關(guān)鍵詞,哪哪都可用):
(worst quality:2),(low quality:2),(normal quality:2),lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,jpeg artifacts,signature,watermark,username,blurry,bad_pictures,DeepNegativeV1.x_V175T,nsfw,
2.5 設(shè)置Controlnet各項參數(shù)并跑圖
使用Controlnet插件上傳黑字白底圖,預(yù)處理和模型選擇【canny】即可,老生常談的東西了。
其他的參數(shù)如下:
采樣方法:DPM++2M Karras。迭代步數(shù):30.
重點:尺寸比例與上傳的圖片一致。然后就可以批量跑圖了。
在初步的低分辨率跑圖的情況下,我們得到了一大批圖片,其實大家可以看到,有幾張圖效果是ok的。接來下就把合適的圖片進行分辨率放大即可。
2.6 高清修復(fù)
選中一張低分辨率圖片,固定Seed值,點擊綠色的按鈕即可。
打開高清修復(fù),放大算法選擇【R-ESRGAN 4X+】,放大倍數(shù)調(diào)整為 3倍,重繪幅度 0.5.
重繪幅度不能過大,不然會導(dǎo)致主體數(shù)字變形,大概在0.5~0.7之間。
2.7 后期微調(diào)+排版
最后根據(jù)需求信息進行排版即可,運用這種操作方法,我們只需要更換controlnet的白底黑字圖即可做出倒計時海報的延展圖,完事!
四、電商場景設(shè)計
在前面幾期文章我也說過幾個電商產(chǎn)品設(shè)計的案例,每次的制作思路不一樣,這次也是經(jīng)過我探索出一個新的SD出電商產(chǎn)品海報的方法,全程StableDiffusion操作,操作方法很簡單,明白了一些參數(shù)原理之后,你也能很容易上手操作,展示:
2.1 前期準(zhǔn)備
還是一樣,先準(zhǔn)備模型和lora,基本上寫實風(fēng)格的圖片無腦用【ReV Animated v1.2.2】即可,在Lora的選擇上可以去找到專門生成電商場景的模型。
1、Stable Diffusion 模型:ReV Animated v1.2.2 (最新版本)
2、Lora模型:C4D幾何背景geometry-bg
2.2 關(guān)鍵詞及各項參數(shù)
寫上正反關(guān)鍵詞,這些關(guān)鍵詞我是直接在Lora作者提供的效果圖上獲取的,我們可以在作者的基礎(chǔ)上增減關(guān)鍵詞即可,這樣關(guān)鍵詞就比較容易寫。
正向關(guān)鍵詞:
(masterpiece:1.3),(best quality:1.3),(no human),artwork of 3D geometry,still life,clean,Pastel color,Comfortable natural light,minimalist style,modernist style,3d rendering,8K,A cylinder in the middle,Sphere,Curtains,Arch background,Plants,leaves,.,,
(杰作:1.3),(最佳品質(zhì):1.3),(無人),藝術(shù)品三維幾何,靜物,干凈,柔和的顏色,舒適的自然光,極簡風(fēng)格,現(xiàn)代主義風(fēng)格,3D渲染,8K,中間圓柱體,球體,窗簾,拱門背景,植物,樹葉
反向關(guān)鍵詞(通用關(guān)鍵詞,哪哪都可用):
(worst quality:2),(low quality:2),(normal quality:2),lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,jpeg artifacts,signature,watermark,username,blurry,bad_pictures,DeepNegativeV1.x_V175T,nsfw,
把以下參數(shù)設(shè)置上,尺寸設(shè)置上我的思路就是設(shè)置的越低越好,低質(zhì)量圖批量且快速的出圖,選好合適的圖片在進行分辨率放大操作,被顯卡所限制的朋友可以按我這種方式做。
采樣方法:【DPM++ 2S a Karras】【迭代步數(shù) 20】 【圖片尺寸:256*384】
出圖批次大家隨意調(diào)整,之后就開始跑圖即可。
2.3 圖片分辨率放大
下面是我們初步暴力抽卡的圖,這一步我們不用看質(zhì)量,看構(gòu)圖、色彩搭配、元素等:
接下來就是從大量的圖中挑選我們的幸運觀眾。
先把該圖片的seed值固定,選擇高清修復(fù),放大算法【R-ESRGAN 4X+】。
重點!!!!下面兩個很重要:
1、放大倍數(shù)直接拉滿4倍,也就是最終是【1024*1.536】。
2、重繪幅度也要大一點,取決于低分辨率圖的細節(jié)之處,細節(jié)不好重繪幅度開大一點。細節(jié)還行,開小點。
2.4 準(zhǔn)備產(chǎn)品圖以及蒙版圖
如果你按我的步驟來,并且很順利的話,那么你就會得到一張不錯的場景圖了。接下來就是融入我們的產(chǎn)品進去,接著往下看:
下面的操作我會結(jié)合【圖生圖的蒙版重繪】以及【controlnet】來操作。這兩個功能都是我前面講過的,你可以把接下來的操作看作為進階的玩法。
你需要準(zhǔn)備下面兩張圖,一張產(chǎn)品場景圖以及一張產(chǎn)品的黑白蒙版圖。
這里也要注意!
1、產(chǎn)品在場景擺放的位置要調(diào)整好,雖然不需要做光影融合,但是也不要隨便放,這一步就定性了;
2、黑白蒙版圖的黑色產(chǎn)品區(qū)域是與產(chǎn)品圖的產(chǎn)品位置一樣的,會PS的朋友都知道哈,不再啰嗦了。
2.5 圖生圖以及Controlnet設(shè)置
在【文生圖】這里,把生成的高分辨圖片發(fā)送到【圖生圖】,我這么做的目的只是想讓【圖生圖】板塊繼承【文生圖】的參數(shù)信息(這點我要說下,不然你們可能后面會懵)。
接下來點擊【上傳重繪蒙版】,上傳準(zhǔn)備好的場景圖以及蒙版圖。其他參數(shù)默認(rèn)即可,采樣方法與【文生圖】使用一致即可,分辨率可以在此處再次放大,看大家需要調(diào)整。
生成之后可以看下對比,在產(chǎn)品周圍,SD會自動把產(chǎn)品融合到場景中去,可以調(diào)整【蒙版邊緣模糊度】的值控制產(chǎn)品邊緣的融合度,建議不要太高,不然產(chǎn)品會出現(xiàn)變形。
五、總結(jié)
正如上述3個商業(yè)案例所示,StableDiffusion為設(shè)計師帶來了前所未有的創(chuàng)作方式。通過控制Controlnet插件,我們精準(zhǔn)引導(dǎo)AI輸出,使每個創(chuàng)意完美呈現(xiàn)。這種融合人工智能和創(chuàng)意的力量,不僅增加設(shè)計的靈活性,也提升創(chuàng)作的準(zhǔn)確性和獨特性。好啦,本篇文章就先到這了,后續(xù)繼續(xù)更新AI商業(yè)案例教程。
作者的公眾號二維碼丨掃一掃,關(guān)注我
我們是一支專注于AI繪畫領(lǐng)域的設(shè)計團隊
旨在成為AIGC教育領(lǐng)航者和設(shè)計行業(yè)變革者
由行業(yè)資深的UI設(shè)計師、UX設(shè)計師、動效設(shè)計師、品牌設(shè)計師以及三維設(shè)計師組成
期待與大家一起共同成長進步
近期文章
更多