超級(jí)簡(jiǎn)單 | 0基礎(chǔ)教你學(xué)會(huì) Stable Diffusion 入門(mén)教學(xué) 安裝篇【1】 —了解Stable Diffusion
AI奇點(diǎn)網(wǎng)工具使用教程丨Stable Diffusion 使用教程系列
本文是一篇關(guān)于如何使用 Stable Diffusion 繪畫(huà)的教程,包括軟件介紹和案例。
這篇文章就是完完全的幫助小白去了解 AI 繪畫(huà)的一篇入門(mén)級(jí)教程,網(wǎng)絡(luò)上關(guān)于 SD的教程實(shí)在是零散的,梳理成系列的網(wǎng)站非常少,AI奇點(diǎn)網(wǎng)的小青蛙就幫大家梳理一下 SD 的教學(xué)系列,幫助完全 0 基礎(chǔ)的小可愛(ài)也可以使用AI進(jìn)行創(chuàng)作,即使沒(méi)有代碼能里和手繪技術(shù)也能成為創(chuàng)作大師?,F(xiàn)在將所有的教程匯集整合成一個(gè)系列免費(fèi)送給大家。
小編吐槽一下AI給作為設(shè)計(jì)師的群體帶來(lái)不小的沖擊,2022年不斷有消息傳來(lái)大廠的設(shè)計(jì)崗在裁員,當(dāng)時(shí)呱呱也十分的焦慮,自己又弱又菜雞。不過(guò)在接觸到 ChatGPT 和 AI 繪畫(huà)的時(shí)候,就想到要去學(xué)習(xí)使用。現(xiàn)在來(lái)看一個(gè)答題的學(xué)習(xí)步驟。
第一是要去了解它背后的原理,或者說(shuō)它大概能做什么了解之后就相對(duì)沒(méi)有那么焦慮了,第二是打不過(guò)就加入,讓 AI 成為你的一個(gè)工具, 同時(shí),即使通過(guò) AI 可以抹平大家技法上的差距,但是審美上的差距是無(wú)法用 AI 抹平的,而這個(gè)可能會(huì)變成大家能力差距的重要來(lái)源。
了解SD — stable diffusion 是什么
Stable diffusion是一種基于潛在擴(kuò)散模型(Latent Diffusion Models)的文本到圖像生成模型,能夠根據(jù)任意文本輸入生成高質(zhì)量、高分辨率、高逼真的圖像。2022年8月由德國(guó)CompVis協(xié)同Stability AI和Runway發(fā)表論文,并推出相關(guān)程序。
同年,AUTOMATIC1111開(kāi)發(fā)了圖形化界面:「Stable Diffusion WebUI」,這是能用AI技術(shù)生成圖片的開(kāi)源軟件,只要給定一組描述文本,AI就會(huì)開(kāi)始繪圖(準(zhǔn)確的說(shuō)是「算圖」或「生圖」);亦能模仿現(xiàn)有的圖片,生成另一張圖片。甚至給它一部分涂黑的圖片,AI也能按照你的意愿將圖片填上適當(dāng)?shù)膬?nèi)容。除此之外還支持自行訓(xùn)練模型加強(qiáng)生圖效果。
Stable Diffusion的原理可以分為以下幾個(gè)步驟:
Stable Diffusion WebUI支持多系統(tǒng)又有很好的擴(kuò)充性,便成為最多人使用的圖形化程序。其圖形界面是通過(guò)網(wǎng)頁(yè)訪問(wèn)的,上手無(wú)難度,還有社群制作的界面中文化擴(kuò)充功能。
與其他云端AI繪圖軟件Midjoruney、NovelAI、DALL-E相比,Stable Diffusion WebUI最大優(yōu)點(diǎn)是可以免費(fèi)在自己的電腦或服務(wù)器跑,且只要遵照 Creative ML OpenRAIL-M授權(quán)條款的話,幾無(wú)使用限制。因其開(kāi)放原代碼的特性,任何人都可以貢獻(xiàn)代碼,參與改進(jìn)項(xiàng)目。
一開(kāi)始Stable Diffusion WebUI支持的是x86架構(gòu),配備獨(dú)立顯卡的Linux和Windows電腦。不過(guò)AI繪圖熱門(mén)到讓Apple公司親自下場(chǎng)優(yōu)化,于是macOS也可以跑Stable Diffusion WebUI了。只是用筆電跑的要小心,AI繪圖會(huì)占用大量GPU資源,小心散熱。
至2023年,Stable Diffusion WebUI已支持Linux/Windows/MacOS系統(tǒng),以及Nvidia/AMD/Apple Silicon M的GPU。
通俗來(lái)說(shuō)Stable Diffusion 是一種基于擴(kuò)散過(guò)程的圖像生成模型,可以生成高質(zhì)量、高分辨率的圖像。它通過(guò)模擬擴(kuò)散過(guò)程,將噪聲圖像逐漸轉(zhuǎn)化為目標(biāo)圖像。這種模型具有較強(qiáng)的穩(wěn)定性和可控性,可以生成具有多樣化效果和良好視覺(jué)效果的圖像。
Stable Diffusion的特點(diǎn)
Stable Diffusion的優(yōu)勢(shì)
Stable Diffusion的優(yōu)勢(shì)在于其高質(zhì)量的圖像生成和靈活性,能夠應(yīng)用于多種場(chǎng)景。該模型可以生成高質(zhì)量的圖像,逼真度和細(xì)節(jié)表現(xiàn)力較好,能夠更好地滿足實(shí)際需求。同時(shí),開(kāi)源模型的支持使得開(kāi)發(fā)者可以在本地進(jìn)行開(kāi)發(fā)和調(diào)整,減少了學(xué)習(xí)和使用的難度。
Stable Diffusion的局限性
Stable Diffusion模型的處理速度較慢,且在處理高分辨率圖像時(shí)占用的內(nèi)存較大。這主要是因?yàn)閿U(kuò)散模型在像素空間中運(yùn)行,導(dǎo)致處理時(shí)間緩慢且內(nèi)存消耗較大。因此,在處理高分辨率圖像時(shí)可能會(huì)遇到時(shí)間和內(nèi)存消耗的挑戰(zhàn)。
現(xiàn)在也有很多的解決辦法,B站的秋葉大佬已經(jīng)將 SD 的開(kāi)源模型整理好成為一個(gè)下載下來(lái)就能用的小白工具,也可是部署在云端,依靠云服務(wù)器的算力來(lái)使用 SD。
應(yīng)用場(chǎng)景舉例
虛擬角色設(shè)計(jì):根據(jù)文本描述,Stable Diffusion可以生成具體的角色面孔,輔助設(shè)計(jì)師進(jìn)行創(chuàng)作。
商品建模:通過(guò)輸入商品描述,模型可以生成相應(yīng)的商品圖像,方便電商平臺(tái)展示。
藝術(shù)創(chuàng)作:藝術(shù)家可以將自己的構(gòu)思用文字表述,借助Stable Diffusion將想法轉(zhuǎn)化為具體的圖像作品。
SD 的應(yīng)用場(chǎng)景不僅限于這三個(gè)領(lǐng)域,現(xiàn)在大家可以想到的領(lǐng)域基本都可以實(shí)現(xiàn)。呱呱在油管上看到有建筑,動(dòng)漫,園林等等。利用 SD 結(jié)合其他軟件,多人的工作流程,現(xiàn)在甚至可以縮減到1人。隨著技術(shù)的不斷突破和改進(jìn),我們一起努力跟進(jìn)未來(lái)。
這一小節(jié)已經(jīng)基本的了解 SD 是什么,能做什么,有什么優(yōu)缺點(diǎn),還有超級(jí)詳細(xì)的大綱。下一小節(jié)我們?nèi)チ私庖幌赂鞣N安裝方式。(有些素材源自于網(wǎng)絡(luò))