永久免费av网站,中文字幕av无码不卡

亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁(yè) > 教程 > 文章

2023-06-28 09:01

超級(jí)簡(jiǎn)單 | 0基礎(chǔ)教你學(xué)會(huì) Stable Diffusion 入門(mén)教學(xué) 安裝篇【1】 —了解Stable Diffusion

AI奇點(diǎn)網(wǎng)工具使用教程丨Stable Diffusion 使用教程系列

本文是一篇關(guān)于如何使用 Stable Diffusion 繪畫(huà)的教程，包括軟件介紹和案例。

這篇文章就是完完全的幫助小白去了解 AI 繪畫(huà)的一篇入門(mén)級(jí)教程，網(wǎng)絡(luò)上關(guān)于 SD的教程實(shí)在是零散的，梳理成系列的網(wǎng)站非常少，AI奇點(diǎn)網(wǎng)的小青蛙就幫大家梳理一下 SD 的教學(xué)系列，幫助完全 0 基礎(chǔ)的小可愛(ài)也可以使用AI進(jìn)行創(chuàng)作，即使沒(méi)有代碼能里和手繪技術(shù)也能成為創(chuàng)作大師?，F(xiàn)在將所有的教程匯集整合成一個(gè)系列免費(fèi)送給大家。

小編吐槽一下AI給作為設(shè)計(jì)師的群體帶來(lái)不小的沖擊，2022年不斷有消息傳來(lái)大廠的設(shè)計(jì)崗在裁員，當(dāng)時(shí)呱呱也十分的焦慮，自己又弱又菜雞。不過(guò)在接觸到 ChatGPT 和 AI 繪畫(huà)的時(shí)候，就想到要去學(xué)習(xí)使用。現(xiàn)在來(lái)看一個(gè)答題的學(xué)習(xí)步驟。

第一是要去了解它背后的原理，或者說(shuō)它大概能做什么了解之后就相對(duì)沒(méi)有那么焦慮了，第二是打不過(guò)就加入，讓 AI 成為你的一個(gè)工具，同時(shí)，即使通過(guò) AI 可以抹平大家技法上的差距，但是審美上的差距是無(wú)法用 AI 抹平的，而這個(gè)可能會(huì)變成大家能力差距的重要來(lái)源。

了解SD — stable diffusion 是什么

Stable diffusion是一種基于潛在擴(kuò)散模型（Latent Diffusion Models）的文本到圖像生成模型，能夠根據(jù)任意文本輸入生成高質(zhì)量、高分辨率、高逼真的圖像。2022年8月由德國(guó)CompVis協(xié)同Stability AI和Runway發(fā)表論文，并推出相關(guān)程序。

同年，AUTOMATIC1111開(kāi)發(fā)了圖形化界面：「Stable Diffusion WebUI」，這是能用AI技術(shù)生成圖片的開(kāi)源軟件，只要給定一組描述文本，AI就會(huì)開(kāi)始繪圖(準(zhǔn)確的說(shuō)是「算圖」或「生圖」)；亦能模仿現(xiàn)有的圖片，生成另一張圖片。甚至給它一部分涂黑的圖片，AI也能按照你的意愿將圖片填上適當(dāng)?shù)膬?nèi)容。除此之外還支持自行訓(xùn)練模型加強(qiáng)生圖效果。

Stable Diffusion的原理可以分為以下幾個(gè)步驟：

Stable Diffusion使用一個(gè)新穎的文本編碼器（OpenCLIP），由LAION開(kāi)發(fā)并得到Stability AI的支持，將文本輸入轉(zhuǎn)換為一個(gè)向量表示。這個(gè)向量表示可以捕捉文本的語(yǔ)義信息，并與圖像空間對(duì)齊。
Stable Diffusion使用一個(gè)擴(kuò)散模型（Diffusion Model），將一個(gè)隨機(jī)噪聲圖像逐漸變換為目標(biāo)圖像。擴(kuò)散模型是一種生成模型，可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)出一個(gè)概率分布，并從中采樣出新的數(shù)據(jù)。
在擴(kuò)散過(guò)程中，stable diffusion利用文本向量和噪聲圖像作為條件輸入，給出每一步變換的概率分布。這樣，stable diffusion可以根據(jù)文本指導(dǎo)噪聲圖像向目標(biāo)圖像收斂，并保持圖像的清晰度和連貫性。
最后，Stable Diffusion使用一個(gè)超分辨率放大器（Upscaler Diffusion Model），將生成的低分辨率圖像放大到更高的分辨率。超分辨率放大器也是一個(gè)擴(kuò)散模型，可以從低分辨率圖像中恢復(fù)出細(xì)節(jié)信息，并增強(qiáng)圖像質(zhì)量。

Stable Diffusion WebUI支持多系統(tǒng)又有很好的擴(kuò)充性，便成為最多人使用的圖形化程序。其圖形界面是通過(guò)網(wǎng)頁(yè)訪問(wèn)的，上手無(wú)難度，還有社群制作的界面中文化擴(kuò)充功能。

與其他云端AI繪圖軟件Midjoruney、NovelAI、DALL-E相比，Stable Diffusion WebUI最大優(yōu)點(diǎn)是可以免費(fèi)在自己的電腦或服務(wù)器跑，且只要遵照 Creative ML OpenRAIL-M授權(quán)條款的話，幾無(wú)使用限制。因其開(kāi)放原代碼的特性，任何人都可以貢獻(xiàn)代碼，參與改進(jìn)項(xiàng)目。

一開(kāi)始Stable Diffusion WebUI支持的是x86架構(gòu)，配備獨(dú)立顯卡的Linux和Windows電腦。不過(guò)AI繪圖熱門(mén)到讓Apple公司親自下場(chǎng)優(yōu)化，于是macOS也可以跑Stable Diffusion WebUI了。只是用筆電跑的要小心，AI繪圖會(huì)占用大量GPU資源，小心散熱。

至2023年，Stable Diffusion WebUI已支持Linux/Windows/MacOS系統(tǒng)，以及Nvidia/AMD/Apple Silicon M的GPU。

通俗來(lái)說(shuō)Stable Diffusion 是一種基于擴(kuò)散過(guò)程的圖像生成模型，可以生成高質(zhì)量、高分辨率的圖像。它通過(guò)模擬擴(kuò)散過(guò)程，將噪聲圖像逐漸轉(zhuǎn)化為目標(biāo)圖像。這種模型具有較強(qiáng)的穩(wěn)定性和可控性，可以生成具有多樣化效果和良好視覺(jué)效果的圖像。

Stable Diffusion的特點(diǎn)

高度靈活：Stable Diffusion模型能夠用于生成各種類型的圖像，如人臉、物體等，為開(kāi)發(fā)者提供了廣泛的應(yīng)用場(chǎng)景。
高質(zhì)量圖像生成：Stable Diffusion模型經(jīng)過(guò)大量高質(zhì)量圖像訓(xùn)練，生成的圖像具有較高的逼真度和細(xì)節(jié)表現(xiàn)力。
開(kāi)源模型：現(xiàn)在已經(jīng)有了預(yù)訓(xùn)練模型的支持，開(kāi)發(fā)者可以在本地機(jī)器上進(jìn)行二次開(kāi)發(fā)和調(diào)整，這降低了學(xué)習(xí)和使用的門(mén)檻。

Stable Diffusion的優(yōu)勢(shì)

Stable Diffusion的優(yōu)勢(shì)在于其高質(zhì)量的圖像生成和靈活性，能夠應(yīng)用于多種場(chǎng)景。該模型可以生成高質(zhì)量的圖像，逼真度和細(xì)節(jié)表現(xiàn)力較好，能夠更好地滿足實(shí)際需求。同時(shí)，開(kāi)源模型的支持使得開(kāi)發(fā)者可以在本地進(jìn)行開(kāi)發(fā)和調(diào)整，減少了學(xué)習(xí)和使用的難度。

Stable Diffusion的局限性

Stable Diffusion模型的處理速度較慢，且在處理高分辨率圖像時(shí)占用的內(nèi)存較大。這主要是因?yàn)閿U(kuò)散模型在像素空間中運(yùn)行，導(dǎo)致處理時(shí)間緩慢且內(nèi)存消耗較大。因此，在處理高分辨率圖像時(shí)可能會(huì)遇到時(shí)間和內(nèi)存消耗的挑戰(zhàn)。

現(xiàn)在也有很多的解決辦法，B站的秋葉大佬已經(jīng)將 SD 的開(kāi)源模型整理好成為一個(gè)下載下來(lái)就能用的小白工具，也可是部署在云端，依靠云服務(wù)器的算力來(lái)使用 SD。

應(yīng)用場(chǎng)景舉例

虛擬角色設(shè)計(jì)：根據(jù)文本描述，Stable Diffusion可以生成具體的角色面孔，輔助設(shè)計(jì)師進(jìn)行創(chuàng)作。

商品建模：通過(guò)輸入商品描述，模型可以生成相應(yīng)的商品圖像，方便電商平臺(tái)展示。

藝術(shù)創(chuàng)作：藝術(shù)家可以將自己的構(gòu)思用文字表述，借助Stable Diffusion將想法轉(zhuǎn)化為具體的圖像作品。

SD 的應(yīng)用場(chǎng)景不僅限于這三個(gè)領(lǐng)域，現(xiàn)在大家可以想到的領(lǐng)域基本都可以實(shí)現(xiàn)。呱呱在油管上看到有建筑，動(dòng)漫，園林等等。利用 SD 結(jié)合其他軟件，多人的工作流程，現(xiàn)在甚至可以縮減到1人。隨著技術(shù)的不斷突破和改進(jìn)，我們一起努力跟進(jìn)未來(lái)。