
皆さんこんにちは!キカガクで機械学習講師をしております。倉田です。
今回は、Stable Diffusion webUI と google colab を用いて、サイバーパンクな侍を書いてみようと思います。
目次
Stable Diffusion とは、プロンプト(言葉や単語の指示)から画像を生成する モデルの一種です。基幹技術に拡散モデル( Diffusion Model )が利用されており、高精度な画像を一瞬で生成できることで話題を呼びました。
実際にこの Diffusion Model がどうやって画像生成を実現しているのか、気になりませんか?
このモデルは、完全にランダムに数値が与えられた画像から、ノイズを除去することで少しずつ画像を生成していきます。
そのため、Diffusion モデルはよく彫刻師に例えられます。(石灰から像を少しずつ削り出す彫刻師のイメージです。)

プロンプトの情報はこのとき、どういう方向性でノイズを除去するのかを指示しているのですが、非常に複雑なので今回は割愛します。気になる方は「CLIP」という技術について調べてみてください!
近年、「プロンプト」という言葉を各所で聞きますが、これは「AI に指示する言葉」のことです。Stable Diffusion でもこのプロンプトをどう書くか(= AI にどのような指示をあたえるか)が、生成画像の良し悪しに強く影響します。
画像生成には「ポジティブプロンプト」と「ネガティブプロンプト」の 2 つのプロンプトを書くことが一般的です。難しそうな名前ですがこれらはそれぞれ以下のような内容を指示するものです。
例えば、「サイバーパンクな侍」を描きたい場合、次のようなプロンプトを書くと良さそうです。
私と同じく英語が苦手な方は、DeepL などを使いながらプロンプトを書くとスムーズに画像生成ができますよ!
今回は画像生成のサービスとして Stable Diffusion web UI を用います。このサービスは ブラウザ上で簡単かつわかりやすい UI で画像生成を行えるサービスです。(しかも無料!)

さて、それでは Stable Diffusion web UI を使って、画像生成を試してみましょう。
では、始めに以下のコードを google colab のセル上にコピペしてください。また、ランタイムは GPU に設定しておきいましょう。(ちなみに下のボタンを押すとコピペ済みの notebook が開くので、そちらで実施しても OK です。)
%pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 torchtext torchaudio torchdata==0.6.0 --index-url https://download.pytorch.org/whl/cu118 !git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui %cd /content/stable-diffusion-webui !wget https://huggingface.co/nuigurumi/basil_mix/resolve/main/Basil_mix_fixed.safetensors -O /content/stable-diffusion-webui/models/Stable-diffusion/Basil_mix_fixed.safetensors !wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors -O /content/stable-diffusion-webui/models/VAE/vae-ft-mse-840000-ema-pruned.safetensors !python launch.py --share --xformers --enable-insecure-extension-access
セルにコピペできた方はこれを実行しましょう。(画像の赤丸を押すと実行できます。)

少し待っていると、「Running on public URL: https :// ~~~~~~~ 」という出力が出てくるので、青字になっているリンクをクリックしてください。

クリックすると、Stable Diffusion web UI にアクセスすることができました!

Stable Diffusion web UI の使い方は非常にシンプルです。
★ Stable Diffusion web UI の 基本操作
では今回は、「サイバーパンクな侍」をテーマに次のようにポジティブプロンプトとネガティブプロンプトを設定しておきます。ちなみに私が実際に考えたプロンプトは赤線の部分のみで、それ以外は汎用的によく使われるプロンプトになります。
Positive Prompt
high quality, very_high_resolution, large_filesize, full color, Samurai, syberpank , neon light, standing in neon city,
Negative Prompt
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name, multiple legs, malformation,
これらのプロンプトを それぞれ ①, ② に書いて、「Genetrate」を押してみると、次のような画像が生成されました!

生成される画像はランダムかつ一度しかでてこないので、もし良さそうな画像が出てきたら保存しておきましょう。(生成画像との出会いは一期一会です!)
全く同じ 設定で Generate を 3回実施してみると次のような画像が出てきました。(ちなみに1枚 5秒ほどで生成でできます。)
![]() | ![]() | ![]() |
いかがだったでしょうか?非常にシンプルな実装で、高性能な画像生成が利用できることが伝われば幸いです。
Stable Diffusion web UI にはこの他にも、拡張機能のインストールや細かなオプションが豊富に用意されているので、ぜひ皆さんも触りながら試してみてください!
.jpg&w=3840&q=75)
キカガクの長期コースはプログラミング経験ゼロの初学者が最先端技術を使いこなすAIエンジニアになるためのサポート体制が整っています!
実際に未経験からの転職・キャリアアップに続々と成功中です
まずは無料説明会で、キカガクのサポート体制を確認しにきてください!
説明会ではこんなことをお話します!
.png&w=3840&q=75)
AI・機械学習を学び始めるならまずはここから!経産省の Web サイトでも紹介されているわかりやすいと評判の Python&機械学習入門コースが無料で受けられます!
さらにステップアップした脱ブラックボックスコースや、IT パスポートをはじめとした資格取得を目指すコースもなんと無料です!
SHARE
AI/データサイエンス学びはじめの方におすすめの記事
コース一覧
注目記事
新着記事