プロンプトエンジニアリング入門
Stable Diffusion のプロンプトは「英語の呪文」と表現されますが、法則を覚えれば狙った画像に近づけられます。 本ガイドでは、sd.keydrop.net を含む Stable Diffusion 系ツール全般で使える共通テクニックを解説します。
1. 基本構造
SD のプロンプトはカンマ区切りのタグの集合です。文法の重要度は低く、語順と重みが効きます。
[主題] , [描写] , [画風] , [品質タグ]
例: 1girl, red hair, forest background, anime style, masterpiece, best quality
2. 語順の影響
先頭にあるタグほど強く効きます(CLIP の 77 トークン制限と attention の性質)。 「絶対に入れたい要素」は前に、調整的な要素は後ろに置きましょう。
3. 重み付け構文
AUTOMATIC1111 互換の重み構文は sd.keydrop.net でも利用できます。
(word)— 1.1 倍(軽く強調)((word))— 1.21 倍(word:1.3)— 1.3 倍(明示)[word]— 0.91 倍(弱める)
1.5 を超えると破綻しやすくなります。まずは 1.1〜1.3 で試しましょう。
4. ネガティブプロンプト
「避けたい要素」を列挙します。アニメ系・リアル系で定番テンプレが違います。
# アニメ系
lowres, bad anatomy, bad hands, text, error, missing fingers,
extra digit, fewer digits, cropped, worst quality, low quality,
jpeg artifacts, signature, watermark, username, blurry
# リアル系
cartoon, 3d, illustration, painting, drawing, anime, doll, plastic,
deformed, bad anatomy, blurry, lowres, extra fingers, fused fingers
※ SD-Turbo は CFG=1 で動かすためネガティブが無効化されます。代わりにポジティブ側で品質指定しましょう。
5. 品質タグ
モデルが学習したメタ的なラベルを使うと、全体の質感が底上げされます。
- アニメ系:
masterpiece, best quality, highly detailed, ultra-detailed - リアル系:
RAW photo, 8k, hdr, ultra-realistic, sharp focus - レンズ:
35mm, 85mm, bokeh, shallow depth of field
6. 構図・アングル指定
close-up/upper body/full body— 構図from above/from below/side view— アングルdynamic pose/action shot— 動きを出す
7. パラメータとの組み合わせ
| 設定 | 推奨範囲 | 効果 |
|---|---|---|
| CFG Scale | 5〜9 | 高いほどプロンプト忠実度↑(上げ過ぎると破綻) |
| Steps | 20〜30 | Turbo/LCM なら 4〜8 |
| Seed | 固定 | 微調整時は seed を固定してプロンプトだけ変える |
8. 日本語で考えて英訳する
プロンプトは英語が基本ですが、まず日本語でアイデアを出してから英訳する方が早く上達します。 sd.keydrop.net のプロンプト欄にはブラウザ内 JP→EN 翻訳ボタンを内蔵しており、外部 API に送らずローカル変換できます。
関連ページ