SD-Turbo をブラウザで動かす
SD-Turbo は Stability AI が公開した Stable Diffusion 1.5 系の蒸留モデルで、わずか 1〜4 ステップで画像を生成できます。 sd.keydrop.net ではこれを ONNX に変換し、ブラウザ内の WebGPU で推論します。
特徴
- 1〜4 ステップで画像が完成するため、WebGPU 推論でも実用速度
- UNet / VAE / Text Encoder すべてが軽量(合計 ~2.5GB)
- VRAM 4GB 以上の GPU で 512×512 が動作
- CFG は 1.0(disable)推奨 — 蒸留モデルの特性
推奨設定
| 解像度 | 512×512 |
| Steps | 3〜4 |
| CFG Scale | 1.0 |
| Sampler | Euler Ancestral |
| 必要 VRAM | 4 GB+ |
モデルの入手先
Hugging Face で公開されている ONNX 変換済みモデルをそのまま利用できます。
schmuell/sd-turbo-ort-web— Web 向けに最適化された ONNX バージョン(推奨)stabilityai/sd-turbo— Diffusers 形式のオリジナル(ONNX 変換が必要)
使い方
- sd.keydrop.net のアプリを開く
- モデル選択画面で SD-Turbo 用の ONNX ファイル一式(text_encoder / unet / vae_decoder)と tokenizer(vocab.json / merges.txt)をドラッグ & ドロップ
- プロンプトを入力し、Steps=3、CFG=1.0 で生成ボタンを押す
詳細手順は ユーザーマニュアル を参照してください。