Qwen

Qwen の画像生成・編集機能、API利用手順と料金・ローカル実装ガイド

ⓘ本ページはプロモーションが含まれています

スポンサードリンク

1. 機能概要と使い分け

Qwen の画像生成機能は大きく Image GenerationImage Edit に分かれます。どちらを選択すべきかは、目的が「全く新しいビジュアルを作り出す」か「既存素材に手を加える」かで決まります。

1‑1. Image Generation と Image Edit の違い

Image Generation はテキストプロンプトだけで画像を一から生成します。一方、Image Edit は「元画像 + 編集指示」の組み合わせで部分的に変更します。以下の表は主な違いと利用シーンをまとめたものです。

項目 Image Generation Image Edit
入力 テキストプロンプトのみ 画像 + テキスト指示
用途例 コンセプトアート、UI モック全体作成 バナーのロゴ追加、背景差し替え、色調修正
メリット デザイン自由度が高い レイアウトや配色の一貫性を保ちやすい
デメリット 完全に新規生成になるため細部調整に手間がかかることもある 元画像が必要で、品質は元素材に依存する

ポイント:概念設計・ブレインストーミング段階では Image Generation、実務の微修正や要素追加には Image Edit が最適です。


2. Web UI と API の利用手順

公式サイトからはブラウザだけで手軽に試せる Web UI と、システムへ組み込める REST API が提供されています。本節ではアカウント作成から画像取得までの具体的なフローを示します。

2‑1. Web UI の利用開始

Web UI は無料トライアルが用意されているため、数クリックでプロンプト入力 → 画像生成が完了します。以下は実際の操作手順です。

  1. 公式ページにアクセス
    https://qwen.com/webui(2026‑06‑23 更新)から「Sign Up」をクリックし、メール認証でアカウントを作成します[¹]。

  2. ダッシュボードで Image Generation を選択
    左側メニューの「Image Generation」タブを開き、プロンプト例 夜景の東京タワー、ネオンが光る を入力します。

  3. 画像生成と保存
    「Generate」ボタンを押すと約 5 秒で結果が表示されます。プレビュー画面から「Download」をクリックすると PNG がローカルに保存できます。

ポイント:Web UI は認証・課金情報が自動管理され、生成履歴やサンプル画像の閲覧も可能です。まずは無料枠で操作感を確認しましょう。

2‑2. API キー取得と Python サンプル

REST API の利用には API Key が必要です。キーはダッシュボードの「API Management」から作成できます(有効期限は 30 日)[²]。

2‑2‑1. キー取得手順

  • ダッシュボード → 「API Management」→「Create Key」をクリック
  • 表示された文字列を安全な場所に保存(環境変数で管理することが推奨)

2‑2‑2. 最小構成の Python コード

以下は画像生成エンドポイントへの POST リクエスト例です。公式ドキュメントに記載されているエンドポイントとリクエストフォーマットをそのまま使用しています[³]。

ポイントseed を固定すると同一プロンプトでも再現性が保てます。バッチ処理や CI/CD パイプラインへの組み込みはこのスニペットをベースに拡張してください。


3. 料金プランとコスト試算(2026 年)

Qwen の画像生成は 従量課金制定額パック の二つのプランが公式に提供されています。価格情報は 2026‑06‑23 時点の公式料金ページを参照しています[⁴]。

プラン 単価(1 枚あたり) 月間上限 主な特徴
従量課金 (Pay‑as‑you-go) 0.025 USD 無制限 API リクエストごとに課金。サイズ・解像度で若干変動
Basic パック 100 USD /月 最大 4,000 枚 定額で一定枚数まで利用可。超過分は従量課金
Pro パック 220 USD /月 最大 10,000 枚 優先キュー・レートリミット緩和付き
Enterprise カスタム見積もり カスタム SLA、オンプレミスオプション、専用サポート

3‑1. 月間 10,000 枚生成した場合の概算コスト

プラン 計算式 コスト
従量課金 10,000 × 0.025 USD 250 USD
Pro パック(上限使用) 220 USD + (0 枚 × 0.025 USD) 220 USD
Enterprise カスタム見積もり 要問い合わせ

結論:標準解像度 (1024×768) の場合、10,000 枚/月の利用は Pro パックが最もコスト効率が高いです。為替変動やキャンペーン割引は別途確認してください。


4. ローカル PC で Qwen‑Image を動かす方法

データ保護やレイテンシ削減の観点から、オンプレミス環境でモデルを実行したいケースがあります。本節では ComfyUI を用いたセットアップ手順と、必要な VRAM 要件・蒸留版モデル取得方法を解説します。

4‑1. ComfyUI のインストール

ComfyUI はプラグイン方式で Qwen‑Image を簡単に組み込める GUI ツールです。以下の手順は公式リポジトリ (2026‑06‑22 更新) に基づいています[⁵]。

  1. Git と Python(≥3.9)をインストール
  2. リポジトリをクローンし、ディレクトリに移動

bash
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

  1. 仮想環境の作成と有効化(推奨)

bash
python -m venv .venv
# macOS / Linux
source .venv/bin/activate
# Windows
.venv\Scripts\activate

  1. 依存パッケージのインストール

bash
pip install --upgrade pip
pip install -r requirements.txt

  1. 起動

bash
python main.py

起動後に自動で http://127.0.0.1:8188 がブラウザで開きます。左側メニューの「Model」→「Add Model」で Qwen‑Image のパスを指定すれば完了です。

4‑2. VRAM 要件と蒸留版モデル

モデル 推奨 VRAM ダウンロード先(公式)
Qwen‑Image‑2512 (フル) 12 GB 以上 https://qwen.com/models/qwen-image-2512
Distilled‑Qwen‑Image 8 GB 推奨 同上(蒸留版)

VRAM が不足すると「CUDA out of memory」エラーが頻発し、生成速度も低下します。GPU が 8 GB 未満の場合は蒸留版の使用を検討してください。

ポイント:ローカル実行時は GPU ドライバと CUDA バージョンが公式推奨環境(CUDA 12.x)と合致していることを必ず確認しましょう。


5. 日本語プロンプトの作り方と精度向上テクニック

Qwen‑Image は日本語トークナイザーを内部で使用しており、キーワードの順序や表現が生成品質に直結します。本節では 3 要素構造 と実測データに基づくベストプラクティスをご紹介します。

5‑1. 基本的なプロンプト構造

「主題 + 形容詞・スタイル + 詳細条件」の三層で組み立てると、意図がモデルに正確に伝わります(公式ガイドライン参照)[⁶]。

要素 記述例
主題 夜景の東京タワー
形容詞・スタイル ネオンが光る、サイバーパンク風
詳細条件 解像度 4K、左上からライト、青緑系カラー

完成例夜景の東京タワー、ネオンが光るサイバーパンク風、解像度 4K、左上からライト、青緑系カラー

5‑2. yoom.fun の評価結果に基づく改善ポイント

yoom.fun が公開した 2025‑12‑31 時点の評価データ(FID スコア)によると、光源指定色相キーワード を追加するとスコアが平均 15 % 改善します[⁷]。

プロンプト FID (低いほど良)
夜景の東京タワー 45.2
夜景の東京タワー、ネオンが光る 38.7
夜景の東京塔、ネオンが光る、青緑系カラー、上部からライト 32.1

実践テクニック

  • 光源は必ず方向を付記(例:左上からライトバックライト)。
  • カラーパレットは具体的に指定(例:暖色系青緑系カラー)。
  • 再現性が必要な場合は --seed 1234 のように乱数シードを明示。

ポイント:日本語プロンプトでも「光源」や「カラーパレット」を明確に指示するだけで、画像の構図と色合いが大幅に向上します。


6. 主な活用シーンと留意点・制限事項

Qwen の画像生成はマーケティング素材、UI デザイン、商品カタログなど多様な業務で活用できます。一方でハードウェア要件や利用規約上の注意点を事前に把握しておくことが重要です。

6‑1. 代表的なユースケース

シーン Image Edit の具体操作例
広告バナー 背景を「桜並木」に差し替え (background: 桜並木)
UI デザイン ボタンに「新機能」アイコン追加 (add icon: 新機能)
商品カタログ 余計な影を除去 (remove shadow)
スタイル統一 全画像を手描き風に変換 (style: 手描きイラスト)

6‑2. 技術的・法的留意点

項目 内容
VRAM 必要量 フルモデルは 12 GB、蒸留版は 8 GB が推奨。不足時はバッチサイズを減らすかクラウド GPU を利用
API レートリミット 従量課金プランは 1 分間に最大 30 リクエスト、Pro パックは 60 リクエスト/分(超過で 429 エラー)[⁸]
著作権・利用規約 生成物は「非独占的商用利用可」ですが、人物やロゴが含まれる画像は事前に権利確認が必要。詳細は公式 Content Policy を参照[⁹]

ポイント:VRAM・レートリミット・著作権の 3 点を導入段階でチェックすれば、運用時のトラブルを未然に防げます。


参考文献・リンク

  1. Qwen Web UI 公式ページ, https://qwen.com/webui (2026‑06‑23)
  2. API キー管理画面, https://qwen.com/dashboard/api (2026‑06‑23)
  3. REST API 仕様書, https://api.qwen.com/v1/docs (2026‑06‑23)
  4. 料金プラン一覧, https://qwen.com/pricing (2026‑06‑23)
  5. ComfyUI GitHub リポジトリ, https://github.com/comfyanonymous/ComfyUI (2026‑06‑22)
  6. プロンプト作成ガイド(公式), https://qwen.com/docs/prompting (2026‑06‑20)
  7. yoom.fun 評価レポート, https://yoom.fun/qwen-evaluation-2025 (2025‑12‑31)
  8. API レートリミット詳細, https://qwen.com/docs/rate-limit (2026‑06‑23)
  9. Content Policy, https://qwen.com/legal/content-policy (2026‑06‑23)
スポンサードリンク

-Qwen