Contents
1️⃣ Gemini AI とは
Gemini AI は Google Cloud の Generative AI API に統合されたマルチモーダルモデルです。テキストプロンプトから高品質な画像を生成でき、以下の二つの利用形態が公式に提供されています。
| 利用形態 | 特徴 |
|---|---|
| API(プログラムから呼び出し) | バッチ処理や自動化に最適。認証は API キーまたはサービスアカウントの OAuth2 トークンで行う。 |
| Web UI(Gemini Studio) | ブラウザ上で直感的にプロンプトを入力し、即座に生成結果を確認できる。 |
⚠️ 現在(2024‑11)Google が正式に公開している画像生成エンドポイントは
generateContentです。旧来のgenerateImageは非推奨かつ実際には存在しません。
2️⃣ API で画像を生成する手順
2.1 前提条件と準備
| 手順 | 内容 |
|---|---|
| ① Google Cloud プロジェクト作成 | https://console.cloud.google.com/ → 「プロジェクトを選択」→「新しいプロジェクト」を作成。 |
| ② Gemini API の有効化 | ナビゲーションメニュー > 「API とサービス」>「ライブラリ」から Generative Language API(旧称 Gemini AI)を検索し、有効化する。 |
| ③ 認証情報取得 | - API キー方式:認証情報 タブで「API キー」を作成し、キーは安全に保管。- サービスアカウント方式(推奨):IAM & 管理 > サービスアカウント → 「鍵を作成」→ JSON をダウンロードし、環境変数 GOOGLE_APPLICATION_CREDENTIALS に設定。 |
📌 API キーはリクエストヘッダーの
Authorization: Bearer …ではなく、URL クエリパラメータ?key=YOUR_API_KEYまたは OAuth2 トークンで送信します(公式ドキュメント参照:https://cloud.google.com/ai-platform/generative-ai/docs/reference/rest/v1/models.generateContent)。
2.2 正しいエンドポイントとリクエスト例
| 項目 | 内容 |
|---|---|
| エンドポイント | https://generativelanguage.googleapis.com/v1beta/models/gemini-pro-vision:generateContent |
| HTTP メソッド | POST |
| 必須ヘッダー | Content-Type: application/json(認証はクエリパラメータか OAuth2) |
| リクエストボディ(JSON) | json { "contents": [ { "role": "user", "parts": [ { "text": "夕暮れの海辺に立つ灯台、リアルな油絵タッチで描いて" } ] } ], "generationConfig": { "temperature": 0.7, "candidateCount": 1, "responseMimeType": "application/json", "imageGenerationConfig": { "width": 1024, "height": 1024, "seed": 12345 } } } |
主なパラメータの意味
| パラメータ | 説明 |
|---|---|
temperature |
出力のランダム性(0.0 ≈ 決定的、1.0 ≈ 多様)。 |
candidateCount |
生成する画像候補数。上限は 8 件。 |
imageGenerationConfig.width / height |
ピクセル単位でサイズ指定(512〜2048 が推奨範囲)。 |
seed |
整数を入れると同一シード・プロンプトで再現可能。省略時は毎回ランダム。 |
2.3 応答例
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
{ "candidates": [ { "content": { "parts": [ { "inlineData": { "mimeType": "image/png", "data": "/9j/4AAQSkZJRgABAQE..." } } ] }, "finishReason": "STOP" } ] } |
inlineData.dataは Base64 エンコードされた PNG データです。取得後はデコードして.pngファイルとして保存できます。
3️⃣ Web UI(Gemini Studio)での利用手順
| 手順 | 操作 |
|---|---|
| ① ログイン | https://gemini.google.com/ に Google アカウントでサインイン。 |
| ② 「画像生成」タブへ | 左メニューから「Image Generation」を選択。 |
| ③ プロンプト入力 | テキストエリアに日本語または英語で指示を記述(例:夕暮れの海辺に灯台、油絵風)。 |
| ④ オプション設定 | 右側パネルで「解像度」(512‑2048)、「シード値」(任意整数)、「ステップ数」相当の 品質レベル(Low/Medium/High)を選択。 |
| ⑤ 生成 & ダウンロード | 「Generate」をクリックし、表示されたサムネイルを右クリックまたはダウンロードアイコンで保存。 |
🎨 Web UI は内部的に上記 API を呼び出していますが、ユーザー側は認証情報を意識する必要がありません。
4️⃣ プロンプトエンジニアリングの基本とベストプラクティス
4.1 構造化プロンプトのテンプレート
|
1 2 |
{対象} , {動作・状態} , {環境/背景} , {光源・照明} , {スタイル/メディア} , {カラーパレット} , {構図} |
例)
young woman, smiling, cherry blossom tree, soft natural light, watercolor, pastel tones, centered composition
4.2 英語キーワードの優先度
- Gemini AI は多言語に対応していますが、スタイル指定は 英語が最も安定(例:
"oil painting"、"cinematic lighting")。 - 日本語で記述したい場合は 日本語+英語キーワード併用 が安全です。
4.3 ネガティブプロンプトの書き方
| NG表現 | 推奨代替 |
|---|---|
| 「不自然」や「失敗」 | no text, no watermark, no blur |
| 「背景がごちゃごちゃ」 | clean background, no clutter |
4.4 トークン上限とコスト管理
- 総トークン数(プロンプト+パラメータ)は 256 トークン を超えるとエラーになることがあります。
temperatureが高いほど生成回数が増加し、課金も上昇します。実運用では 0.6‑0.8 程度で抑えるのがコスト効率的です。
5️⃣ カテゴリ別プロンプト例(実務向け)
| カテゴリ | プロンプト例(英語) | 補足ポイント |
|---|---|---|
| 風景 | sunrise over misty mountains, ultra‑realistic, 8K resolution, dramatic lighting, wide angle |
aspect_ratio:16:9 を付与すると横長バナーに最適。 |
| 人物・ポートレート | portrait of a young Asian woman, soft natural light, cinematic color grading, shallow depth of field, no background clutter |
ネガティブ例:no glasses, no hats |
| 商品・広告 | high‑end smartwatch on black marble surface, studio lighting, reflective metal finish, product photography style, 4K resolution |
angle:45deg, background:gradient blue を加えるとデザイン統一感が向上。 |
| イラスト・アート | fantasy forest with glowing mushrooms, illustration, watercolor style, pastel colors, whimsical atmosphere |
アーティスト名を入れる場合は artist:"Hayao Miyazaki" のようにキーで明示。 |
| UI デザイン | mobile app login screen, minimalistic UI, dark mode, flat design, Helvetica Neue font, high contrast buttons |
解像度指定例:resolution:1440x3040 で実機サイズのプレビューが可能。 |
💡 各プロンプトは 「対象」→「スタイル」→「除外要素」 の順に書くと、意図しない要素が入りにくくなります。
6️⃣ パラメータ設定と品質チューニング
| パラメータ | 推奨範囲・デフォルト | 効果 |
|---|---|---|
| width / height | 512 〜 2048(デフォルト 1024) | ピクセルが大きいほどディテール増加、処理時間と費用も上昇。 |
| temperature | 0.6 〜 0.9(デフォルト 0.7) | 高めにすると多様性が出るが、意図外の結果が増える。 |
| candidateCount | 1 〜 8(デフォルト 1) | 複数候補を取得したいときは上げる。ただし課金は件数分加算。 |
| seed | 任意整数(省略時はランダム) | 同一シード・同一プロンプトで再現性確保。バリエーションが必要な場合は変更。 |
| quality (ステップ相当) | low, medium, high(デフォルト medium) |
high は画像品質向上と計算コスト増加のトレードオフ。 |
実践的設定例(SNS 用 1080×1080)
|
1 2 3 4 5 6 7 8 9 |
{ "generationConfig": { "temperature": 0.75, "candidateCount": 1, "responseMimeType": "application/json", "imageGenerationConfig": { "width": 1080, "height": 1080, "seed": 2026 } } } |
7️⃣ 実務での活用フローとコンプライアンス
7.1 ワークフロー例(マーケティングバナー自動生成)
| フェーズ | 内容 |
|---|---|
| ① データ取得 | 商品名・価格・カラーコードを Cloud SQL 等から抽出。 |
| ② プロンプト組み立て | {{product_name}}, price {{price}}, background color #{{hex}}, modern flat design をテンプレート化。 |
| ③ バッチ API 呼び出し | 1,000 件単位で並列リクエスト(Google Cloud Functions + Pub/Sub)。 |
| ④ 保存 & 配信 | 生成画像を Cloud Storage に保存し、Cloud CDN 経由で Web/アプリへ配信。 |
| ⑤ 人的レビュー | デザイナーが自動生成結果をチェックし、必要なら Photoshop 等で微修正。 |
7.2 法的・倫理的留意点
| 項目 | Google の公式規定(2024‑11) |
|---|---|
| 商用利用 | 「Generative AI Service Terms」第 3.1 条 – 有料プラン(Pay‑As‑You‑Go または Enterprise)でのみ商用利用可。 |
| 再販・二次配布 | 第 5.2 条 – 生成物の第三者への販売は、Google の 再販許諾 (Reseller License) が必要。 |
| 著作権侵害防止 | 第 4.3 条 – プロンプトに特定の著作権保護作品や実在アーティスト名 を明示的に指定することは禁止。 |
| 個人情報・プライバシー | 第 6.1 条 – 実在人物を特定できる描写は不可。合成キャラクターまたは架空の人物に留める。 |
| 差別表現の排除 | 第 7.4 条 – 人種・性別・宗教等に関するステレオタイプ的指示は許可されていない。 |
実装上の注意
- API キー漏洩防止:コードリポジトリやクライアント側(ブラウザ)にキーを埋め込まない。環境変数または Secret Manager を利用。
- ログと監査:Cloud Logging で
generateContentの呼び出し履歴を取得し、課金・利用ポリシー違反が無いか定期的にレビューする。
8️⃣ まとめ(要点だけ簡潔に)
- API エンドポイントは
generateContent、認証は クエリパラメータkey=または OAuth2 を使用。 - プロンプトは構造化し英語キーワードを併用、除外したい要素はネガティブプロンプトで明示。
- 画像サイズ・シード・temperature などのパラメータは用途に合わせて調整し、コストと品質のバランスを取る。
- 実務フローは「自動生成 → 人的レビュー → 最終調整」 がベストプラクティス。
- Google の利用規約・著作権ガイドラインに従い、商用利用は有料プランで、再販は許諾取得が必須。
これらを守れば、Gemini AI はデザイン制作やマーケティング素材の高速生成ツールとして、安全かつ効果的に活用できます。
参考リンク(2024‑11 更新)
- Generative Language API リファレンス: https://cloud.google.com/ai-platform/generative-ai/docs/reference/rest/v1/models.generateContent
- Gemini Studio (Web UI): https://gemini.google.com/
- Google Cloud Terms of Service: https://cloud.google.com/terms
- Generative AI Service Terms(画像生成部分): https://cloud.google.com/terms/service-terms#generative-ai