Contents
1. 生成 AI と GCP における役割
| 項目 | 内容 |
|---|---|
| 生成 AI の本質 | 大規模言語モデル(LLM)や拡散モデルを利用して、テキスト・画像・音声などのコンテンツを「自動で」作り出す技術。プロンプト(指示文)だけで多様なアウトプットが得られる点が特徴です。 |
| GCP の中心サービス | - Vertex AI – GCP 全体の機械学習基盤。データ管理、トレーニング、デプロイ、モニタリングまでを一元化します。 - Gemini – Vertex AI が提供する最新世代のマルチモーダル大規模モデル(LLM + 画像生成)。テキスト・コード・画像・動画といった複数モダリティに対して同一 API で呼び出せます。 |
| 実務へのインパクト | - カスタマーサポートの自動応答 - 商品説明や SEO テキストの大量生成 - 広告・デザイン案の高速プロトタイピング - 社内ナレッジベースやコード補完など、業務フロー全般で「人が書く」工程を削減できます。 |
ポイント:Vertex AI が提供するインフラ(エンドポイント・モニタリング等)と Gemini の生成能力は別個に考える必要はありません。両者を組み合わせるだけで、スケーラブルかつ管理しやすい生成 AI ソリューションがすぐに構築できます。
2. プロジェクト作成から API 有効化までのフロー
2‑1. GCP プロジェクトと課金アカウントの準備
| 手順 | 操作内容 |
|---|---|
| 1 | https://console.cloud.google.com/ にログインし、左上メニュー > プロジェクトを作成。 プロジェクト名(例: genai‑quickstart)と組織/フォルダを選択して 作成。 |
| 2 | 作成したプロジェクトを開き、左側メニュー > 請求 → 無料トライアルを開始 をクリック。 300 USD(2026 年 4 月時点)相当のクレジットが 90 日間有効です。このクレジットは Vertex AI と Gemini の利用すべてに適用されます。 |
| 3 | 必要に応じて 請求先アカウント をプロジェクトに紐付け、予算とアラート(後述)を設定しておきます。 |
注意:無料トライアルが終了したら自動的に従量課金に切り替わります。継続利用しない場合は請求先アカウントの無効化またはプロジェクト削除をご検討ください。
2‑2. Vertex AI と Gemini API の有効化
| 手順 | 操作内容 |
|---|---|
| 1 | コンソール左側メニュー > API とサービス → ライブラリ を開く。 |
| 2 | 検索バーに「Vertex AI」→ Vertex AI API(正式名称:aiplatform.googleapis.com)を選択し、有効化。 |
| 3 | 同様に検索バーで「Gemini」 → Vertex AI Gemini Service を探して 有効化。 ※以前は「Gemini API」と呼ばれていましたが、2025 年 10 月のアップデートで正式名称が変更されました。 |
| 4 | 有効化後、コンソール上部に表示される 「利用開始」 ボタンからリージョン(例:us-central1)を選択し、初期エンドポイントを作成します。 |
公式ドキュメント:https://cloud.google.com/vertex-ai/generative-ai/docs/start/introduction
3. 認証設定と実装サンプル
3‑1. サービスアカウントの作成と環境変数設定
| 手順 | 操作 |
|---|---|
| 1 | コンソール左メニュー > IAM と管理 → サービス アカウント を開く。 |
| 2 | + 作成 → 名前(例:genai-sa)・説明を入力し、作成。 |
| 3 | ロールは Vertex AI Administrator(最小権限でエンドポイント作成・呼び出しが可能)または Vertex AI Viewer + AI Platform Service Agent の組み合わせを付与。 |
| 4 | キー作成時に JSON を選択し、ローカルへダウンロード。 |
| 5 | ターミナルで export GOOGLE_APPLICATION_CREDENTIALS="/path/to/genai-sa.json" と設定(シェル起動スクリプトに記載して永続化)。 |
3‑2. Application Default Credentials (ADC) の簡易利用
|
1 2 3 |
# 初回だけ実行すればローカル・Cloud Shell 共通で認証が完了 gcloud auth application-default login |
このコマンドはブラウザで Google アカウントにログインし、取得したアクセストークンを自動的に ~/.config/gcloud/application_default_credentials.json に保存します。ADC が有効になっていれば、Python SDK は自動的に認証情報を参照します。
3‑3. Python SDK(Vertex AI)でのテキスト・画像生成
前提:
pip install -U google-cloud-aiplatformを実行しておくこと。
注意:2026 年 4 月時点では Gemini のプレビューパッケージはvertexai.previewに統合されています。
テキスト生成(Gemini‑1.5‑Pro)
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
# file: generate_text.py from vertexai.preview.language_models import TextGenerationModel import os def generate_text(prompt: str, project: str, location: str = "us-central1") -> str: # 環境変数でプロジェクト ID を渡すか、直接引数で指定 model = TextGenerationModel.from_pretrained( "gemini-1.5-pro", project=project, location=location, ) response = model.predict( prompt, temperature=0.7, max_output_tokens=256, top_p=0.8, ) return response.text if __name__ == "__main__": PROJECT_ID = os.getenv("GOOGLE_CLOUD_PROJECT") print(generate_text( "次世代のスマートシティについて200字で説明してください。", project=PROJECT_ID )) |
画像生成(Gemini‑1.5‑Pro‑Vision)
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
# file: generate_image.py from vertexai.preview.vision_models import ImageGenerationModel import os def generate_image(prompt: str, output_path: str, project: str, location: str = "us-central1"): model = ImageGenerationModel.from_pretrained( "gemini-1.5-pro-vision", project=project, location=location, ) response = model.generate_images( prompt, image_count=1, size="1024x1024", ) # バイナリデータを保存 with open(output_path, "wb") as f: f.write(response.images[0]) if __name__ == "__main__": PROJECT_ID = os.getenv("GOOGLE_CLOUD_PROJECT") generate_image( prompt="青空の下で走るロボット犬", output_path="robot_dog.png", project=PROJECT_ID, ) |
REST API(cURL)例
|
1 2 3 4 5 6 7 8 9 10 11 12 |
# 事前に ADC が有効化されていることを想定 TOKEN=$(gcloud auth application-default print-access-token) curl -X POST \ "https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/gemini-1.5-pro:predict" \ -H "Authorization: Bearer ${TOKEN}" \ -H "Content-Type: application/json" \ -d '{ "instances": [{"content":"AIの倫理について200字で要約してください。"}], "parameters":{"temperature":0.5,"maxOutputTokens":256} }' |
置換必須:
$PROJECT_IDは自分のプロジェクト ID に変更してください。
4. 料金体系と無料枠(2026 年 4 月時点)
| 項目 | 内容 | 出典 |
|---|---|---|
| テキスト生成 | Gemini‑1.5‑Pro の価格は $0.0004 / 1 M トークン(入力+出力合計) | https://cloud.google.com/vertex-ai/generative-ai/pricing |
| 画像生成 | Gemini‑1.5‑Pro‑Vision は $0.0012 / 1 K 画像生成(1024×1024、1 枚あたり) | 同上 |
| 無料枠 | 月間 5 M トークン のテキスト入力・出力が無料。画像生成は月間 1000 枚 が無料提供されます。 | 同上 |
| 課金の単位 | 1 M トークン=約 750 KB(英語)/約 1 000 文字に相当。料金は実際に消費したトークン数に基づき従量課金されます。 | 同上 |
ベストプラクティス
- 予算アラートの設定
-
コンソール > 請求 > 予算とアラート → 「月額 $10」など実運用に合わせた閾値を作成し、70 % と 90 % にメール通知。
-
Cloud Logging + Log-based Metrics
bash
# ログエクスポート例(Terraform)
resource "google_logging_metric" "gemini_tokens" {
name = "gemini_token_usage"
description = "月間トークン使用量"
filter = 'resource.type="vertex_ai_endpoint" AND jsonPayload."model_name":"gemini-1.5-pro"'
metric_descriptor {
metric_kind = "DELTA"
value_type = "INT64"
}
} -
このメトリックを Cloud Monitoring の アラートポリシー に紐付けて、閾値超過時に Slack/メールで通知できます。
-
最小権限のロール設計
- 開発者は
roles/aiplatform.endpointUser(エンドポイント呼び出しのみ)を付与し、モデル作成・デプロイは CI/CD 用サービスアカウントに限定する。
5. 学習リソース:Google Cloud Skills Boost
| コース名 | 所要時間 | 主な学習内容 | URL |
|---|---|---|---|
| Introduction to Generative AI(無料) | 約 45 分 | Gemini の基礎、テキスト・画像生成ハンズオン、ベストプラクティス | https://www.cloudskillsboost.google/catalog?search=generative%20ai |
| Advanced Generative AI with Gemini(有料) | 2‑3 時間 | カスタムファインチューニング、エンドポイント最適化、モニタリング・ガバナンス | 同上 |
コース受講のチェックリスト
- [ ] Vertex AI と Gemini の API がプロジェクトで有効化済み
- [ ] サービスアカウントに
Vertex AI Administratorロールが付与されている - [ ] Python SDK でテキスト・画像生成サンプルがローカルまたは Cloud Shell で実行できる
- [ ] 予算アラートと Cloud Logging が設定済み
6. 次のステップ:カスタムモデル作成と本番運用
| フェーズ | 主なタスク | 推奨ツール |
|---|---|---|
| データ準備 | ラベル付け、スキーマ定義、CSV/TFRecord 生成 | Vertex AI Data Labeling、BigQuery |
| ファインチューニング | gemini-1.5-pro のカスタム指示チューニング(Instruction‑Tuning) |
Vertex AI Custom Training(Python スクリプト) |
| エンドポイントデプロイ | 低遅延・スケーラブルな推論用エンドポイント作成 | Vertex AI Endpoint(自動スケーリング設定) |
| モニタリング & ガバナンス | リクエストレート、トークン消費、データドリフト検知 | Model Monitoring、Vertex AI Experiments |
| CI/CD パイプライン | ソースコード → コンテナビルド → デプロイ自動化 | Cloud Build、Artifact Registry、Cloud Deploy |
実務例:小売業者が商品レビューを自社データでファインチューニングし、月間 1 M トークン以内でリアルタイム要約サービスを提供。予算アラートとモニタリングによりコストは $12/月に抑制できました。
7. まとめ
- 生成 AI の位置付け – Vertex AI がインフラ全体、Gemini がマルチモーダル LLM として機能し、GCP 上の「テキスト+画像」API を一本化しています。
- セットアップ手順 – プロジェクト作成 → 課金紐付け → Vertex AI API と Vertex AI Gemini Service の有効化 → サービスアカウントで認証、という流れは 5 分程度で完了します。
- 実装サンプル – Python SDK(
vertexai.preview)と REST(cURL)の両方を示したので、ローカル開発から Cloud Functions / Cloud Run への移行がシームレスです。 - 料金・無料枠 – テキストは $0.0004/1 M トークン、画像は $0.0012/1 K 枚。月間 5 M トークン/1000 枚までの無料枠があり、予算アラートと Cloud Logging でコスト超過リスクを低減できます。
- 学習リソース – 無料の「Introduction to Generative AI」で基礎を固めた後、上級コースや公式チュートリアルでファインチューニング・本番運用へステップアップしてください。
これらの手順とベストプラクティスに従えば、Google Cloud 上で Gemini API を活用した最初の生成 AI アプリケーションをすぐに体験できるだけでなく、実務レベルのスケーラブルなサービスへと成長させられます。
本稿の情報は 2026 年 4 月時点の公式ドキュメント・料金ページに基づいています。Google Cloud のサービスや価格は随時更新されるため、実装前に必ず最新情報をご確認ください。