GCP

2024年版 Google Cloudで Vertex AI と Gemini API をゼロから構築する方法

ⓘ本ページはプロモーションが含まれています

お得なお知らせ

スポンサードリンク
1ヶ月で資格+現場入り

インフラエンジニアへの最短ルート

未経験でもAWS・Linux・ネットワーク資格を最短で取り、現場入りまでサポート。SREやクラウドエンジニアの入口。

CODE×CODEスピード転職|無料面談▶ SRE/クラウドのフリーランス案件▶

▶ AWS/GCP/Kubernetesの独学には Kindle Unlimited の技術書読み放題がコスパ最強。


Contents

スポンサードリンク

1️⃣ 前提条件と準備

必要なもの 内容
Google アカウント GCP の無料トライアルに登録できる個人または企業アカウント
ブラウザ Chrome / Edge 推奨(Google Cloud Console の UI が最適化)
ローカル環境 gcloud CLI、python >=3.9node >=18terraform >=1.5 がインストール済み
権限 プロジェクト作成者(Owner)または Billing Administrator の権限が必要

※ UI は頻繁に更新されます。最新のナビゲーションは公式コンソールヘルプ[^1]をご確認ください。


2️⃣ GCP プロジェクトの作成

手順概要

ステップ 操作
https://console.cloud.google.com/ にアクセスし、Google アカウントでサインイン
左上メニュー(ハンバーガーアイコン) → 「プロジェクト」 を選択
「新しいプロジェクト」 ボタンをクリック
プロジェクト名、プロジェクト ID、リージョン(例: us-central1)を入力し 作成
作成直後に 課金アカウント を紐付ける画面が表示されます。自動的に $300 のトライアルクレジットが付与されます[^2]

ポイント
- UI が 2024/09 に刷新されたことを踏まえて、左サイドバーでは「リソース管理」→「プロジェクト」の順に辿りますが、将来的にメニュー項目名が変わる可能性があります。公式ドキュメントで最新構成を随時確認してください。


3️⃣ Vertex AI と Gemini API の有効化

API 用途
aiplatform.googleapis.com Vertex AI の全機能(データセット、トレーニング、エンドポイント)
gemini.googleapis.com (※ Gemini は aiplatform.googleapis.com に統合) Generative AI モデル呼び出し

参考:Google が公開している「Vertex AI の無料枠とトライアル」ページに、Gemini 1.5‑pro の月間 30 M トークンまでが無償で利用可能と記載されています[^3]。


4️⃣ 課金設定・無料枠の確認

項目 内容 出典
トライアルクレジット 新規アカウントに $300(90 日間)を自動付与 [^2]
Vertex AI 無料枠 トレーニング・デプロイ 1000 時間まで無料 Google Cloud Billing Docs
Gemini API 無料トークン 月間 30 M トークン(約 300,000 リクエスト)まで無償 [^3]

予算とアラートの設定例


5️⃣ IAM ロールとサービスアカウントの最小権限構成

5‑1. サービスアカウント作成

5‑2. 必要ロールの付与(最小権限)

ロール 権限概要
roles/aiplatform.user Vertex AI のモデル作成・デプロイ・エンドポイント操作
roles/secretmanager.secretAccessor Secret Manager からシークレット取得
roles/storage.objectViewer (オプション) データセット格納バケットの読み取り

ベストプラクティス:Google が推奨する「最小権限の原則」[^4] に従い、不要なロールは付与しない。


6️⃣ データセット作成・Cloud Storage へのアップロード

6‑1. ファイルフォーマット例

CSV(ヘッダー必須)

JSONL(1 行 1 オブジェクト)

6‑2. バケット作成とデータアップロード

ポイント:Vertex AI のデータセットインポートは、対象バケットの storage.objectViewer 権限が必要です。サービスアカウントに付与済みか確認してください。


7️⃣ Gemini API キーを Secret Manager に保存

7‑1. API キー取得手順(コンソール)

  1. コンソール左メニュー → 「API とサービス」「認証情報」
  2. 「認証情報を作成」→ 「API キー」 を選択し、表示されたキーをコピー

注意:生成したキーは一度だけ表示されます。必ず安全な場所に保存してください。

7‑2. Secret Manager にシークレットとして格納

7‑3. Python で取得するユーティリティ


8️⃣ モデルエンドポイントの作成とデプロイ

8‑1. Python クライアントで Gemini にプロンプト送信

8‑2. エンドポイント作成(CLI)

8‑3. Node.js バージョン(参考実装)

Tip<ENDPOINT_ID>gcloud ai endpoints list コマンドで取得できます。


9️⃣ モニタリング・ロギング・コスト管理

9‑1. ログの確認

  • Logging ビューア:コンソール → 「ログビューア」 → フィルタ resource.type="aiplatform_endpoint"
  • 主なフィールド: prediction.input, prediction.output, response.status

9‑2. メトリクスとアラート

メトリクス 推奨閾値例
aiplatform.googleapis.com/endpoint/prediction_latency 平均 > 2 秒 → Slack 通知
aiplatform.googleapis.com/endpoint/prediction_error_count 1 時間あたり > 5 件 → メール警告

アラート作成(CLI)

9‑3. コスト監視

  • 予算アラートは上記 §4 の通り設定し、$20 を超えると Slack / Email に通知
  • BigQuery Export(オプション)で課金レポートを分析し、トークン使用量と実際の請求額を突き合わせる

🔟 CI/CD(Cloud Build + Terraform)

10‑1. Terraform でインフラ定義(抜粋)

10‑2. Cloud Build のパイプライン

cloudbuild.yaml

deploy_endpoint.py(簡易例)

メリット:コードの変更だけでインフラとデプロイが自動的に再構成され、手作業ミスを防げます。


1️⃣1️⃣ よくある課題と対処法

症状 原因例 解決策
「予期せぬ課金が発生」 Auto‑Scaling の max-replica-count が過大、もしくは無料トークン上限を超えている max-replica-count を 2–3 に抑えるか、budget alerts で即時停止(billing account disable
「モデルがデプロイできない」 コンテナイメージのバージョン不一致(最新は gemini:latest が非推奨) Google の公式コンテナリストから現在サポートされているタグを確認[^5]
「Secret Manager からキーが取得できない」 サービスアカウントに secretAccessor ロール未付与、またはシークレットのレプリケーション設定が不適切 IAM バインディングを再度確認し、automatic レプリケーションで全リージョンからアクセス可能に
「データセット取り込み時にバリデーションエラー」 CSV のヘッダー名が prompt,completion 以外、または空行が混在 ファイルをローカルで csvlint / jq にて検証し、必ずヘッダーと UTF‑8 エンコーディングに統一

1️⃣2️⃣ まとめ

  • プロジェクト作成サービス有効化最小権限のサービスアカウント の順でセットアップすれば、数分で開発環境が整います。
  • 無料枠 + $300 トライアルクレジット をフル活用すれば、実験段階のコストはほぼゼロです(ただしトークン上限と自動スケーリングには注意)。
  • Secret Manager と IAM の最小権限 によって API キー漏洩リスクを低減し、予算アラート + Cloud Monitoring が運用の安全弁となります。
  • CI/CD(Terraform + Cloud Build) を導入すれば、インフラ変更・モデル再デプロイがコードレビューと同様に管理でき、チーム開発に必須です。

これらを踏まえて、まずは無料クレジットで「my‑genai‑demo」プロジェクトを作成し、サンプルコード (generate_text) を実行してみてください。その後、独自データセットとカスタムモデルに置き換えるだけで、本格的な生成 AI アプリが完成します。


参考文献

[^1]: Google Cloud Console ヘルプ – 「ナビゲーション メニューの使用方法」 https://cloud.google.com/docs/overview/navigation
[^2]: 無料トライアルと $300 クレジットの詳細 – Google Cloud Free Tier https://cloud.google.com/free
[^3]: Gemini API の無料トークン情報 – 「Generative AI on Vertex AI」 https://cloud.google.com/vertex-ai/generative-ai/docs/model-reference/gemini#pricing
[^4]: 最小権限の原則(Least Privilege) – Google Cloud Security Best Practices https://cloud.google.com/security/best-practices/least-privilege
[^5]: Vertex AI 用公式コンテナイメージ一覧 – https://cloud.google.com/vertex-ai/docs/predictions/pre-built-containers

スポンサードリンク

お得なお知らせ

スポンサードリンク
1ヶ月で資格+現場入り

インフラエンジニアへの最短ルート

未経験でもAWS・Linux・ネットワーク資格を最短で取り、現場入りまでサポート。SREやクラウドエンジニアの入口。

CODE×CODEスピード転職|無料面談▶ SRE/クラウドのフリーランス案件▶

▶ AWS/GCP/Kubernetesの独学には Kindle Unlimited の技術書読み放題がコスパ最強。


-GCP