Vertex AI 完全ガイド：コンポーネント・Gemini2.5Pro・実装手順

2026年4月25日

Contents

1 1. Vertex AI の全体像と主要コンポーネント
2 2. データパイプラインの実装例
3 3. AutoML とカスタムトレーニングの選択基準
4 4. Gemini 2.5 Pro と他の事前学習モデル
- 4.1 4.1 現在公表されている情報
- 4.2 4.2 他の代表的モデル
5 5. GCP コンソールで始める Vertex AI プロジェクト作成手順
6 6. モデルのデプロイと運用ベストプラクティス
7 7. セキュリティとコンプライアンス
8 8. 実務で使えるサンプルコード・リポジトリ
9 9. まとめ
- 9.1 参考リンク（2026‑04‑25 更新）

スポンサードリンク

1. Vertex AI の全体像と主要コンポーネント

Vertex AI は データ取得 → 前処理 → 学習 → デプロイ → モニタリング を一つのプラットフォームで実現する統合サービスです。以下に主要コンポーネントをまとめました。

コンポーネント	主な役割	典型的な利用フェーズ
データパイプライン（Vertex AI Pipelines）	データ取得・前処理・変換をコード化して自動実行	生データ取り込み → Feature Store 登録
AutoML / カスタムトレーニング	ノーコードでモデル作成、またはフルカスタマイズ可能な学習環境	ラベル付きテーブルから分類モデル、画像・テキストの独自ネットワーク
モデルレジストリ（Model Registry）	学習済みモデルをバージョン管理し共有	開発チーム間でモデル承認・追跡
エンドポイント（Endpoint）	デプロイしたモデルへの推論 API を提供	本番環境のリアルタイム予測、A/B テスト

ポイント：これらはすべて GCP の IAM と VPC Service Controls によって統一的に保護されるため、個別に権限設定を行う必要がありません。

2. データパイプラインの実装例

Vertex AI Pipelines は Kubeflow をベースとしたワークフローエンジンです。Python SDK（kfp) で DAG を記述し、GCS・BigQuery と組み合わせて ETL を自動化できます。

import kfp
from kfp import dsl

@dsl.pipeline(name=&quot;sample-etl-pipeline&quot;)
def etl_pipeline():
    # 1. GCS から CSV を取得
    download = dsl.ContainerOp(
        name=&quot;download&quot;,
        image=&quot;gcr.io/cloud-builders/gsutil&quot;,
        command=[&quot;gsutil&quot;, &quot;cp&quot;, &quot;gs://my-bucket/raw/data.csv&quot;, &quot;/tmp&quot;]
    )
    # 2. 前処理 (pandas)
    preprocess = dsl.ContainerOp(
        name=&quot;preprocess&quot;,
        image=&quot;python:3.9-slim&quot;,
        command=[&quot;python&quot;, &quot;- &lt;&lt;'PY'&quot;],
        arguments=[
            &quot;&quot;&quot;
import pandas as pd
df = pd.read_csv('/tmp/data.csv')
df['date'] = pd.to_datetime(df['date'])
df.to_parquet('/tmp/clean.parquet')
&quot;&quot;&quot;
        ]
    ).after(download)
    # 3. Feature Store に登録（例として GCS に保存）
    upload = dsl.ContainerOp(
        name=&quot;upload&quot;,
        image=&quot;gcr.io/google.com/cloudsdktool/cloud-sdk:latest&quot;,
        command=[&quot;gsutil&quot;, &quot;cp&quot;, &quot;/tmp/clean.parquet&quot;, &quot;gs://my-bucket/processed/&quot;]
    ).after(preprocess)

if __name__ == &quot;__main__&quot;:
    kfp.compiler.Compiler().compile(etl_pipeline, 'etl_pipeline.yaml')

import kfp

from kfp import dsl

@dsl.pipeline(name="sample-etl-pipeline")

def etl_pipeline():

# 1. GCS から CSV を取得

download = dsl.ContainerOp(

name="download",

image="gcr.io/cloud-builders/gsutil",

command=["gsutil", "cp", "gs://my-bucket/raw/data.csv", "/tmp"]

)

# 2. 前処理 (pandas)

preprocess = dsl.ContainerOp(

name="preprocess",

image="python:3.9-slim",

command=["python", "- <<'PY'"],

arguments=[

"""

import pandas as pd

df = pd.read_csv('/tmp/data.csv')

df['date'] = pd.to_datetime(df['date'])

df.to_parquet('/tmp/clean.parquet')

"""

]

).after(download)

# 3. Feature Store に登録（例として GCS に保存）

upload = dsl.ContainerOp(

name="upload",

image="gcr.io/google.com/cloudsdktool/cloud-sdk:latest",

command=["gsutil", "cp", "/tmp/clean.parquet", "gs://my-bucket/processed/"]

).after(preprocess)

if __name__ == "__main__":

kfp.compiler.Compiler().compile(etl_pipeline, 'etl_pipeline.yaml')

ポイント
- after() で依存関係を明示し、失敗時は自動リトライが可能。
- 実運用では データ検証ステップ と スキーマ管理 を別コンテナに分割すると保守性が向上します。

3. AutoML とカスタムトレーニングの選択基準

基準	AutoML（ノーコード）	カスタムトレーニング
開発工数	GUI/CLI のみで数時間で完了	Docker コンテナ作成・コード実装が必要
柔軟性	Google が提供するアルゴリズムに限定	任意のフレームワーク（TensorFlow、PyTorch 等）を使用可能
スケーラビリティ	自動で最適化されたリソース割当て	ユーザーが `machine-type`・GPU/TPU の数を明示
コスト構造	データサイズとモデル数に比例（予測リクエストは別途課金）	訓練時間 × 使用 GPU/TPU に比例
推奨シナリオ	PoC、ビジネスユーザー向けの小～中規模案件	大規模データ、独自ロジック、研究開発

参考: Google Cloud – Vertex AI の使い方（公式）

4. Gemini 2.5 Pro と他の事前学習モデル

4.1 現在公表されている情報

Google が 2025 年に発表した Gemini 系列 の最新モデルは、公式ドキュメント上で以下が明示されています（2026‑04‑25 更新）:

項目	内容
リリース時期	2025 年 10 月
対応モーダル	テキスト・画像・音声のマルチモーダル
トークン上限	最大 1,000,000 トークン（公式ページ参照）
価格モデル	「入力 1M トークンあたり $0.03、出力 1M トークンあたり $0.06」※2026 年4月時点の料金表

パラメータ数や具体的なアーキテクチャ（例：540B パラメータ）は Google が公表していません。未公開情報を根拠なく記載すると誤解を招くため、ここでは公式に明示された範囲のみ掲載しています。

4.2 他の代表的モデル

モデル	主な特徴	想定ユースケース
Gemini 2.5 Pro	マルチモーダル、1M トークン上限、リアルタイム推論最適化	カスタマーサポートのマルチチャネル AI、ドキュメント要約
BERT‑base	110M パラメータ、テキスト専用、トークン上限 512	文書分類、検索クエリ拡張
T5‑large	770M パラメータ（seq2seq）、テキスト変換に強い	翻訳・要約・テキスト生成

出典:
- Google Cloud – Gemini API Overview https://cloud.google.com/vertex-ai/generative-ai/docs/start/introduction
- Google Cloud Pricing for Generative AI https://cloud.google.com/vertex-ai/generative-ai/pricing

5. GCP コンソールで始める Vertex AI プロジェクト作成手順

Google Cloud コンソールにログインし、無料トライアルを開始
プロジェクトの新規作成 → プロジェクト名を入力して「作成」
リージョン選択（例: asia-northeast1 (東京) またはコスト重視なら us-central1）
IAM ロール付与（最小権限）

bash # 例：Vertex AI 管理者ロールと GCS 読み取り権限を付与 gcloud projects add-iam-policy-binding $PROJECT_ID \ --member=user:your.email@example.com \ --role=roles/aiplatform.admin

gcloud projects add-iam-policy-binding $PROJECT_ID \ --member=user:your.email@example.com \ --role=roles/storage.objectViewer

VPC Service Controls の設定
コンソール → 「Security」→「VPC Service Controls」
新規サービス境界を作成し、対象に Vertex AI と利用する GCS バケット を追加

注意：IAM ポリシーや VPC SC の設定ミスは予算超過やデータ漏洩のリスクにつながります。変更後は必ず「ポリシーシミュレーター」で権限を検証してください。

6. モデルのデプロイと運用ベストプラクティス

6.1 エンドポイント作成・スケーリング設定

# ① モデル登録（例：Gemini 2.5 Pro のコンテナイメージ）
gcloud ai models upload \
    --region=asia-northeast1 \
    --display-name=gemini-2_5-pro \
    --container-image-uri=us-docker.pkg.dev/vertex-ai/prediction/gemini:2.5-pro

# ② エンドポイント作成
gcloud ai endpoints create \
    --region=asia-northeast1 \
    --display-name=my-gemini-endpoint

# ③ デプロイ（自動スケーリング設定）
gcloud ai endpoints deploy-model my-gemini-endpoint \
    --model=$(gcloud ai models list --filter=&quot;displayName:gemini-2_5-pro&quot; --format=&quot;value(name)&quot;) \
    --machine-type=n1-standard-4 \
    --min-replica-count=1 \
    --max-replica-count=10 \
    --traffic-split=0=100

# ① モデル登録（例：Gemini 2.5 Pro のコンテナイメージ）

gcloud ai models upload \

--region=asia-northeast1 \

--display-name=gemini-2_5-pro \

--container-image-uri=us-docker.pkg.dev/vertex-ai/prediction/gemini:2.5-pro

# ② エンドポイント作成

gcloud ai endpoints create \

--region=asia-northeast1 \

--display-name=my-gemini-endpoint

# ③ デプロイ（自動スケーリング設定）

gcloud ai endpoints deploy-model my-gemini-endpoint \

--model=$(gcloud ai models list --filter="displayName:gemini-2_5-pro" --format="value(name)") \

--machine-type=n1-standard-4 \

--min-replica-count=1 \

--max-replica-count=10 \

--traffic-split=0=100

自動スケーリングは --min-replica-count と --max-replica-count で制御。
レイテンシ要件が厳しい場合は GPU インスタンス（例: n1-standard-4-gpu）を指定すると 100 ms 未満 の応答が期待できます。

6.2 A/B テストとロールバック

手順	コマンド例
トラフィック分割（新旧モデル）	`gcloud ai endpoints deploy-model ... --traffic-split=0=70,1=30`
モニタリング有効化	Vertex AI コンソール → 「Model Monitoring」設定
ロールバック（問題発生時）	`gcloud ai endpoints update-traffic-split my-gemini-endpoint --traffic-split=0=100`

6.3 コスト見積もりと最適化

項目	2026‑04‑時点の参考価格*
GPU（A100）トレーニング	$2.40 / 時間
TPU v4 トレーニング	$3.10 / 時間
推論リクエスト（CPU）	$0.004 / 1,000 件
推論リクエスト（GPU）	$0.008 / 1,000 件
GCS 標準ストレージ	$0.026 / GB·月

*価格はリージョン・為替変動により変わります。最新情報は Google Cloud Pricing Calculator を参照してください。

コスト削減のヒント

プリエンプティブ GPU の活用 → 最大 70 % 割引
バッチ予測 と オンライン推論 のハイブリッド運用（低頻度はバッチ）
モデルモニタリング による不要なトラフィックの早期検知

7. セキュリティとコンプライアンス

項目	推奨設定
保存時暗号化	GCS・BigQuery はデフォルトで AES‑256 暗号化
顧客管理キー（CMEK）	機密データは Cloud KMS の鍵を指定して暗号化
IAM 最小権限	`roles/aiplatform.user` と `roles/storage.objectViewer` のみ付与
VPC Service Controls	前述の手順でサービス境界を作成し、外部へのデータ流出防止
監査ログ	Cloud Audit Logs を有効化し、`aiplatform.googleapis.com` の API 呼び出しを記録

ベストプラクティス：本番環境では必ず CMEK + VPC SC の二重防御を採用し、監査ログは Cloud Logging に集約して SIEM ツールと連携させます。

8. 実務で使えるサンプルコード・リポジトリ

リポジトリ	内容
GoogleCloudPlatform/vertex-ai-samples	Pipelines、Endpoint デプロイ、Gemini 呼び出しの公式サンプル（`pipelines/tabular_classification`, `endpoints/deploy_gemini`）
GoogleCloudPlatform/vertex-pipelines-templates	業界別テンプレート（金融、ヘルスケア等）
自社向け GitHub テンプレート例	プロジェクト固有のパラメータだけ置き換える形で数時間で実装可能

git clone https://github.com/GoogleCloudPlatform/vertex-ai-samples.git
cd vertex-ai-samples/pipelines/tabular_classification
# 必要に応じて環境変数を設定し、pipeline をデプロイ

git clone https://github.com/GoogleCloudPlatform/vertex-ai-samples.git

cd vertex-ai-samples/pipelines/tabular_classification

# 必要に応じて環境変数を設定し、pipeline をデプロイ

9. まとめ

Vertex AI はエンドツーエンドの ML ライフサイクル管理基盤であり、データ取得からモデル監視まで一元化できます。
Gemini 2.5 Proは公式が公表している「マルチモーダル対応・1M トークン上限」のみを根拠に紹介し、未公開情報は記載しません。
プロジェクト作成時は リージョン選定、IAM 最小権限、VPC Service Controls の 3 点設定だけで安全な基盤が構築できます。
AutoML とカスタムトレーニングを用途別に使い分け、Pipelines で ETL をコード化すれば開発速度とコストの最適バランスが取れます。
エンドポイントは 自動スケーリング・A/B テスト機能が標準装備されており、Cost Estimation Tool と組み合わせることで予算管理が容易です。
データ暗号化、CMEK、監査ログを活用した セキュリティベストプラクティス を守れば、企業レベルでも安心して運用できます。

本ガイドに沿って実装すれば、「Google Cloud Vertex AI 入門」から本格的なプロダクション環境への移行まで、スムーズかつ安全に進められます。ぜひ公式ドキュメントと併せて活用してください。

参考リンク（2026‑04‑25 更新）

Vertex AI 公式サイト: https://cloud.google.com/vertex-ai
Gemini API Overview: https://cloud.google.com/vertex-ai/generative-ai/docs/start/introduction
GCP 料金計算ツール: https://cloud.google.com/products/calculator
Cloud KMS & CMEK の設定手順: https://cloud.google.com/kms/docs/
VPC Service Controls ガイド: https://cloud.google.com/vpc-service-controls/docs