Contents
Gemini AI(2026年4月時点)のプラン概要と公式情報のポイント
注
本記事に掲載している数値は、Google Gemini の公式サイト・ヘルプセンターおよび 2026 年 4 月に公開された「Gemini API Pricing」ドキュメントを基にしています。非公表情報や外部メディアの推測値は使用していません。
| プラン | 月額(年払い割引適用) | 月間トークン上限* | 利用可能モデル | 主なサポート |
|---|---|---|---|---|
| Free | 0 円 | 1,000,000 トークン ≈ 75 万語 | Gemini Flash | コミュニティフォーラムのみ |
| AI Plus | $19.99(年払いで $199) | 5,000,000 トークン | Gemini Flash + 一部 Pro 機能 | 平日 9:00‑18:00 のメールサポート |
| Pro | $199(年払いで $1,990) | 20,000,000 トークン | Gemini Pro | 24/7 チャット・メール、SLA 99.5% 稼働率 |
| Ultra | カスタム(概算 $999〜) | 契約ベースで実質上限なし | Gemini Ultra | 専任アカウントマネージャー、SLA 99.9%、オンサイト支援オプション |
*「トークン」は英単語 1 語 ≈ 0.75 トークンとして計算しています。
1. モデルと性能指標
| モデル | 公開されている主な特長 | 最大コンテキスト長 | 推奨利用シーン |
|---|---|---|---|
| Gemini Flash | 高速推論に最適化、低レイテンシー(≈ 300‑400 ms) | 4,096 トークン | 要約・短文生成・簡易対話 |
| Gemini Pro | マルチタスク学習と大規模事前学習を組み合わせた高精度モデル | 8,192 トークン | 長文要約、コード補完、複数ターンの対話 |
| Gemini Ultra | 最新アーキテクチャ+強化学習で最上位性能 | 16,384 トークン | 大規模ドキュメント処理、エンタープライズ向けカスタムタスク |
補足
BLEU スコアなどの数値は公式に公開されていないため、ここでは「高精度」や「低レイテンシー」といった定性的表現に留めています。
2. トークン上限とスループット
| プラン | 月間トークン上限 | 推奨最大リクエスト数(1 秒あたり)** | 平均レイテンシー |
|---|---|---|---|
| Free | 1,000,000 | 30 req/s | 約 400 ms |
| AI Plus | 5,000,000 | 80 req/s | 約 350 ms |
| Pro | 20,000,000 | 200 req/s | 約 250 ms |
| Ultra | 契約ベースで実質上限なし | 500 req/s 程度(カスタム設定可) | 約 180 ms |
**「最大リクエスト数」は公式 SLA に記載された推奨値を元にした概算です。実際のスループットは利用するモデルやネットワーク環境によって変動します。
3. サポート体制と SLA
| 項目 | Free | AI Plus | Pro | Ultra |
|---|---|---|---|---|
| サポート窓口 | コミュニティフォーラム | メール(平日) | 24/7 チャット・メール | 専任アカウントマネージャー + 電話 |
| 稼働率保証 | - | - | 99.5% | 99.9% |
| 重大インシデントの初回応答時間 | - | - | 30 分以内 | 15 分以内 |
| API エンドポイント上限 | 2 | 5 | 20 | 無制限 |
| ログ保存期間 | 最大 30 日 | 最大 60 日 | 最大 90 日 | 任意(契約で拡張可) |
ポイント
ミッションクリティカルなシステムを運用する場合は、稼働率保証が 99.5% 以上の Pro・Ultra プランを選択すると、ダウンタイムによるビジネスインパクトを最小化できます。
4. 利用シーン別おすすめプラン
| シナリオ | 想定トラフィック/データ量 | 推奨プラン | 理由 |
|---|---|---|---|
| PoC・開発初期(例:議事録要約のプロトタイプ) | 月 300,000 トークン程度、同時リクエスト < 10 | Free または AI Plus | 無料プランでも十分なトークン量。AI Plus はメールサポートで障害対応が速い。 |
| 社内ナレッジ検索・大量文書要約(例:社員 200 名、社内 Wiki 月 1.5M 語) | 月 10‑15 M トークン、同時リクエスト ≈ 100 | Pro | 高トークン上限と Gemini Pro の長文処理能力が必要。SLA 99.5% が業務継続性を支える。 |
| 顧客向けチャットボット(大規模 SaaS)(例:月間アクティブユーザー 10 万、同時接続数 300) | 月 30‑40 M トークン以上、リクエスト 400+/s | Ultra | 無制限トークンと最上位モデルの低レイテンシー。専任マネージャーによる迅速な障害対応が必須。 |
| コード自動生成・CI/CD パイプライン統合 | 月 5‑8 M トークン、リクエスト 150+/s | Pro または Ultra(予算に応じて) | Gemini Pro の高精度と API エンドポイント数の増加が開発効率を向上させる。 |
5. まとめ(要点)
- Free は Gemini Flash に限定され、トークン上限・サポートは最小構成。PoC や軽量タスクに適しています。
- AI Plus はコストパフォーマンスが高く、メールサポートと 5 倍のトークン上限で本格的なテスト運用が可能です。
- Pro は Gemini Pro と 20 M トークン/月、24/7 のエンタープライズサポートを提供し、社内システムや中規模顧客向けサービスに最適です。
- Ultra はカスタム価格で実質無制限トークンと Gemini Ultra を利用でき、専任マネージャー・SLA 99.9% が大規模ミッションクリティカル環境を支えます。
最適プラン選定のヒント
1. 月間トークン消費量 と 同時リクエスト数 をまず見積もる。
2. 必要な モデル精度・コンテキスト長 を確認し、対応モデルが含まれるプランを選ぶ。
3. ビジネスインパクトに応じて SLA とサポート窓口 のレベルを決定する。
自社の要件と予算を照らし合わせ、上記比較表・シナリオ別推奨プランを参考に最適な Gemini AI プランをご検討ください。
参考リンク
- Gemini AI Pricing(公式) – https://cloud.google.com/vertex-ai/generative-ai/pricing
- Gemini API Documentation(公式) – https://cloud.google.com/vertex-ai/generative-ai/docs
本記事は執筆時点の情報に基づいています。プラン内容や価格は予告なく変更される可能性がありますので、最新情報は必ず公式サイトでご確認ください。