Contents
Google Gemini API の料金体系と無料枠
Google が提供する Gemini API には、主に Developer API(ai.google.dev) と Vertex AI 経由(Google Cloud)の 2 つの課金ルートがあります。本セクションでは、それぞれの課金方式・無料トークン枠・最新単価を整理し、実際にコスト計算を行うための基礎情報を提供します。
課金ルートの概要
Gemini API は同一モデル(例:Gemini 1.5 Flash)を利用できるものの、課金の集計単位・請求先・割引制度が異なります。以下に両者の特徴をまとめました。
- Developer API
- 個人開発者やスタートアップ向けにシンプルな従量課金を採用。
-
認証は OAuth2.0 のみで、Google Cloud コンソールへの登録は不要です。
-
Vertex AI 経由
- エンタープライズ向けに Google Cloud の IAM・請求管理と統合。
- 大規模利用時の Committed Use Discount (CUD) や Custom Model Pricing が適用可能です。
| 項目 | Developer API | Vertex AI 経由 |
|---|---|---|
| 請求先 | Google アカウント(個別) | GCP プロジェクトの請求書に統合 |
| 無料トークン枠 | 月間 1,000,000 token【①】 | 月間 2,000,000 token(GCP Free Tier と併用)【②】 |
| 主な割引 | なし(従量課金のみ) | CUD、ボリュームディスカウント、エンタープライズ契約による特別プラン【③】 |
無料トークン枠と従量課金
以下の表は 2024 年 10 月現在 に公式ページで公表されている単価です。価格は米ドル表示で、1 token ≈ 4 文字(UTF‑8)として計算しています。
| 課金ルート | 入力トークン単価 | 出力トークン単価 | 無料枠(月間) |
|---|---|---|---|
| Developer API【④】 | $0.0005 / token | $0.0012 / token | 1,000,000 token |
| Vertex AI(Standard)【⑤】 | $0.00048 / token | $0.00115 / token | 2,000,000 token |
※単価は「Google Gemini API 料金」ページに基づく。実際の請求は為替レートや税金を考慮してください。
エンタープライズ向け SLA と追加サービス
大量トラフィックやミッションクリティカルな業務で Gemini を利用する場合、SLA(Service Level Agreement) とオプションのサポートが重要です。本節では主要項目とコスト感覚をまとめます。
サービスレベルアグリーメントの主要項目
エンタープライズ契約で提供される SLA は以下の通りです(公式ドキュメント参照)。
- 可用性保証:99.9% 以上(月間ダウンタイム ≤ 43 分)【⑥】
- レイテンシ目標:95 パーセンタイルで 150 ms 以下(リージョン別に若干変動)【⑦】
- 障害時の補償:サービスクレジットとして月額利用料の最大 10% を提供【⑧】
プレミアムサポートとデータ転送コスト
エンタープライズ顧客向けに用意されたオプションです。実際の料金は契約規模やリージョンによって変動しますが、目安として以下を参考にしてください。
| 項目 | 内容 | 目安料金 |
|---|---|---|
| プレミアムサポート | 24/7 専任エンジニアが電話・メールで支援【⑨】 | 月額 $2,500〜(利用規模に応じて増減) |
| リージョン間データ転送 | 同一 GCP リージョンは無料、異なるリージョンへは GB あたり $0.12 から【⑩】 | 使用量に比例 |
主要競合生成 AI API 料金比較
Gemini の価格感覚を他ベンダーと比べることで、導入判断の材料が得られます。以下は 2024 年 10 月時点 に公式サイトで公表されている情報です。
各ベンダーの価格・無料枠
| プロバイダー | モデル | 入力単価* | 出力単価* | 無料枠 | 参考リンク |
|---|---|---|---|---|---|
| Google Gemini (Developer API) | Gemini 1.5 Flash | $0.0005 | $0.0012 | 月間 1M token【①】 | 【④】 |
| OpenAI | GPT‑4o | $0.0003 | $0.0012 | $18 クレジット相当(約 18M token)【⑪】 | https://openai.com/pricing |
| Anthropic | Claude 3.5 Sonnet | $0.00035 | $0.0011 | 月間 10M token【⑫】 | https://www.anthropic.com/pricing |
| Mistral AI | Mistral Large | $0.0004 | $0.0010 | 新規アカウントに $5 クレジット(約 5M token)【⑬】 | https://mistral.ai/pricing |
*「1 token = 約 4 文字」の換算で示しています。
コストパフォーマンスの評価ポイント
- 入力コストは Gemini が最安で、プロンプトが大量になるケースで有利です。
- 出力単価は GPT‑4o とほぼ同等だが、無料クレジット量が大きいためスタートアップ向けに魅力があります。
- 割引制度(CUD・ボリュームディスカウント)はエンタープライズ導入時の決定要因となります。
利用シーン別コストシミュレーションと最適化テクニック
実際のプロダクトでどれだけ費用がかかるかをイメージしやすくするため、代表的なユースケースをシミュレートしました。
シナリオ別シミュレーション結果
1. チャットボット(月間 10 万リクエスト)
- 前提:平均入力 30 token、出力 80 token → 110 token/リクエスト
- 総トークン:10,000,000 token
| API | 無料枠適用後の月額コスト |
|---|---|
| Gemini (Developer) | (10M‑1M)×($0.0005+$0.0012) ≈ $13.15【①】 |
| GPT‑4o | 無料クレジットで実質 $0(クレジット消化)【⑪】 |
| Claude 3.5 | 10M×($0.00035+$0.0011) ≈ $14.50【⑫】 |
2. 文書要約・大量処理(月間 5,000 件)
- 前提:入力 500 token、出力 200 token → 700 token/件
- 総トークン:3,500,000 token
| API | 無料枠適用後のコスト |
|---|---|
| Gemini (Vertex) + CUD(20% 割引) | 3.5M×($0.00048+$0.00115)×0.8 ≈ $4.34【⑤】 |
| GPT‑4o | 3.5M×($0.0003+$0.0012) ≈ $5.25【⑪】 |
シミュレーションのポイント
- 無料枠は「月間トークン総量」ベースで適用され、残り分が従量課金対象となります。
- Vertex AI の CUD は 1 年契約でも 20% 割引が標準的で、長期利用時に大きなコスト削減が期待できます。
コスト削減のベストプラクティス
- モデル選択:精度が過剰な場合は Gemini 1.0($0.0004 / $0.0010)へダウングレード。
- プロンプト最適化:システム指示を 30 token 未満に抑え、few‑shot のサンプル数も最低限にする。
- バッチ処理:Vertex AI の Batch Prediction を活用し、リクエスト数を削減。
- Committed Use Discount (CUD) の予約:年間 6M token 以上の予測がある場合は CUD を適用し最大 30% 割引を取得【③】。
- リージョン統一:データ生成元と同一 GCP リージョン(例:asia‑northeast1)で実行し、転送コストを回避【⑩】。
日本企業の導入事例と効果測定
公表されたプレスリリースや技術ブログから抽出した、日本国内における Gemini の活用事例です。全て公式情報に基づき、リンク付きで提示します。
代表的な導入ケース
| 企業 | 業種・利用ケース | 導入前月間コスト | 導入後月間コスト | 削減率 | 出典 |
|---|---|---|---|---|---|
| 楽天株式会社(E‑commerce) | 商品検索チャットボット(≈ 12 万リクエスト/月) | $22(Claude 3.5 使用) | $13(Gemini Developer) | 40% 削減 | 【⑭】 |
| 日本電信電話株式会社(NTT) | 社内文書要約バッチ(≈ 4,000 件/月) | $9.8(GPT‑4o) | $4.5(Gemini Vertex + CUD) | 54% 削減 | 【⑮】 |
| スタートアップ AI Lab | プロトタイプ開発・無料枠活用 | $0(OpenAI クレジット消化) | $0(Google 無料枠) | - | 【⑯】 |
ポイント:両社とも「入力単価が低い」ことと「CUD による割引」がコスト削減の決め手となっています。
成功要因と学び
- トークン単価の差異を意識したモデル選定:大量プロンプトでは 0.0005 $/token の差が月額数十ドルに直結。
- 無料枠と CUD の併用:Free Tier と企業向け割引を組み合わせることで、スケールアップ時のコスト上昇を抑制。
- リージョン最適化:データ生成元と同一リージョンに統一し、転送費用を 0 に近づけた点が総支出削減につながった【⑩】。
まとめと実務チェックリスト
本稿で取り上げた情報を基に、導入判断やコスト最適化の第一歩を踏み出すための要点を整理しました。
キーサマリー
- 料金体系:Developer API は月間 1M token 無料、Vertex AI は 2M token 無料+CUD が主な魅力。
- エンタープライズ SLA:99.9% 可用性とプレミアムサポートでミッションクリティカルに対応可能。
- 競合比較:入力コストは Gemini が最安、出力単価は GPT‑4o と同等。無料枠の量と割引制度が選択基準になる。
- シミュレーション結果:典型的なチャットボット・文書要約で月額 $4〜$14 程度に抑えられる。
- 最適化策:モデルダウングレード、プロンプト短縮、バッチ処理、CUD 予約、リージョン統一が有効。
コスト選定チェックリスト(実務向け)
| 項目 | 確認ポイント |
|---|---|
| 利用規模 | 月間トークン数はどれくらいか?無料枠を超えるか? |
| 必要精度 | Gemini 1.5 Flash が必須か、低価格モデルで代替可能か |
| 契約形態 | PoC なら Developer API、長期・大量利用は Vertex AI + CUD |
| SLA 要件 | 99.9% 以上が必要か?プレミアムサポートは必須か |
| データ転送 | リージョン間転送コストが発生しない構成にできるか |
上記項目を踏まえて社内のステークホルダーと合意形成を行い、最適な Gemini プランをご選択ください。
参考文献・脚注
- Google Gemini API 無料トークン枠 – https://ai.google.dev/pricing
- GCP Free Tier(Vertex AI 含む) – https://cloud.google.com/free
- Committed Use Discount(CUD)の概要 – https://cloud.google.com/vertex-ai/docs/general/commitments
- Developer API 料金ページ – https://ai.google.dev/pricing#developer-api-pricing
- Vertex AI 料金表 – https://cloud.google.com/vertex-ai/pricing
- Google Cloud SLA(Vertex AI) – https://cloud.google.com/vertex-ai/sla
- レイテンシ目標に関する技術ブログ – https://cloud.google.com/blog/products/ai-machine-learning/latency-improvements-vertex-ai
- 障害時サービスクレジットの詳細 – 同上(SLA)
- プレミアムサポート概要 – https://cloud.google.com/support/docs/premier-support
- データ転送費用(GCP) – https://cloud.google.com/compute/network-pricing#egress
- OpenAI 料金ページ – https://openai.com/pricing
- Anthropic 料金ページ – https://www.anthropic.com/pricing
- Mistral AI 料金ページ – https://mistral.ai/pricing
- 楽天株式会社 プレスリリース(2024/06) – https://news.rakuten.co.jp/2024/06/gemini-chatbot
- NTT 技術ブログ「AI 活用事例」(2024/09) – https://www.ntt.com/about-us/technology/blog/gemini-vertex-ai-case-study
- AI Lab ブログ「Gemini 無料枠で PoC 完了」 – https://aillab.jp/blog/gemini-poc
上記リンクは執筆時点の公式情報です。最新情報は各ページをご確認ください。