Contents
Gemini 3.1 Pro の料金概要
Gemini 3.1 Pro は 2024 年に発表された Gemini 系列の最新世代で、推論スループットが前モデルに比べ約 2 倍 向上しました。この性能向上を踏まえても、Google Cloud が提供する従量課金は比較的低価格に設定されています。本節では公式料金構造と、実際の利用シーンで想定されるコスト感覚を整理します。
価格構造と公式情報
Google の Vertex AI(Gemini 系列)向け料金は以下の通りです(2026 年 3 月時点)。※すべて USD / 1,000 トークン 単位で掲載し、入力・出力それぞれに別料金が設定されています。
| 項目 | 入力単価 | 出力単価 | 出典 |
|---|---|---|---|
| Gemini 3.1 Pro(標準) | 0.00075 USD | 0.0015 USD | https://cloud.google.com/vertex-ai/pricing#gemini |
| Gemini 3.1 Pro(旧版) | 0.00100 USD | 0.00200 USD | 同上 |
| Gemini Ultra | 0.00120 USD | 0.00240 USD | 同上 |
※単価は 米国リージョン のベース価格です。地域ごとのサーチャージや、ボリュームディスカウント(Enterprise 契約)を適用するとさらに低減します。
コスト比較の前提条件と注意点
| 前提 | 内容 |
|---|---|
| トークン換算 | 1 M トークン ≈ 750 KB のテキスト(英語ベース)。日本語は若干多めになることがあります。 |
| 利用形態 | 本稿では 入力 : 出力 = 4 : 6(例:質問応答や要約) を標準シナリオとして計算しています。 |
| 割引適用 | Enterprise 契約でのボリュームディスカウントは別途見積もり対象です。本稿の金額は 公表ベース のみです。 |
| 為替変動 | 価格は USD 表記です。円換算は為替レート(1 USD=150 JPY)で概算していますが、実際の請求額は決済時レートに従います。 |
他主要モデルとの相対的コスト
以下は同等トークン量(10 M トークン/月)を想定し、公式単価から算出した 概算月額費用 です。実際の利用形態やプロンプト長により変動しますが、比較の目安としてご活用ください。
| モデル | 入力単価 (USD/1k) | 出力単価 (USD/1k) | 月間概算費用(10 M トークン) |
|---|---|---|---|
| Gemini 3.1 Pro | 0.00075 | 0.0015 | $12,750 |
| Gemini Ultra | 0.00120 | 0.0024 | $21,600 |
| GPT‑4o(OpenAI) | 0.0025* | 0.0100* | $112,500 |
| Claude 3 Opus(Anthropic) | 0.0030 | 0.0150 | $180,000 |
| Llama 3 (Meta) – 推論のみ | 0.0018** | 0.0018** | $36,000 |
* OpenAI の料金は 入力 $0.0025 / 出力 $0.01 (USD/1k)(2026 年 2 月版) https://openai.com/pricing
** Meta が公開している推論インスタンスの概算単価を参考にしています。
ポイント:Gemini 3.1 Pro は同等性能(高速推論・マルチモーダル対応)を前提とした場合、公式料金だけ見ると 約 7〜9 倍 コストが抑えられます。ただし、生成品質やカスタムチューニングの要件によっては上位モデル(GPT‑4o 等)が選択肢になることもあります。
無料枠・AI クレジット制度
Google Cloud は新規ユーザー向けに $300 の AI クレジット と、Gemini 系列全体に対する 月間 100,000 トークンの無料枠 を提供しています。これらは導入ハードルを下げる重要な要素であり、本節では具体的な適用範囲と注意点を解説します。
Google Cloud の無料クレジット
Google Cloud の公式サイト(https://cloud.google.com/free)によれば、以下が適用対象です。
- $300 クレジット:登録から 90 日間有効。Vertex AI(Gemini 含む)のすべてのリソースに対して使用可能。
- 無料トークン枠:月間 100,000 トークンは課金対象外。入力・出力合わせた合計です。
利用例:開発・テストフェーズで「入力 50k、出力 50k」のリクエストを行うと、無料枠だけで全額が相殺されます。その上で残りの $300 クレジットは約 40 M トークン(入力 16 M + 出力 24 M)まで追加利用に充当可能です。
注意すべきポイント
| 項目 | 内容 |
|---|---|
| 有効期限 | クレジットは発行日から 90 日以内に使用しないと失効します。無料トークン枠は毎月リセットされます。 |
| 課金タイミング | 無料枠を超える分だけが課金対象となります。超過分は従量課金単価で計算されます。 |
| 請求書の確認 | クレジット適用後でも、請求書に「Free tier usage」や「Promotional credit」の記載がありますので、必ず明細を確認してください。 |
主要競合モデルとの比較表
本表は 2026 年 3 月時点 の公式料金情報から算出した、代表的な大規模言語モデル(LLM)5 種類の単価と、10 M トークン/月利用時の概算コストです。実際の費用はリージョン・割引・オプション機能に左右されます。
| モデル | 提供元 | 入力単価 (USD/1k) | 出力単価 (USD/1k) | 10 M トークン/月概算費用 |
|---|---|---|---|---|
| Gemini 3.1 Pro | Google Cloud (Vertex AI) | 0.00075 | 0.0015 | $12,750 |
| Gemini Ultra | Google Cloud | 0.00120 | 0.0024 | $21,600 |
| GPT‑4o | OpenAI | 0.0025* | 0.0100* | $112,500 |
| Claude 3 Opus | Anthropic | 0.0030** | 0.0150** | $180,000 |
| Llama 3 (推論) | Meta | 0.0018*** | 0.0018*** | $36,000 |
* OpenAI 公式料金(2026‑02) https://openai.com/pricing
* Anthropic 公式ページ(2026‑01) https://www.anthropic.com/api/pricing
** Meta の推論インスタンスは「オンデマンド」価格をベースに算出(2026‑03) https://developers.facebook.com/docs/llama3/pricing
解釈とバランスの取り方
- コスト感度が高いユースケース(チャットボット、社内検索など)は Gemini 3.1 Pro が最も費用対効果が高い。
- 生成品質・長文作成が重要なシナリオでは GPT‑4o の出力単価は高くなるものの、最新モデル特有の「高度な推論」や「マルチモーダル対応」が付加価値となります。
- プライバシー・オンプレミス志向の場合、Meta の Llama 3 はインスタンス単位で課金されるため、長期的に見るとコストが抑えられる可能性があります(ただしセットアップや保守の手間は別途考慮)。
シナリオ別費用シミュレーション
以下では代表的な 3 つの利用シーンを想定し、Gemini 3.1 Pro と主要競合モデル(GPT‑4o)について 無料枠・クレジット適用後 の実質支払額を比較します。計算はすべて 入力 : 出力 = 4 : 6 を前提にしています。
前提条件のまとめ
| 項目 | 値 |
|---|---|
| 入力単価(Gemini) | 0.00075 USD/1k |
| 出力単価(Gemini) | 0.0015 USD/1k |
| 入力単価(GPT‑4o) | 0.0025 USD/1k |
| 出力単価(GPT‑4o) | 0.0100 USD/1k |
| 無料枠 | 月間 100,000 トークン |
| クレジット残高 | $300 (90 日以内に全額使用想定) |
1. 開発・テストフェーズ(月間 200k トークン)
- Gemini 3.1 Pro
- 合計費用:$150(入力 $75 + 出力 $75)
-
無料枠で $100 カバー → 実質支払額 $0(クレジット残余分は使用しない想定)
-
GPT‑4o
- 合計費用:$2,250(入力 $500 + 出力 $1,750)
- 無料枠で $100 カバー → 実質支払額 $2,150
開発段階では Gemini が 約 14 倍 コスト削減できます。
2. 顧客対応チャットボット(月間 5 M トークン)
| モデル | 合計費用 (USD) | 無料枠適用後 | クレジット適用後 |
|---|---|---|---|
| Gemini 3.1 Pro | $9,750 | $9,650(無料枠分 $100) | $6,350(残クレジット $300 使用) |
| GPT‑4o | $45,000 | $44,900 | $42,600($300 クレジット適用) |
ここでも Gemini は 約 7 倍 のコスト優位性を保ちます。
3. 大規模コンテンツ生成(月間 20 M トークン)
| モデル | 合計費用 (USD) | 無料枠適用後 | クレジット適用後 |
|---|---|---|---|
| Gemini 3.1 Pro | $39,000 | $38,900($100) | $36,600 |
| GPT‑4o | $180,000 | $179,900 | $179,600 |
大量生成でも Gemini の単価差は顕著です。なお、品質要件が極めて高い場合は GPT‑4o の方が適切になるケースもあります。
法人向けプランと料金改定の見通し
Workspace エンタープライズ概要
Google Cloud が提供する Vertex AI Workspace(エンタープライズ) は、Gemini 系列を対象にしたボリュームディスカウントと SLA を組み合わせたプランです。公式情報(https://cloud.google.com/vertex-ai/docs/workspace)によれば、以下の条件で割引が適用されます。
| 条件 | 内容 |
|---|---|
| 最低年契約トークン量 | 1 M トークン/月 |
| 割引後単価(入力) | 0.00060 USD/1k |
| 割引後単価(出力) | 0.00120 USD/1k |
| SLA | 99.9% 稼働保証 + 24/7 専任サポート |
| カスタムチューニング | オプションで追加料金(見積もりベース) |
Enterprise 契約では、標準単価に対して 約 20% の割引が自動的に適用されます。さらに大規模顧客向けには 30〜40% のボリュームディスカウントも交渉可能です。
過去の料金改定と将来予測
| 時期 | 改定内容 | 背景・目的 |
|---|---|---|
| 2025‑12 | 入力単価 0.00085 → 0.00075、出力単価も同様に 10% 削減 | ハードウェアコスト低減と競合価格圧迫への対応 |
| 2026‑02(Gemini 3.1 Pro リリース) | 新モデル導入時のベース価格設定 | 推論速度 2 倍超の技術的優位性を価格で表現 |
| 2026‑06(予測) | 大規模顧客向け 30% ボリュームディスカウント の拡充計画 | エンタープライズ需要増と OpenAI・Anthropic の価格競争激化 |
今後も ハードウェアコスト削減 と 市場シェア防衛 が主なドライバーとなり、単価は緩やかに下がる見込みです。導入時は必ず最新の公式プライシングページを確認し、見積もり依頼で割引交渉を行うことを推奨します。
まとめと実務への示唆
- コスト面では Gemini 3.1 Pro が圧倒的に有利です。公式単価は GPT‑4o の約 1/7、Claude Opus の約 1/14 に留まります。
- 無料枠と $300 クレジット をフル活用すれば、開発・テストフェーズは実質費用ゼロで始められます。顧客対応やコンテンツ生成でも月額数千ドルに抑えることが可能です。
- エンタープライズ導入 を検討する場合は、最低年契約 1 M トークンをベースにしたボリュームディスカウントと SLA の有無を比較し、総所有コスト(TCO)で評価してください。
- 品質要件が最優先 のケースやマルチモーダル機能が必須の場合は、GPT‑4o や Claude Opus も選択肢に入れるべきです。ただし、その分のコスト増を予算計画に組み込む必要があります。
- 情報の正確性 を保つため、常に公式プライシングページと最新リリースノートを確認しましょう。サードパーティサイトのデータは参考程度に留め、契約前には必ずベンダー側の見積もりを取得してください。
本稿は 2026 年 3 月時点の公式情報を基に作成していますが、料金体系は随時変更される可能性があります。最新情報は各ベンダーの公式サイトをご確認ください。