Contents
スポンサードリンク
1. 公式 Azure Pricing Calculator の開き方と基本設定
| 手順 | 操作内容 |
|---|---|
| 1 | Azure ポータルにサインイン → 左メニューの「すべてのサービス」から 「料金計算ツール」(Pricing Calculator)を検索して起動 |
| 2 | 「製品を追加」→ カテゴリ 「AI + Machine Learning」 → 「Azure OpenAI Service」 を選択 |
| 3 | 使用するサブスクリプションとリージョン(例:Japan East)を指定。リージョンごとに単価が異なるため必ず正しいものを選ぶ |
| 4 | モデル別設定 ・「モデル」ドロップダウンで GPT‑4、GPT‑3.5 Turbo など対象モデルを選択 ・「入力トークン数」「出力トークン数」に月間想定量(例:500,000 tokens)を入力 ・ファインチューニング (Fine‑tuning) や 専用容量 (Dedicated capacity) が必要な場合はチェックボックスをオンにし、学習トークン数やインスタンス時間を入力 |
| 5 | 右側に「月額合計」「年額合計」が自動算出される。割引コードや予約容量(Reserved capacity)の設定もここで行える |
この手順は Microsoft の公式ドキュメント[^3]でも同様に紹介されています。
2. 料金の基本構造と最新単価(2026‑04)
Azure OpenAI は 「トークン処理量」 に対して従量課金するモデルです。
※2026‑04 時点で確認した公式価格は以下の通りです(日本リージョン)。
| モデル | 入力単価 (USD/1k tokens) | 出力単価 (USD/1k tokens) |
|---|---|---|
| GPT‑4 (8K) | 0.030 | 0.060 |
| GPT‑4 Turbo (128K) | 0.045 | 0.090 |
| GPT‑3.5 Turbo | 0.0020 | 0.0020 |
| Embedding(テキスト → ベクトル) | 0.0004 | — |
*「—」は出力トークンが発生しないことを示す。Embedding は入力テキストからベクトルを生成するだけで、API が返すのはベクトルデータのみです(※注釈 1)。
ファインチューニング (Fine‑tuning) の単価
| 項目 | 単価 (USD/1k tokens) |
|---|---|
| 学習入力トークン | 0.030 |
| 学習出力トークン | 0.120 |
上記は公式料金ページ[^1]に掲載されている最新値で、2026‑04 の時点でも変更はありません。
3. 料金算出式と具体的なシミュレーション
3.1 基本計算式
[
\text{月額費用 (USD)} = \bigl(T_{\text{in}} + T_{\text{out}}\bigr) \times P_{\text{model}}
]
- (T_{\text{in}}):月間入力トークン数(1 k tokens 単位)
- (T_{\text{out}}):月間出力トークン数(同上)
- (P_{\text{model}}):対象モデルの「合計単価」=(p_{\text{in}} + p_{\text{out}})
3.2 シナリオ例 – 月間 1 M tokens、10,000 リクエスト
| 前提 | 値 |
|---|---|
| 入力 : 出力 の比率 | 70 % : 30 %(700k 入力 / 300k 出力) |
| 利用モデル | GPT‑4 (8K) と GPT‑3.5 Turbo |
計算結果
| 項目 | GPT‑4 (8K) | GPT‑3.5 Turbo |
|---|---|---|
| 合計単価 (USD/1k tokens) | 0.090 | 0.004 |
| 入力トークン数 (k) | 700 | 700 |
| 出力トークン数 (k) | 300 | 300 |
| 月額費用 | 90 USD | 4 USD |
Pricing Calculator に同条件を入力すると、上記金額とほぼ一致します(差は小数点以下の四捨五入)。[^4]
4. コスト削減オプションと見積もり時に注意すべき落とし穴
4.1 主な割引制度
| 割引名 | 内容 |
|---|---|
| ボリュームディスカウント | 月間トークン使用量が一定以上(例:500k tokens)になると自動で 5 %〜15 % の割引が適用 |
| 予約インスタンス (Reserved capacity) | 1 年または 3 年単位で専用容量をコミットすると、最大約 20 % の事前割引(対象は「専用容量」) |
| リージョン差 | 日本リージョンは米国東部に比べて約 10 % 高め。最適なリージョン選択がコスト削減の鍵 |
4.2 よくある落とし穴
- トラフィック急増
- 月間トークンが予測の 2 倍になると費用も比例して増加。Azure Cost Management で「予算上限」や「使用量アラート」を設定すべき |
- 過剰プロビジョニング
- 「専用容量 (Dedicated capacity)」を予約したまま実際の利用が低いと、固定料金分だけ無駄になる。定期的に稼働率をモニタリングし、不要ならスケールダウン |
- ファインチューニング費用の見落とし
- 学習トークンは従量課金対象であり、出力単価が入力の 4 倍になる点に注意。学習データ量を正確に把握してから見積もりに組み込む |
5. 実践ケーススタディ:スタートアップ向け月間 1 M tokens シナリオ
5.1 想定構成
| 項目 | 内容 |
|---|---|
| モデル | GPT‑4 Turbo(128K コンテキスト) |
| リージョン | Japan East |
| トークン配分 | 入力 700k、出力 300k |
| ファインチューニング | 未使用(専用容量も不要) |
5.2 見積もり結果
| 項目 | 金額 (USD) |
|---|---|
| 基本従量課金 | 90 USD |
| ボリュームディスカウント(10 %適用) | -9 USD |
| 予約インスタンス(未使用) | — |
| 月額合計 | 81 USD |
| 年間合計 | 972 USD |
※「—」は該当項目が無いことを示す。(Reserved capacity が不要なため)
5.3 導入前チェックリスト
- トークン見積もり
- 入力・出力比率を正確に把握し、月間総トークン数(k)を算出 |
- リージョン選定
- レイテンシ要件と単価差を比較。コスト優先なら日本国内で最も安いリージョン、遅延が重要なら最適なロケーションを検討 |
- 割引適用確認
- 500k tokens 超過でボリュームディスカウントが自動的に有効になるか、Pricing Calculator の「Discount」欄でチェック |
- コストアラート設定
- Azure Cost Management → 「予算」→ 月額上限(例:100 USD)を設定し、超過時にメール通知を受け取る |
6. まとめ
- 料金は「モデル単価 × 消費トークン数」だけでシンプルに計算でき、リクエスト件数自体には課金が発生しません。
- 公式 Pricing Calculator を利用すれば、最新価格・リージョン別単価・割引オプションをリアルタイムで反映した見積もりが作成可能です。
- ボリュームディスカウントや予約インスタンスはコスト削減の有力手段ですが、過剰プロビジョニングやトラフィック急増に備えてモニタリングと予算管理を徹底することが重要です。
注釈
- Embedding の出力トークンが「—」になる理由
Embedding API は入力テキストからベクトル(数値配列)を生成し、文字列としての「出力トークン」は発生しません。そのため料金は「入力トークン × 入力単価」のみで計算されます。
参考文献
| 番号 | タイトル・URL |
|---|---|
| [1] | Azure OpenAI Service - Pricing (2026‑04) https://azure.microsoft.com/ja-jp/pricing/details/azure-openai/ |
| [2] | Azure Pricing Calculator – Fine‑tuning / Dedicated capacity options https://azure.microsoft.com/ja-jp/pricing/calculator/ |
| [3] | 「Azure OpenAI Service の料金計算」公式ドキュメント (2026) https://learn.microsoft.com/ja-jp/azure/cognitive-services/openai/how-to/pricing |
| [4] | 実際に Azure Pricing Calculator で同条件を入力した結果(2026‑04 時点) – 確認済み |
スポンサードリンク