Contents
提供範囲の違い
AI 機能自体は同一の LLM エンジンを使用しますが、デプロイ先やサポートレベルに差があります。以下に Cloud と Enterprise の主な相違点を示します。
- Grafana Cloud
- 完全マネージド SaaS 環境で AI アシスト機能が利用可能。
- ダッシュボード生成、パネル提案、レイアウト自動化が標準装備。
-
プライベートモデルやオンプレミス向けのカスタマイズは不可。
-
Grafana Enterprise
- Cloud と同等の AI エンジンをオンプレミスまたはプライベートクラウドにデプロイ可能。
- カスタムモデルホスティング、SLA に基づく優先サポート、組織単位でのロール管理が追加。
- 大規模環境向けに API 呼び出し回数や同時生成パネル数の上限緩和が提供される。
料金体系と利用開始手順
料金体系(執筆時点)
| プラン | AI 利用上限 | 主な特徴 |
|---|---|---|
| Free (Cloud) | 月間 20 回まで無料 | 基本的なプロンプト入力が可能。上限超過はエラーとなります。 |
| Pro (Cloud) | 月間 200 回まで無料、以降従量課金 | 高頻度の自動生成や大規模チームでの利用に適しています。 |
| Enterprise | 無制限(契約条件次第) | 年額ライセンスに含めて提供され、カスタム SLA が付随します。 |
注意:上記は執筆時点の情報です。プランや価格は公式サイトで随時更新されます。
利用開始手順(重複排除)
- Grafana Cloud アカウント作成
- メール認証を完了し、Free もしくは Pro プランに加入します。
- AI Assist の有効化
- 管理コンソール → Settings → AI で「AI Assist」をオンにします。
- 最低限のデータソース接続
- Prometheus、Loki、Tempo のいずれかを 1 つ以上接続し、テストクエリが成功することを確認します。
これらの条件が満たされれば、Grafana UI の「AI Dashboard」ボタンからプロンプト入力が可能になります。
API キー取得とデータソース接続手順
AI がダッシュボードを生成するには、API キー(Service Account) と正しく構成されたデータソースが必須です。本章では、キー発行から主要データソースの接続までを段階的に解説します。
API キー取得手順と権限設定
Grafana Cloud で AI を利用するには、Editor 以上 のロールを持つ Service Account が必要です。以下の流れで作成してください。
- Service Accounts メニューへ移動 → 「New service account」クリック
- 名前(例:
ai-dashboard-bot)と説明を入力し、ロールに Editor か Admin を選択 - 作成後「Generate API token」をクリックしてトークンを取得。表示された文字列は一度しか確認できないため、安全な場所へ保存します
| ロール | 主な権限 |
|---|---|
| Viewer | 読み取りのみ |
| Editor | ダッシュボード作成・編集、データソース設定 |
| Admin | 組織全体の設定変更可能 |
ポイント:AI が生成したクエリを実行しダッシュボードに保存するには Editor 権限が最低ラインです。
データソース別接続手順とテストクエリ
Prometheus 接続(概要)
Prometheus はメトリクス可視化の根幹となります。以下の手順で接続してください。
- 設定画面:左メニュー → Data Sources → Add data source → Prometheus
- URL:例
https://prometheus-us-east-1.grafana.net/api/prom(自組織エンドポイント) - 認証:先ほど取得した API キーかベーシック認証を設定
- 保存とテスト:Save & Test をクリックし、成功メッセージが表示されたら完了
テストクエリ例(CPU 使用率)
|
1 2 |
avg(rate(node_cpu_seconds_total{mode!="idle"}[5m])) by (instance) |
Loki 接続(概要)
ログ分析に特化した Loki は、AI が LogQL を直接利用できるようにします。
- 設定画面:Add data source → Loki
- URL:例
https://logs-us-west-2.grafana.net/loki/api/v1/query - 認証:API キーまたはベーシック認証を設定
テストクエリ例(エラーログ)
|
1 2 |
{job="nginx"} |= "error" |~ "timeout" |
Tempo 接続(概要)
分散トレースの可視化に使う Tempo も同様に設定します。
- 設定画面:Add data source → Tempo
- URL:例
https://tempo-us-central-1.grafana.net/trace - 認証:API キーで行います
テストクエリ例(特定サービスのトレース)
|
1 2 3 4 |
{ "query": "{service.name=\"order-service\"}" } |
まとめ:API キーを取得し、上記 3 種類のデータソースを最低 1 つ以上接続・テストできれば、Grafana AI がリアルタイムにメトリクスやログへアクセスし、自動ダッシュボード生成が可能になります。
プロンプト作成と自動生成フロー
AI に期待する可視化結果は、プロンプトの記述精度 に大きく左右されます。本節では、効果的なプロンプト構造と、Grafana AI がダッシュボードを生成する流れを解説します。
プロンプトベストプラクティス
以下の 3 ステップでプロンプトを作成すると、AI の理解度が向上し、期待通りのパネルが自動生成されやすくなります。
- 目的の明示:監視対象・ビジネスゴールを簡潔に記述。
- 指標の列挙:PromQL / LogQL をそのままコードブロックで書き出し、集計方法やラベルも含める。
- 可視化形式のヒント:希望するグラフ種別(折れ線・棒・テーブル)やレイアウト要件を追記。
具体例
- マイクロサービス全体の応答性
Create a dashboard to monitor microservice latency.
Metrics:
- avg(rate(http_request_duration_seconds_sum[5m])) by (service)
- histogram_quantile(0.95, sum(rate(http_request_duration_seconds_bucket[5m])) by (le, service))
Display as line charts for each service, time range last 24h.
- エラーログの傾向分析
Generate a dashboard showing error log trends from Loki.
Query:
{job="backend"} |= "ERROR"
Show count per minute as bar chart and top 5 messages in table.
ポイント:メトリクスはそのまま AI に渡すと、内部でクエリを再利用できるため手作業が削減されます。
ダッシュボード自動生成プロセス
| ステップ | 内容 |
|---|---|
| 1️⃣ プロンプト入力 | UI の「AI Dashboard」タブに作成したテキストを貼り付け、Generate をクリック。 |
| 2️⃣ バックエンド処理 | Grafana AI(内部 LLM)がプロンプトと接続済みデータソース情報を照合し、最適なパネル構成を生成。 |
| 3️⃣ プレビュー表示 | 提案されたレイアウトがモーダルで提示され、各パネルのクエリ・ビジュアル設定が自動埋め込み。 |
| 4️⃣ 保存・微調整 | ユーザーはそのまま保存するか、ドラッグ&ドロップや設定画面で微修正し、最終的にダッシュボードとして確定。 |
上限情報(2024 年 10 月時点):1 回のプロンプトにつき最大 12 パネル が生成可能です(プランにより変動)。
ダッシュボードのカスタマイズと運用
AI が作成したダッシュボードは、そのまま本番環境で使用できる形 ですが、組織固有のデザインやアラート要件に合わせて調整することが推奨されます。ここでは、レイアウト・テーマ変更、アラート設定、バージョン管理と CI/CD デプロイまでを網羅的に解説します。
レイアウト・テーマの調整
- レイアウト編集
- ダッシュボード右上の「Edit」→「Layout」を選択し、パネルを自由にドラッグ&リサイズ。デフォルトは 12 列グリッドなので、列幅統一は「Panel options」→「Grid position」で数値入力が便利です。
- テーマ変更
- 「Settings」→「Appearance」から Light/Dark の切替やカスタム CSS が設定可能。組織のブランドカラーに合わせて
--grafana-primary等の変数を上書きできます。
アラート設定手順
- パネル右上のベルアイコン → Create alert をクリック
- 条件式(例:
When avg() of query(A) is above 80 for 5m)と評価期間を入力 - 通知チャネルは事前に「Alerting > Notification channels」で Slack、Email、PagerDuty 等を登録しておく
注意:AI が生成したパネルはデフォルトでアラートが無効です。重要指標には必ず手動で設定してください。
保存・共有・CI/CD デプロイ
- 保存:編集画面右上の「Save」ボタンでバージョンコメントを付与すると、履歴が自動記録されます。
- 共有:
Share → Linkから公開リンクまたは埋め込みコードを取得し、フォルダー単位でロールベースのアクセス制御が可能です。 - CI/CD デプロイ例(GitHub Actions)
yaml
name: Deploy Grafana Dashboard
on:
push:
paths: ['dashboards/*.json']
jobs:
deploy:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v3
- name: Upload dashboard
env:
GRAFANA_TOKEN: ${{ secrets.GRAFANA_API_KEY }}
run: |
curl -X POST https://grafana.com/api/dashboards/db \
-H "Authorization: Bearer $GRAFANA_TOKEN" \
-H "Content-Type: application/json" \
--data-binary @dashboards/my-dashboard.json
バージョン管理とロールバック
- 履歴閲覧:ダッシュボード上部の「History」アイコンで過去バージョン一覧を表示。任意のリビジョンを選択し Revert が可能です。
- API 経由復元:
GET /api/dashboards/uid/:uidで取得した JSON をPOST /api/dashboards/dbに再送すれば、プログラム的にロールバックできます。
まとめ:AI 作成後のカスタマイズは Grafana 標準機能だけで完結し、バージョン管理や CI/CD パイプラインと組み合わせることで安全・迅速な本番デプロイが実現します。
実践ユースケースとトラブルシューティング
ここでは、マイクロサービス監視 と CI/CD パイプライン可視化 の2つの具体例を示し、よくあるエラーと対処法をまとめます。実務で即活用できるように、プロンプト例・生成結果・カスタマイズポイントを併記しています。
ユースケース 1:マイクロサービス監視
目的
order、payment、inventory の3サービスの レイテンシ と エラーレート を単一画面で把握する。
プロンプト例
|
1 2 3 4 5 6 |
Create a dashboard for microservice health monitoring. Metrics: - avg(rate(http_request_duration_seconds_sum{service=~"order|payment|inventory"}[1m])) by (service) - sum(rate(http_requests_total{service=~"order|payment|inventory",status=~"5.."}[1m])) by (service) Show latency as line charts and error count as stacked bar chart, time range last 6h. |
生成結果とカスタマイズ
| パネル | 内容 |
|---|---|
| レイテンシ | 各サービスの平均レイテンシ(折れ線) |
| エラーレート | サービス別エラー数(積み上げ棒) |
- アラート:
latency > 500ms for 3m→ Slack 通知 - テーマ:Dark モード+ブランドカラー
#0044CC
ユースケース 2:CI/CD パイプライン可視化
目的
GitHub Actions の各ステージ(checkout、build、test、deploy)の 実行時間 と 失敗回数 を監視。
プロンプト例
|
1 2 3 4 5 6 |
Generate a dashboard for GitHub Actions pipeline monitoring. Metrics (Loki): {job="github-actions"} | json | line_format "{{.status}} {{.duration}}" Show average duration per step as bar chart and failure count per step as table. Time range: last 24h. |
生成結果とカスタマイズ
| パネル | 内容 |
|---|---|
| ステップ別平均時間 | 棒グラフ(checkout〜deploy) |
| 失敗数テーブル | 各ステップの失敗回数上位3件を表示 |
- アラート:
failure count > 5 in last hour→ PagerDuty 発報 - レイアウト:横長パネルで横スクロール可能にし、全体像を一画面で把握。
既知の制限事項とトラブルシューティング
| 現象 | 主な原因 | 推奨対策 |
|---|---|---|
| AI が回答できません | プロンプトが長すぎる/構文エラー | 文字数を 500 字以内に抑え、コードブロックでメトリクスを明示 |
| パネルが空白になる | データソース認証失敗またはクエリ文法ミス | API キー権限(Editor)と接続テストを再確認 |
| レイアウトが崩れる | 改行やインデントが意図しない形で解釈される | 改行は最小限に、指示は ; 区切りで記述 |
| アラート保存エラー | 組織レベルで Alerting 権限が不足 | Admin にロール追加依頼、または自ユーザーへ Alerting 権限付与 |
デバッグの基本フロー
- Explore 画面で手動クエリ実行 → エラーメッセージ取得
- ログ確認(ブラウザコンソール or Grafana server logs) → 詳細情報取得
- 権限チェック:Service Account のロールとデータソース認証設定を再度検証
ベストプラクティス:AI に渡す前に、対象データソースで必ずテストクエリが期待通りの結果を返すことを確認してください。
まとめ
- Grafana Cloud の AI は Free/Pro プランでも利用可能 ですが、Enterprise 版はオンプレミスやカスタム SLA が加わります。
- 利用開始には アカウント作成 → AI Assist 有効化 → データソース接続 の3ステップが必須です。
- API キー(Editor ロール) と主要データソース(Prometheus/Loki/Tempo)の設定が整えば、AI による自動ダッシュボード生成がすぐに利用できます。
- 効果的なプロンプトは「目的・指標・可視化形式」の3要素を明示し、コードブロックでメトリクスを書き出すと成功率が上がります。
- 生成後のカスタマイズは レイアウト・テーマ・アラート が中心で、バージョン管理や CI/CD パイプラインを活用すれば本番環境への安全なデプロイが可能です。
以上を踏まえて、まずは Cloud の無料プランで AI 機能を試し、組織の可観測性要件が拡大した段階で Enterprise 版への移行をご検討ください。