Contents
Grafana AI の概要と対応データ種別
Grafana AI は、大規模言語モデル(LLM)と各データソースのメタ情報を組み合わせて、ユーザーが入力した自然言語指示を内部クエリと可視化設定に変換します。これにより、Observability の全体像を横断的に把握しやすくなります。
対応する Observability データ 3 種類
Grafana AI が対象とするデータは次の 3 つです。各種データは Grafana のプラグイン(Prometheus、Loki、Tempo 等)と連携して取得します。
-
メトリクス
時系列の数値指標(CPU 使用率、レイテンシーなど)。Grafana AI は対象指標を自動認識し、適切な集計関数(avg,max,percentile等)と可視化タイプ(折れ線グラフやヒートマップ)を選択します。 -
ログ
テキストベースのイベント情報。Loki や Elasticsearch と組み合わせ、エラー頻度や文字列検索結果を自動で集計し、棒グラフやテーブルに変換できます。 -
分散トレース
Jaeger や Tempo が提供するスパン情報。サービス間の呼び出し経路と遅延分布を解析し、フローダイアグラムやヒストグラムとして可視化します。
メトリクスの自動可視化例
以下は「CPU 使用率をホスト別に 24 時間表示してほしい」という指示に対する生成結果です。
-
プロンプト
Show a line chart of CPU usage percentage for the last 24 hours grouped by host. -
自動生成されたクエリ(PromQL)
promql
avg(rate(node_cpu_seconds_total[5m])) by (instance) -
可視化タイプ
ホスト別に色分けされた折れ線グラフが即座に作成され、タイムレンジはデフォルトで「Last 24 h」に設定されます。
ログ解析の自動生成例
エラーコード 500 の出現回数を時間帯別に集計したい場合の流れです。
-
プロンプト
Count error logs with status code 500 per hour for the past week. -
自動生成されたクエリ(Loki)
logql
count_over_time({status="500"}[1h]) -
可視化タイプ
時間軸が横、件数が縦の棒グラフとして表示されます。
分散トレースの統合と可視化例
分散システムで最近 5 分間に最も遅延したスパン上位 3 件を把握したいケースです。
-
プロンプト
Show the top 3 spans with highest latency in the last 5 minutes. -
自動生成されたクエリ(Tempo)
sql
SELECT span_name, duration_ms FROM traces
WHERE start_time > now() - interval '5 minute'
ORDER BY duration_ms DESC LIMIT 3 -
可視化タイプ
スパン別ヒストグラムと、呼び出しフローを示すサイドバー付きのフローダイアグラムが作成されます。
AI 機能利用前に必要な準備
Grafana AI を本番環境で活用するには、以下 3 つの事前条件を満たす必要があります。これらをあらかじめ整えておくと、有効化手順がスムーズに進みます。
Grafana Cloud アカウント作成手順
Grafana AI は Grafana Cloud の有料プランで提供されているため、まずは公式サイトからアカウントを取得します。
- https://grafana.com/ にアクセスし、右上の Sign Up をクリック。
- メールアドレスとパスワードを入力して認証メールを確認。
- ログイン後に表示される「Welcome」画面で組織名を設定し、ダッシュボード画面へ遷移します。
ポイント:無料プランでも利用は可能ですが、AI 機能は Pro 以上のプラン限定です。公式ドキュメントで最新のプラン情報をご確認ください。
AI 対応プランの確認方法
アカウント作成後にプランが AI に対応しているかを確認します。
- Grafana Cloud の左メニューから Settings → Billing を開く。
- 「Plan」欄に Pro, Advanced, Enterprise といった表記があり、項目の右側に「AI」タグが付いていれば利用可能です。
公式ページは随時更新されるため、プラン内容は必ず最新情報を参照してください。
API キーの取得と権限設定
AI がダッシュボード生成に必要なクエリ実行権限を持つトークンが必要です。
- Settings → API Keys に移動。
- 「Create API Key」ボタンをクリックし、名前(例:
grafana-ai-token)とロールを Editor に設定。 - 作成されたキーは画面に一度だけ表示されるので、安全な場所(シークレットマネージャや環境変数)に保存します。
注意:Viewer ロールではクエリ実行権限が不足するため、Editor 以上を推奨します。
AI 機能の有効化と利用上の注意点
準備が整ったら、Grafana Cloud の管理画面から AI 機能をオンにします。同時に料金体系やクオータ(使用量上限)を把握しておくことが重要です。
有効化手順(画面操作)
- 左サイドバーの Settings → AI を選択。
- 「Enable AI」スイッチをオンにし、利用規約に同意。
- プラン要件が満たされていない場合は、画面案内に従って Pro 以上へのアップグレード手続きを行います。
料金体系とクオータ(概要)
| 項目 | 内容 |
|---|---|
| 無料トライアル | 初回 30 日間は AI クエリ 10,000 回まで無償で利用可能(※2026 年時点の情報)。 |
| Pro プラン | 月額 $49(米ドル)で追加クエリ 100,000 回分が含まれ、超過分は従量課金。 |
| Advanced / Enterprise | より大容量のクエリ枠と SLA が提供されます。 |
重要:料金やクオータは変更されることがあります。必ず公式の「Pricing」ページで最新情報を確認してください。
使用量モニタリングとアラート設定
過剰なクエリ実行はコスト増につながります。Grafana の Usage ダッシュボードでリアルタイムに AI クエリ数を監視し、閾値に達した際に通知が来るよう設定しましょう。
- 「Dashboards → Usage」から AI Query Count ウィジェットを追加。
- ウィジェット上部の Alert ボタンで「残量が 10 % 以下」の条件と Slack/メール通知先を指定。
- 必要に応じて評価間隔(例:5 分)や再通知の間隔を調整し、ノイズを抑えます。
自然言語プロンプトでダッシュボード作成の実例
AI ダッシュボード作成 UI では「AI Dashboard」ボタンをクリックし、テキストエリアに指示を書くだけでパネルが生成されます。以下は代表的なプロンプトとその結果です。
プロンプト例と生成結果
1. CPU 使用率の時系列グラフ
|
1 2 |
Show a line chart of CPU usage percentage for the last 24 hours grouped by host. |
- 自動生成されたクエリ(PromQL)
promql
avg(rate(node_cpu_seconds_total[5m])) by (instance) - 可視化結果:ホスト別に色分けされた折れ線グラフが作成され、デフォルトのタイムレンジは「Last 24 h」。
2. エラーログの頻度分析
|
1 2 |
Count error logs per hour for the past week and display as a bar chart. |
- 自動生成されたクエリ(Loki)
logql
count_over_time({level="error"}[1h]) - 可視化結果:時間軸が横、エラーログ件数が縦の棒グラフで表示されます。
3. トレース遅延上位スパンのヒストグラム
|
1 2 |
Show the top 3 spans with highest latency in the last 5 minutes. |
- 自動生成されたクエリ(Tempo)
sql
SELECT span_name, duration_ms FROM traces
WHERE start_time > now() - interval '5 minute'
ORDER BY duration_ms DESC LIMIT 3 - 可視化結果:スパン別ヒストグラムと、呼び出しフローを示すサイドバー付きのフローダイアグラムが同時に生成されます。
生成結果の確認ポイント
- データソース・期間 が期待通りか(ダッシュボード上部のタイムレンジ設定)。
- パネルタイトルや軸ラベル が自動生成された文言で分かりやすいか。
- クエリ結果が空の場合 は、プロンプトにフィルタ条件(例:
status="500")を追加して再実行する。
生成されたパネルのカスタマイズと運用ベストプラクティス
自動生成されたパネルはそのままでも利用できますが、実務要件に合わせて微調整すると可視性や再利用性が向上します。以下では編集手順と運用上のポイントを解説します。
クエリやビジュアルの編集方法
- パネル右上の Edit をクリックし、クエリエディタに移動。
- 必要に応じてメトリック名や集計関数を変更(例:
rate(node_cpu_seconds_total[5m])→irate(...))。 - 「Visualization」タブで色パレット、軸単位、ツールチップの表示設定などをカスタマイズ。
コツ:企業カラーに合わせた配色や、Y 軸に
%表記を付与するとダッシュボード全体の統一感が出ます。
変数・テンプレート化で汎用ダッシュボード作成
- ダッシュボードレベルで $host や $region といった変数を作成し、データソースのラベル一覧から自動取得させます。
- パネルクエリ内のハードコーディングされた値(例:
instance="prod‑db‑01")を$hostに置き換えるだけで、1 つのダッシュボードで複数環境を切り替えて閲覧可能になります。
保存・共有・エクスポート手順
- 編集が完了したら Save → ダッシュボード名と保存先フォルダー(例:
Observability/AI生成)を指定。 - Share ボタンから以下の方法で共有できます。
- リンク:閲覧権限付き URL を取得。
- JSON エクスポート:設定ファイルとしてダウンロードし、別環境へインポート可能。
- フォルダーごとにロールベースのアクセス制御(例:
Viewer,Editor) を設定し、チームメンバー間で安全に共有します。
アラート設定とコスト管理のベストプラクティス
- パネル上部の Alert タブで閾値条件(例:CPU 使用率 > 80 %)を設定し、通知先として Slack やメールを選択します。
- 評価間隔は 1 分 がデフォルトですが、クエリコストが気になる場合は 5 分以上 に延長し、不要なトラフィックと課金を抑制します。
- アラートの有効化・無効化は Usage ダッシュボード と連動させ、使用量が一定以上に達したら自動で通知する仕組みを構築すると安心です。
まとめ
Grafana AI はメトリクス・ログ・トレースの3種データを自然言語だけで可視化できる強力なツールです。本稿では、対応データの概要、利用開始に必要な準備手順、実際のプロンプト例と生成結果、そして生成されたパネルのカスタマイズ・運用方法まで網羅的に解説しました。
- 準備:Grafana Cloud の有料プラン取得 → API キー(Editor 権限)発行
- 有効化:管理画面で AI をオンにし、料金・クオータを公式ページで最新確認
- 活用:自然言語プロンプトで即座にパネル生成 → 必要に応じて編集・変数化 → ダッシュボードとして保存・共有
- 運用:使用量モニタリングとアラート設定でコスト管理を徹底
公式ドキュメントは随時更新されるため、常に最新情報を参照しながら安全かつ効果的に Grafana AI を活用してください。