Contents
1. 必要な Grafana バージョンとライセンス要件
Grafana Assistant は Grafana 10.2 以降 のエディションで利用できます(正確なバージョンは公式リリースノートを参照)。提供形態は以下の通りです。
| プラン | AI 機能の提供状況 | 主なライセンス条件 |
|---|---|---|
| Free (Community) | プラグインはインストール可能だが、デフォルトで無効化。公式サイトにて期間限定の無料トライアルが実施されることがある。 | 利用規約への同意が必須。商用利用は制限あり。 |
| Pro | AI 機能を標準で有効化可能。月額料金に含まれる形で提供。 | 商用サポートと SLA が付随。 |
| Enterprise | カスタム LLM デプロイやモデルロックインオプションが利用でき、組織単位のセキュリティ要件に対応。 | エンタープライズ契約に基づく追加費用・サポート。 |
ポイント:本番環境で安定運用したい場合は、Free プランのトライアルを試したうえで、長期的には Pro 以上へのアップグレードを検討してください。
2. AI 機能の有効化手順
2-1. Grafana Cloud(マネージド)でのワンクリック有効化
Grafana Cloud の管理コンソールにログインすると、「AI Assistant」 タブが表示されます。以下の流れで有効化できます。
- 「AI Assistant」タブを開く – 画面左側メニューまたは上部ナビゲーションからアクセス。
- 「Enable Assistant」ボタンをクリック – ボタン一つでバックエンドに設定が反映され、プロンプト入力欄が即座に表示されます。
※プラグインの手動インストールは不要です。
2-2. Self‑hosted 環境への導入手順
オンプレミス環境で AI 機能を利用する場合は、公式リポジトリからプラグインを取得し、設定ファイルに追記します。
(1) プラグインのインストール
|
1 2 3 |
# 2026‑05 時点での正式パッケージ名(公式リポジトリ確認が必須) grafana-cli plugins install grafana-assistant-plugin |
注意:プラグイン名は
grafana-assistant-pluginが現在の公式名称です。リポジトリ URL(例:https://github.com/grafana/assistant-plugin)で最新版を確認してください。
(2) grafana.ini への設定追加
|
1 2 3 4 5 6 7 8 |
[assistant] enabled = true # Assistant 機能全体を有効化 # デフォルトモデルは Grafana が管理する LLM(OpenAI、Anthropic 等)。最新情報は docs.grafana.com を参照。 model = "" # 明示的に設定しない場合はデフォルトが使用される api_key = "<YOUR_LLM_API_KEY>" # データ送信オプトアウト(公式ドキュメントでサポートが確認できたら有効化) data_sharing = false # ← 設定項目の有無はバージョンに依存 |
(3) Grafana サービスの再起動
|
1 2 3 |
# systemd の場合 sudo systemctl restart grafana-server |
再起動後、Web UI 左側メニューに 「Assistant」 が表示されれば完了です。
3. 効果的なプロンプト作成とデータソース設定
3-1. データソースの基本構築(Prometheus/OpenTelemetry)
目的:AI に正確なメトリクス情報を認識させ、期待通りのクエリ生成を促す。
- データソース追加
-
UI の「Data Sources」→「Add data source」から対象を選択(Prometheus または OpenTelemetry)。
-
接続情報入力
-
URL(例:http://prometheus.example.com:9090)や認証方式(ベーシック、Bearer Token)を設定。 -
ロールと権限
- データソースに対して「Viewer」以上のロールが必要です。ダッシュボード作成者は少なくとも「Editor」ロールであることを確認してください。
3-2. プロンプトに含めるべき要素
| 要素 | 記述例 |
|---|---|
| 目的 | 「サービス全体の健康状態をリアルタイムで把握したい」 |
| 対象指標 | node_cpu_seconds_total、http_requests_total |
| 集計期間 | 「過去 24 時間」または「直近 5 分」 |
| 可視化タイプ | 「時間系列グラフ」「単一数値(Stat)」「ヒートマップ」 |
プロンプト例
Prometheus の node_cpu_seconds_total と http_requests_total を使い、過去 24 時間の CPU 使用率と HTTP 5xx エラー率を時間系列グラフで表示するダッシュボードを作成してください。エラー率はステータスコードが 5xx の割合として計算し、各パネルにタイトルと % 単位を付与してください。
このように 「何を」「どの期間で」「どんな可視化」 を明示すると、Assistant が生成するクエリ・レイアウトの精度が向上します。
4. AI が生成したダッシュボードの調整ポイント
4-1. クエリ最適化と軸設定
| 項目 | 推奨アクション |
|---|---|
| 冗長な PromQL | rate() のウィンドウや by ラベルで絞り込み、計算コストを削減。 |
| Y 軸スケール | CPU 使用率は 0‑100 % に固定、エラー率は自動スケール(例:0‑10 %)に設定。 |
4-2. アラートルールの追加
- パネル右上の 「Alert」 タブを開く。
- 「Create alert rule」をクリックし、閾値と評価期間を入力(例:CPU 使用率 > 80 % → 5 分間)。
- 通知チャネル(Slack、Email 等)を選択して保存。
4-3. パネルレイアウト・テーマの調整
- ドラッグ&ドロップ でサイズや配置を最適化。重要度に応じて上部に配置すると視認性が向上します。
- テーマは組織のブランドカラーに合わせて「Dark」または「Light」を選択し、必要に応じてカスタム CSS を追加できます(ただしプラグイン側でサポートされているか確認)。
まとめ:Assistant が提供するベースラインは「出発点」です。クエリ・軸設定・アラートの三本柱を見直すことで、実務要件に合致した信頼性の高いダッシュボードへと仕上げられます。
5. ダッシュボードの保存・共有とセキュリティ考慮
5-1. フォルダー管理とロール付与
- フォルダー作成:
Dashboards → Manage → New folderで例Production/Observabilityを作成。 - 権限設定:フォルダー単位で「Viewer」「Editor」「Admin」のロールをチームごとに割り当て、不要な書き込み権限は削除。
- 保存先指定:ダッシュボード編集画面右上の 「Save」 → 「Folder」で作成したフォルダーを選択。
5-2. データ送信オプトアウトとプライバシー
Assistant が外部 LLM に送信する情報は以下に限定されます(公式ドキュメント参照)。
| 送信対象 | 内容 |
|---|---|
| プロンプト本文 | ユーザーが入力した自然言語テキスト |
| データソース名・メトリクスキー | 例:node_cpu_seconds_total、http_requests_total |
| ダッシュボード構成情報 | パネル数・可視化タイプなどのメタデータ |
機密性が高い環境では、[assistant] セクションに data_sharing = false を設定することで送信を抑止できます(この項目はバージョン 10.2 以降でサポートされていることを公式リリースノートで確認してください)。
オプトアウトが利用できない場合は、ローカル LLM デプロイ(例:OpenAI エッジモデル)や Enterprise のオンプレミス LLM オプション を検討します。
6. よくあるエラーと対処フロー
6-1. 曖昧なプロンプトによる生成失敗
| 症状 | 原因例 | 改善策 |
|---|---|---|
| パネルが空になる | 指標名や時間範囲が不明確 | 「指標=node_cpu_seconds_total、期間=過去 1 時間」など具体化 |
| クエリ構文エラー | PromQL の関数指定が省略されている | rate(node_cpu_seconds_total[5m]) * 100 のように必須関数を明示 |
6-2. データソース認証エラー
- API キー/トークンの有効性 – Data source 設定画面で「Test & Save」を実行。
- ネットワーク接続 – Self‑hosted 環境では Prometheus がファイアウォールで遮断されていないか確認。
- ロール権限 – データソースに対し「Viewer」以上の権限が付与されているか再チェック。
6-3. 実践フロー:CPU 使用率・HTTP エラー率ダッシュボード作成例
- データソース登録(Prometheus)
- Assistant 有効化(Cloud または Self‑hosted)
- プロンプト入力
Prometheus の node_cpu_seconds_total を使い、過去 24 時間の CPU 使用率を時間系列グラフで表示してください。
同時に http_requests_total と status_code ラベルから 5xx エラー率を算出し、別パネルで同じ期間の折れ線グラフとして作成してください。各パネルにタイトルと単位(%)を付けてください。
- 生成結果確認 – 2 つのパネルが表示されたことを確認。
-
クエリ・軸調整
-
CPU パネル:
rate(node_cpu_seconds_total[5m]) * 100→ Y 軸 0‑100 % 固定 -
エラー率パネル:
sum(rate(http_requests_total{status_code=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) * 100 -
アラート設定(任意) – CPU 使用率が 80 % 超過したら Slack に通知。
- 保存・共有 – フォルダー
Production/Observabilityに保存し、チームロール「Editor」以上に閲覧権限を付与。
7. 最終まとめ(要点)
- バージョン確認:Grafana 10.2 以降で Assistant が利用可能。公式リリースノートで最新情報を取得してください。
- ライセンス:Free プランはトライアルが提供されることがあるが、商用利用や長期運用には Pro/Enterprise の検討が必須です。
- 導入手順:Cloud はワンクリック、Self‑hosted は
grafana-assistant-pluginのインストールと[assistant]設定で有効化。 - プロンプト作成:目的・指標・期間・可視化タイプを明示し、具体的なメトリクス名を入れることで高精度生成が期待できます。
- 生成結果の調整:冗長クエリの削減、Y 軸固定、アラート追加で実務に即したダッシュボードへ仕上げます。
- セキュリティ:
data_sharing = false(オプトアウト)やローカル LLM デプロイで外部送信を制御し、フォルダー・ロール管理でアクセス権限を最小化します。
以上の手順とベストプラクティスに従えば、Grafana AI(Assistant)を活用した 「高速かつ安全な Observability ダッシュボード」 の構築が実現できます。
本稿は執筆時点の情報に基づきます。機能追加や設定項目の変更は頻繁に行われるため、導入前には必ず公式ドキュメント(https://grafana.com/docs/)をご確認ください。