Grafana

Grafana AI(Assistant)概要と導入手順 – バージョン・ライセンス・活用方法

ⓘ本ページはプロモーションが含まれています

もっとスキルを活かしたいエンジニアへ

スポンサードリンク
働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

エンジニアの世界では、「いつでも動ける状態を作っておけ」とよく言われます。
技術やポートフォリオがあっても、自分に合う案件情報を日常的に見れていないと、いざ動こうと思った時に比較や判断が難しくなってしまいます。
普段から案件情報が集まる環境を作っておくと、良い案件が出た時にすぐ動きやすくなりますよ。
筆者自身も、メガベンチャー勤務時代に年収1,500万円を超えた経験があります。振り返ると、技術だけでなく「どんな案件や働き方があるか」を日頃から見ていたことが、キャリアの選択肢を広げるきっかけになりました。
このブログを読んでくれた方に感謝を込めて、実際に使っている情報収集サービスを紹介します。

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。


スポンサードリンク

1. 必要な Grafana バージョンとライセンス要件

Grafana Assistant は Grafana 10.2 以降 のエディションで利用できます(正確なバージョンは公式リリースノートを参照)。提供形態は以下の通りです。

プラン AI 機能の提供状況 主なライセンス条件
Free (Community) プラグインはインストール可能だが、デフォルトで無効化。公式サイトにて期間限定の無料トライアルが実施されることがある。 利用規約への同意が必須。商用利用は制限あり。
Pro AI 機能を標準で有効化可能。月額料金に含まれる形で提供。 商用サポートと SLA が付随。
Enterprise カスタム LLM デプロイやモデルロックインオプションが利用でき、組織単位のセキュリティ要件に対応。 エンタープライズ契約に基づく追加費用・サポート。

ポイント:本番環境で安定運用したい場合は、Free プランのトライアルを試したうえで、長期的には Pro 以上へのアップグレードを検討してください。


2. AI 機能の有効化手順

2-1. Grafana Cloud(マネージド)でのワンクリック有効化

Grafana Cloud の管理コンソールにログインすると、「AI Assistant」 タブが表示されます。以下の流れで有効化できます。

  1. 「AI Assistant」タブを開く – 画面左側メニューまたは上部ナビゲーションからアクセス。
  2. 「Enable Assistant」ボタンをクリック – ボタン一つでバックエンドに設定が反映され、プロンプト入力欄が即座に表示されます。

※プラグインの手動インストールは不要です。

2-2. Self‑hosted 環境への導入手順

オンプレミス環境で AI 機能を利用する場合は、公式リポジトリからプラグインを取得し、設定ファイルに追記します。

(1) プラグインのインストール

注意:プラグイン名は grafana-assistant-plugin が現在の公式名称です。リポジトリ URL(例:https://github.com/grafana/assistant-plugin)で最新版を確認してください。

(2) grafana.ini への設定追加

(3) Grafana サービスの再起動

再起動後、Web UI 左側メニューに 「Assistant」 が表示されれば完了です。


3. 効果的なプロンプト作成とデータソース設定

3-1. データソースの基本構築(Prometheus/OpenTelemetry)

目的:AI に正確なメトリクス情報を認識させ、期待通りのクエリ生成を促す。

  1. データソース追加
  2. UI の「Data Sources」→「Add data source」から対象を選択(Prometheus または OpenTelemetry)。

  3. 接続情報入力

  4. URL(例:http://prometheus.example.com:9090)や認証方式(ベーシック、Bearer Token)を設定。

  5. ロールと権限

  6. データソースに対して「Viewer」以上のロールが必要です。ダッシュボード作成者は少なくとも「Editor」ロールであることを確認してください。

3-2. プロンプトに含めるべき要素

要素 記述例
目的 「サービス全体の健康状態をリアルタイムで把握したい」
対象指標 node_cpu_seconds_totalhttp_requests_total
集計期間 「過去 24 時間」または「直近 5 分」
可視化タイプ 「時間系列グラフ」「単一数値(Stat)」「ヒートマップ」

プロンプト例
Prometheus の node_cpu_seconds_total と http_requests_total を使い、過去 24 時間の CPU 使用率と HTTP 5xx エラー率を時間系列グラフで表示するダッシュボードを作成してください。エラー率はステータスコードが 5xx の割合として計算し、各パネルにタイトルと % 単位を付与してください。

このように 「何を」「どの期間で」「どんな可視化」 を明示すると、Assistant が生成するクエリ・レイアウトの精度が向上します。


4. AI が生成したダッシュボードの調整ポイント

4-1. クエリ最適化と軸設定

項目 推奨アクション
冗長な PromQL rate() のウィンドウや by ラベルで絞り込み、計算コストを削減。
Y 軸スケール CPU 使用率は 0‑100 % に固定、エラー率は自動スケール(例:0‑10 %)に設定。

4-2. アラートルールの追加

  1. パネル右上の 「Alert」 タブを開く。
  2. 「Create alert rule」をクリックし、閾値と評価期間を入力(例:CPU 使用率 > 80 % → 5 分間)。
  3. 通知チャネル(Slack、Email 等)を選択して保存。

4-3. パネルレイアウト・テーマの調整

  • ドラッグ&ドロップ でサイズや配置を最適化。重要度に応じて上部に配置すると視認性が向上します。
  • テーマは組織のブランドカラーに合わせて「Dark」または「Light」を選択し、必要に応じてカスタム CSS を追加できます(ただしプラグイン側でサポートされているか確認)。

まとめ:Assistant が提供するベースラインは「出発点」です。クエリ・軸設定・アラートの三本柱を見直すことで、実務要件に合致した信頼性の高いダッシュボードへと仕上げられます。


5. ダッシュボードの保存・共有とセキュリティ考慮

5-1. フォルダー管理とロール付与

  1. フォルダー作成Dashboards → Manage → New folder で例 Production/Observability を作成。
  2. 権限設定:フォルダー単位で「Viewer」「Editor」「Admin」のロールをチームごとに割り当て、不要な書き込み権限は削除。
  3. 保存先指定:ダッシュボード編集画面右上の 「Save」 → 「Folder」で作成したフォルダーを選択。

5-2. データ送信オプトアウトとプライバシー

Assistant が外部 LLM に送信する情報は以下に限定されます(公式ドキュメント参照)。

送信対象 内容
プロンプト本文 ユーザーが入力した自然言語テキスト
データソース名・メトリクスキー 例:node_cpu_seconds_totalhttp_requests_total
ダッシュボード構成情報 パネル数・可視化タイプなどのメタデータ

機密性が高い環境では、[assistant] セクションに data_sharing = false を設定することで送信を抑止できます(この項目はバージョン 10.2 以降でサポートされていることを公式リリースノートで確認してください)。
オプトアウトが利用できない場合は、ローカル LLM デプロイ(例:OpenAI エッジモデル)や Enterprise のオンプレミス LLM オプション を検討します。


6. よくあるエラーと対処フロー

6-1. 曖昧なプロンプトによる生成失敗

症状 原因例 改善策
パネルが空になる 指標名や時間範囲が不明確 「指標=node_cpu_seconds_total、期間=過去 1 時間」など具体化
クエリ構文エラー PromQL の関数指定が省略されている rate(node_cpu_seconds_total[5m]) * 100 のように必須関数を明示

6-2. データソース認証エラー

  1. API キー/トークンの有効性 – Data source 設定画面で「Test & Save」を実行。
  2. ネットワーク接続 – Self‑hosted 環境では Prometheus がファイアウォールで遮断されていないか確認。
  3. ロール権限 – データソースに対し「Viewer」以上の権限が付与されているか再チェック。

6-3. 実践フロー:CPU 使用率・HTTP エラー率ダッシュボード作成例

  1. データソース登録(Prometheus)
  2. Assistant 有効化(Cloud または Self‑hosted)
  3. プロンプト入力

Prometheus の node_cpu_seconds_total を使い、過去 24 時間の CPU 使用率を時間系列グラフで表示してください。
同時に http_requests_total と status_code ラベルから 5xx エラー率を算出し、別パネルで同じ期間の折れ線グラフとして作成してください。各パネルにタイトルと単位(%)を付けてください。

  1. 生成結果確認 – 2 つのパネルが表示されたことを確認。
  2. クエリ・軸調整

  3. CPU パネル:rate(node_cpu_seconds_total[5m]) * 100 → Y 軸 0‑100 % 固定

  4. エラー率パネル:sum(rate(http_requests_total{status_code=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) * 100

  5. アラート設定(任意) – CPU 使用率が 80 % 超過したら Slack に通知。

  6. 保存・共有 – フォルダー Production/Observability に保存し、チームロール「Editor」以上に閲覧権限を付与。

7. 最終まとめ(要点)

  • バージョン確認:Grafana 10.2 以降で Assistant が利用可能。公式リリースノートで最新情報を取得してください。
  • ライセンス:Free プランはトライアルが提供されることがあるが、商用利用や長期運用には Pro/Enterprise の検討が必須です。
  • 導入手順:Cloud はワンクリック、Self‑hosted は grafana-assistant-plugin のインストールと [assistant] 設定で有効化。
  • プロンプト作成:目的・指標・期間・可視化タイプを明示し、具体的なメトリクス名を入れることで高精度生成が期待できます。
  • 生成結果の調整:冗長クエリの削減、Y 軸固定、アラート追加で実務に即したダッシュボードへ仕上げます。
  • セキュリティdata_sharing = false(オプトアウト)やローカル LLM デプロイで外部送信を制御し、フォルダー・ロール管理でアクセス権限を最小化します。

以上の手順とベストプラクティスに従えば、Grafana AI(Assistant)を活用した 「高速かつ安全な Observability ダッシュボード」 の構築が実現できます。


本稿は執筆時点の情報に基づきます。機能追加や設定項目の変更は頻繁に行われるため、導入前には必ず公式ドキュメント(https://grafana.com/docs/)をご確認ください。

スポンサードリンク

もっとスキルを活かしたいエンジニアへ

スポンサードリンク
働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

エンジニアの世界では、「いつでも動ける状態を作っておけ」とよく言われます。
技術やポートフォリオがあっても、自分に合う案件情報を日常的に見れていないと、いざ動こうと思った時に比較や判断が難しくなってしまいます。
普段から案件情報が集まる環境を作っておくと、良い案件が出た時にすぐ動きやすくなりますよ。
筆者自身も、メガベンチャー勤務時代に年収1,500万円を超えた経験があります。振り返ると、技術だけでなく「どんな案件や働き方があるか」を日頃から見ていたことが、キャリアの選択肢を広げるきっかけになりました。
このブログを読んでくれた方に感謝を込めて、実際に使っている情報収集サービスを紹介します。

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。


-Grafana