Contents
Datadog Web UI へのログインと Monitors 画面への遷移
Datadog にアクセスしたら最初に行うのが認証です。組織で採用している SSO(SAML、Okta、Azure AD 等)やローカルアカウントの方式に応じた手順を把握しておくと、ログインエラーによる作業遅延を防げます。また、ログイン後すぐに Monitors 画面へ移動できれば、監視設定の作成・確認がスムーズになります。本セクションでは、実際の操作フローと注意点を解説します。
シングルサインオン(SSO)でのログイン手順
SSO を利用している場合は以下の流れで Datadog に入ります。
- ブラウザで
https://app.datadoghq.com/にアクセスする。 - 「Sign in with SSO」 ボタンをクリックし、組織が設定した IdP(Identity Provider)の認証画面へ遷移させる。
- ユーザー名・パスワード、必要に応じて MFA を入力して認証を完了すると、Datadog のホームダッシュボードが表示される。
ポイント:SSO 利用時はブラウザのポップアップブロックやサードパーティ Cookie が原因で認証画面が正しく開かないことがあります。事前に「ポップアップを許可」「サードパーティ Cookie を有効化」しておくとトラブルを回避できます(※公式ドキュメント: SSO 設定手順)。
左サイドメニューから Monitors へアクセスする方法
Datadog の UI は左側に固定されたサイドバーがあり、そこから主要機能へ素早く遷移できます。
- サイドバーの 「Monitors」 アイコン(ベルマーク)をクリックする。
- URL が
https://app.datadoghq.com/monitorsに変わり、モニター一覧ページが表示される。 - 画面右上の 「New Monitor」 ボタンから新規作成ウィザードへ進める。
ポイント:Monitors へのアクセスはロールベースで制御されています。閲覧・編集に必要な権限(例:
monitor_write)は、Datadog の Team Settings → Permissions で事前に確認してください(公式ドキュメント: Access Control)。
モニター作成時のタイプ選択と推奨シナリオ
Datadog では Logs、Metrics、Trace の 3 種類のモニターが提供されており、監視対象に応じた最適な設定を選ぶことが重要です。本セクションでは各タイプの特徴と典型的な利用シーンをまとめます。
Types と推奨シナリオ(表形式)
| タイプ | 主な対象 | 推奨シナリオ |
|---|---|---|
| Logs | アプリケーションログ・システムログ | エラーメッセージや特定キーワードが出現した瞬間に即時通知したい場合 |
| Metrics | カスタムメトリクス、インフラ指標(CPU、メモリ等) | 時系列データの閾値超過・異常検知を行う際に使用 |
| Trace | 分散トレース(APM) | エンドポイントのレイテンシが一定時間以上続く、もしくは例外率が上昇したときにアラート |
ポイント:Logs モニターは文字列検索が高速で、開発者が直感的に条件を設定しやすい点が利点です(公式ガイド: Log Monitors)。
新規モニター作成ウィザードの概要
Datadog の「New Monitor」ボタンから開始されるウィザードは、以下の 3 ステップで構成されています。
- モニタータイプ選択 – 「Choose a monitor type」画面で Logs / Metrics / Trace のいずれかを決定する。
- スコープと条件設定 – 選択したタイプに合わせて Scope(対象ホストやタグ)と Alert Conditions(閾値・評価期間)を入力。
- 通知先の登録 – 必要なチャネル(メール、Slack、PagerDuty など)を追加し、メッセージテンプレートをカスタマイズする。
「Select monitor scope」でのクエリ設定と「Set alert conditions」の構成
クエリ入力画面への導入文
Select monitor scope では監視対象となるログやメトリクスを絞り込む検索クエリを記述します。正しい構文で記述しないと、期待したデータが取得できずに無駄なアラートが発生する可能性があります。
ログ検索クエリ例(status:error AND @service:api AND @env:production)
- 「Define the search query」フィールドへ上記のように入力する。
- Run query ボタンでプレビューを確認し、ヒット件数やサンプルログが期待通りか検証する。
参考:Datadog の公式検索構文は
@attribute:value形式です(Log Search Syntax)。
アラート条件設定画面への導入文
Set alert conditions では「何件以上でアラートとするか」や「評価期間はどのくらいにするか」を決めます。最低でも 1 条件は必須です。
| 設定項目 | 説明 |
|---|---|
| Threshold type | 数値(count)またはパーセンテージ(percentage)を選択 |
| Alert threshold | 例: 5 件 / 5 分 のように閾値と単位を指定 |
| Evaluation window | データの評価期間。短すぎるとノイズ、長すぎると遅延の原因になる |
設定サンプル
- Alert when:
count > 5(過去 5 分間にエラーが 5 件以上) - Warning when:
count > 3
ポイント:評価期間はログ生成頻度と合わせて設定することが重要です。公式ガイドの「Evaluation windows」章を参照してください(Alert Conditions)。
通知先登録とメッセージテンプレートのカスタマイズ
各通知チャネルの設定手順導入文
Datadog のモニターは メール、Slack、PagerDuty など複数のチャネルへ同時に通知できます。ここでは代表的な 3 つの設定方法を簡潔にまとめます。
| チャネル | 設定手順 |
|---|---|
| メール | 「Add notification channel」 → Email を選択 → 送信元アドレスと受取人(CSV 可)を入力 |
| Slack | Slack アプリ連携画面で「Add to Slack」をクリックし、表示される Webhook URL を貼り付け |
| PagerDuty | Integration Key(サービスごとのキー)を取得し、同様に「Add notification channel」から登録 |
ベストプラクティス:Critical レベルは PagerDuty のみ、Warning は Slack とメールの組み合わせといった 重大度別ルーティング を設計すると、インシデント対応が効率化します(参考: DevelopersIO 記事「Datadog での通知設計」)。
メッセージテンプレートに関する注意点導入文
通知メッセージは受取側の可読性と自動処理を考慮して作成します。ここでは公式が推奨する変数展開と、2026 年 Zenn 記事で紹介された実務テクニックを併せて解説します。
1. 公式ドキュメントでサポートされている構文
Datadog の通知テンプレートでは {{variable}} 形式の プレースホルダー が使用可能です。優先度を上書きするための専用構文は提供されていません(過去に非公式で紹介された {{override_priority}} は現在サポート外)。代わりに {{priority}} 変数 を利用して、Datadog が自動的に割り当てた重大度を参照できます【公式: Notify your team】。
|
1 2 3 4 5 |
{{#is_alert}} ⚠️ *Critical* alert on {{host.name}} {{/is_alert}} Priority: {{priority}} <!-- 例: P1, P2 ... --> |
2. 可読性向上テクニック(Zenn 2026 年記事)
- Markdown 整形:
*bold*、、リストで情報を階層化。code - 絵文字プレフィックス:Slack 等では先頭に絵文字を付けると視認性が向上する(例:
:rotating_light:)。 - 行ごとの変数展開:
{{value}},{{host.name}},{{timestamp}}を使い、動的データを明示的に表示。
サンプルテンプレート(Slack 用)
|
1 2 3 4 5 |
:rotating_light: *[{{alert_status}}]* {{service.name}} のエラーが増加しています。 - 発生件数: `{{value}}` 件 (過去 {{evaluation_window}}) - 対象ホスト: `{{host.name}}` Priority: {{priority}} |
「Export Monitor」から取得できる JSON の管理方法
JSON エクスポート手順導入文
モニター設定をコードとして扱うことで、変更履歴や環境間の差分を可視化できます。Datadog は UI 右上の 「Export Monitor」 ボタンから現在の設定を JSON 形式で取得できるため、Git 等でバージョン管理すると便利です。
- 作成・編集したモニター画面右上の 「Export Monitor」 をクリック。
- 表示された JSON をコピーし、ローカルまたはリポジトリ内に
monitor_<名前>.jsonとして保存する(例:monitor_api_error.json)。
参考:JSON の構造は公式ドキュメントで詳述されています(Export / Import Monitors API)。
Git でのバージョン管理フロー例導入文
以下は JSON を Git リポジトリで管理する際の基本的なワークフローです。コードレビューを通すことで、誤設定や意図しない変更を防げます。
|
1 2 3 4 5 6 7 8 9 10 11 12 |
# 1. 作業ブランチ作成 git checkout -b feature/add-api-error-monitor # 2. JSON をリポジトリに追加・編集 vi monitor_api_error.json # query, thresholds, notifications など必要箇所を修正 # 3. コミット git add monitor_api_error.json git commit -m "Add API error log monitor (JSON export)" # 4. プルリクエスト作成 → レビュー → main にマージ |
JSON 編集時の注意ポイント
queryフィールドはログ検索構文に完全準拠させる。thresholds配列内のwarningとcriticalそれぞれにvalueとalert_typeを正しく設定。notificationsに記載するメッセージは上記テンプレートと同様に変数展開が可能で、{{priority}}を利用できることを確認。
ベネフィット:IaC(Infrastructure as Code)化されたモニターは CI パイプラインで自動デプロイでき、環境間の一貫性が保たれます(公式ガイド: Monitor as code)。
運用チェックリスト:設定確認・重大度別ルーティング・トラブルシューティング
動作確認テスト手順導入文
モニターを本番環境に適用する前に、意図した通りに動作するか検証します。以下のステップでログ投入から通知まで一連の流れをテストしてください。
- 手動で対象ログを生成:例)
logger "status:error @service:api test"を対象サーバで実行。 - Datadog の Live Tail 画面でクエリがヒットするか確認。
- モニター設定画面の 「Test Notification」 ボタンを押し、Slack / メールへテストメッセージが届くことを検証。
重大度別ルーティング設計導入文
アラートの重要度に応じた通知先を分けることで、担当者の負荷を抑えつつ迅速な対応が可能になります。以下は一般的なルーティング例です(参考: DevelopersIO 記事「Datadog で効果的なアラート設計」)。
| 重大度 | 推奨通知先 | 補足 |
|---|---|---|
| Info | Slack #monitor-info |
デバッグ目的、障害とみなさないケース |
| Warning | メール(チーム全体)+Slack #alerts-warn |
早期検知・対処を促す |
| Critical | PagerDuty の on‑call エンジニア + Slack #alerts-crit |
即時エスカレーションが必要 |
ベストプラクティス:各重大度で別々のテンプレートを用意し、
{{priority}}変数で自動的に優先度を付与すると運用コストが削減できます。
トラブルシューティングチェックリスト導入文
設定ミスや外部要因でモニターが期待通りに機能しないことがあります。下表はよくある障害と対処法です。
| 現象 | 原因例 | 対策 |
|---|---|---|
| クエリがヒットしない | 属性名・スペルミス、タグ未付与 | Live Tail で実際のログを確認し、@attribute:value が正しいか検証 |
| 評価期間とログ生成間隔がずれる | 評価ウィンドウが短すぎる | Evaluation window をログ出力頻度に合わせて伸ばす |
| 通知遅延 / 送信失敗 | Slack のレートリミット、PagerDuty キー誤り | 各チャネルのステータスページでエラーログを確認し、キーや URL を再設定 |
| JSON 変更が反映されない | エクスポート後に「Import Monitor」せずに保存しただけ | Export → 編集 → 「Import Monitor」で再適用し、UI 上のバージョンが更新されたことを確認 |
まとめ
- ログイン→Monitors 画面への遷移 は SSO 設定とサイドバー操作でシンプルに完了でき、権限チェックは必ず事前に実施。
- モニタータイプ(Logs / Metrics / Trace) を用途別に選択し、ウィザードの各ステップで正しいクエリ・条件を設定すれば、効果的な監視が構築できる。
- Select monitor scope では公式検索構文に沿ったキーワードを書き、Set alert conditions は最低 1 条件+適切な評価期間を忘れずに入力。
- 通知先はメール/Slack/PagerDuty に登録し、
{{priority}}を用いたテンプレートで可読性と自動エスカレーションを実現。 - Export Monitor から取得した JSON は Git 管理し、Pull Request のレビューで変更点を追跡すれば IaC としてのメリットが最大化する。
- 運用チェックリスト を活用し、手動テスト・重大度別ルーティング・トラブルシューティングを体系的に実施すれば、安定したアラート運用が可能になる。
本稿のサンプル JSON と設定例を参考に、ぜひ自社環境で Datadog Monitors を作成・管理してみてください。質問や不明点があれば Datadog の公式サポートまたは社内 SRE チームへお問い合わせを。