Contents
導入(この記事で得られること)
オンコールでスマホから迅速に状況把握と初動対応を行いたいSRE/DevOps向けに、Datadog モバイルアプリ 使い方 ガイドを実務的にまとめます。インストール、認証、通知設計、モバイルでのトリアージ手順、セキュリティ注意点まで、すぐ使える手順と運用例を提示します。Datadog モバイルアプリ 使い方 ガイドとして現場で使えるチェックリストも含みます。
Datadog モバイルアプリ クイックスタート(3ステップ)
まずは最低限の準備でオンコール対応ができる状態にします。短時間で導入→通知確認→バックアップ経路の検証まで完了できる手順を提示します。
クイックスタートの手順
短い手順で導入から確認まで終えます。
- アプリをインストールしてサインインする。通知許可とバックグラウンド更新をオンにします。
- モバイル受信用に重要モニターを絞る(例: Critical / prod)。テスト通知で受信確認します。
- バックアップ経路(PagerDuty/Slack/メール)を設定し、実際にエスカレーションテストを実行します。
Datadog モバイルアプリの対応端末とダウンロード方法
対応端末と配布方法を明確にして、組織ポリシーに沿って導入してください。ストアの要件や権限説明は随時変わるので必ず各ストアの記載を確認してください。
対応端末の確認
アプリはiOSとAndroid向けに提供されています。まずは公式ストアで「Datadog」を検索し、配布ページの「互換性」や「要件」を確認してください。以下はストア検索へのリンクです(検索結果から公式アプリを選択してください)。
- App Store(検索結果): https://apps.apple.com/jp/search?term=Datadog — 公式アプリのストアページへ移動して要件確認を行ってください。
- Google Play(検索結果): https://play.google.com/store/search?q=Datadog&c=apps — Play ストアで同様に確認してください。
必要なOSとアプリバージョンの目安
要件は変動しますが、実務上の目安を示します。最終的にはストア記載の要件を優先してください。
- 目安: iOS 13以上、Android 8.0以上を想定すると多くの機能が利用可能です。
- 推奨: 端末は主要ベンダの最新安定OSへできるだけ近づけることを推奨します。
- 配布: 組織配布(MDM)を使う場合は、MDMポリシーに沿って事前承認・配布を行ってください。
Datadog モバイルアプリのインストールと初回ログイン手順
インストール後に起きやすいつまずきを回避するため、代表的な画面遷移と対処法を示します。SSOやMFAに関する注意点も含めます。
ログイン方法(メール/SSO/2段階認証)
サインイン操作とトラブル対処の流れを具体的に説明します。画面名称やボタン名はアプリ版・言語設定で変わる場合があります。
- 操作の流れ(代表例): アプリ起動 → 「Sign in / サインイン」→ メールまたは組織ドメイン入力 → SSOを選択すると外部ブラウザへ遷移 → 組織の認証画面で承認 → アプリに戻る。
- MFA(TOTP/SMSなど)を使う場合は端末時刻の同期を確認してください。TOTPの誤差は時刻ズレが原因になることが多いです。
- ログインに失敗する場合は、端末のブラウザ設定(ポップアップやCookie)や組織側のIdP設定を確認し、必要なら管理者へ連絡してください。
- サインアウトやトークン失効の挙動は組織ポリシーで異なります。ログアウト後も端末にトークンが残らない運用(Keychain/Keystoreの利用と明示的な破棄)を推奨します。
初回起動時の端末側設定確認
通知とバックグラウンド処理が動作しないと受信に影響します。OSごとの主な設定項目を確認してください。
- iOS: 「設定」→「通知」→「Datadog」で通知を許可します。加えて「設定」→「一般」→「Appのバックグラウンド更新」でDatadogを有効にしておきます。低電力モード中はバックグラウンド更新が制限されます。
- Android: 「設定」→「アプリ」→Datadog→「通知」を許可します。バッテリ最適化(Battery optimization)や自動起動設定でアプリが停止しないよう例外登録が必要な端末があります(Xiaomi/Huawei等で要注意)。
- ネットワーク: モバイルデータや企業ネットワーク(VPN/プロキシ)によって通知がブロックされる場合があります。必要ならネットワーク管理者に確認してください。
Datadog モバイルアプリ:通知最適化とモニター設定
モバイルはノイズ耐性が限られるため、通知は厳選して送る運用が重要です。ここでは受信対象の選定と外部連携の使い分け方を実務的に示します。
モニター選別とフィルタリング戦略
何をモバイルに送るかは明確に定義してください。具体的なフィルタリング手順と実務ルール例を示します。
- 方針例: モバイル受信は「Critical 相当のアラート」や「プロダクションの重大インシデント」に限定します。WarningやInfoはSlackやメールへ流す運用が多いです。
- Web UIでの具体例(操作イメージ): Datadog → Monitors → 該当モニターを選択 → Edit/Optionsで評価ウィンドウ(評価期間)や発生回数(occurrences)を設定し、短時間のスパイクで発報しないようにします。表示名や通知メッセージにエスカレーション手順を明記します。
- グルーピング/統合: 同一原因で複数のモニターが発報する場合は、複合モニターやグルーピング設定で誤検知を減らします。
- テスト: 変更後は必ずテスト通知でモバイル受信を確認します。テストは本番対象に影響を与えない専用のテストモニターを使うと安全です。
外部連携の扱い(PagerDuty・Slack等の使い分け)
各チャネルの役割を決め、モニター通知に反映してください。組織の体制に応じたポリシーが必要です。
- 役割分担(一例): Critical → Datadogプッシュ+PagerDuty(電話orSMSで確実に呼び出し)/ Warning → Slack(チーム内トリアージ)/ Info → メール(記録用)。これは一例として取り扱ってください。
- 設定手順(概略): DatadogのIntegrationsからPagerDutyやSlackを追加し、モニターの通知欄に連携先(PagerDutyサービス名やSlackチャンネル)を指定します。モニターごとにエスカレーション配列を作成する運用が有効です。
- 運用判断の指標: 電話や即時応答が必要か(PagerDuty)、チームで調査共有すれば良いか(Slack)を基準に決定します。
モバイルでのトリアージ実務フロー
受信から初動、エスカレーションまでのスマホでの実行手順を具体化します。画面遷移とボタン名の想定表記を示し、モバイル上でやるべきことと制約を明確にします。
ダッシュボード閲覧とアラート詳細の読み方
モバイルでも状況を短時間で把握できるように情報の優先順を示します。UIの想定表記はバージョンやローカライズで異なる点に注意してください。
- 通知を受け取ったら通知本文で「サービス名・重要度・発生時刻・対象ホスト/タグ」を把握します。まず「何が」「どこで」「いつから」を確認します。
- アプリでの遷移例(想定): 通知タップ → アラート詳細画面(Alert / Incident details) → 上部にサマリ(ステータス、開始時刻、対象タグ) → グラフや主要メトリクスを確認 → 下部にアクションボタン(Acknowledge/Resolve/Silence/Add comment/View logs/View trace)。ボタン名は英語表記と推定日本語訳を併記しています。
- ログ/トレース閲覧: 通知やアラート詳細から「View logs(ログを表示)」や「View trace(トレースを表示)」へ遷移できます。モバイルではサマリ表示やサンプル確認が主で、深い解析はWebに遷移して行うことが現実的です。
トリアージ時の判断基準と初動アクション例
安全かつ迅速に一次対応を決めるための判断基準と実行例を示します。
- 判断基準の例: ユーザー影響の有無、SLOの即時違反、影響範囲(全リージョン/一部)、再現性、直近のデプロイ有無。
- 初動アクション例:
- 低コストの一次対応: Acknowledge(担当が把握)・サイレンス(短時間の通知抑止)・コメント追加。
- 即時対応が必要な場合: PagerDutyでエスカレーションして関係者を招集。
- 可逆的な対処が許容される場合: 一時的なスケールアウトやサービス再起動(組織のRunbookに従う)。
- デプロイ直後の異常ならロールバックやデプロイ停止を検討。
- 記録: モバイルからでもインシデントのタイムラインへ短いコメントを残す習慣を付けると後続対応が速くなります。
運用ルール・セキュリティ・トラブルシュートとチェックリスト
セキュリティ要件と日常運用、よくある障害の対処法、オンコール前チェックを整理します。サポートへの問い合わせに必要な情報も具体的に示します。
セキュリティとアクセス管理の推奨
モバイル特有のリスクに配慮した運用設計を行ってください。
- 認証: SSO(SAML/OIDC)+MFAを標準化します。個別パスワードは可能な限り避けます。
- 権限設計: 最小権限のロール設計を行い、モニター編集や通知設定は限定ユーザーのみ許可します。
- MDM: MDMでパスコード強制、リモートワイプ、デバイス暗号化を設定してください。紛失時の対処が容易になります。
- トークン運用: モバイルで長期有効なAPIキーを置かない設計にします。短期トークンやセッションベース、Keychain(iOS)/Keystore(Android)での安全な保管を推奨します。トークンは定期的にローテーションし、不要になったら即時失効させます。
- スクリーンショットと機密情報: スクリーンショットは端末やクラウドに残るリスクがあります。共有時はAPIキーや認証情報を必ず伏せるか、可能ならスクリーンショットの提出を避け、アプリや端末が出力する診断ログを利用してください。
よくあるトラブルと対処法
発生頻度の高い問題と優先的な確認ポイントを挙げます。簡潔な手順で復旧可能にします。
- 通知が届かない場合: アプリの通知許可、バックグラウンド更新、バッテリ最適化の例外設定、端末のDo Not Disturb、ネットワーク(VPN/プロキシ)を確認します。モニターがサイレンスやダウンタイムになっていないかも確認します。
- ログイン障害(SSOエラー/MFA失敗): 外部ブラウザでのリダイレクト許可、Cookie設定、時刻同期を確認してください。組織側のIdPログも参照します。
- 権限不足で操作できない: Datadogの組織管理画面でロールを確認し、管理者に権限変更を依頼してください。
- アプリの不具合/クラッシュ: 最新版へ更新、端末再起動、再インストールを試してください。解消しない場合はログ取り(Android: adb logcat 等、iOS: デバイスコンソール)してサポートへ提出します。
オンコール前の実践チェックリストと非常時ショートフロー
オンコール直前に確認すべき項目と、受信から対応までのショートフローを示します。
- チェックリスト(オンコール開始前)
- アプリがストアの最新版であること。
- 通知許可、バックグラウンド更新が有効であること。
- 主要ダッシュボードをお気に入り登録していること。
- モバイル受信用モニターが適切に絞られており、テスト通知で受信を確認済みであること。
- PagerDuty/Slackなどバックアップ通知経路が設定され、オンコール連絡先が最新であること。
-
Runbookと連絡先へのアクセス手段が手元にあること。
-
非常時ショートフロー(受信→対応の簡潔版)
- 通知を確認し、重要度と影響範囲を判断する。
- モバイルで主要メトリクスとログサマリを確認する。
- 一次対応が可能なら実施(再起動、スケール、一時サイレンス)。
- 必要ならPagerDutyで正式エスカレーションし関係者を招集する。
- 対応内容をインシデントに記録し、後続分析へ引き継ぐ。
FAQ(権限・機能制限の確認方法とサポート窓口)
権限や機能の限界確認と、サポートへ問い合わせる際の準備を記載します。
- 権限確認: Datadog の管理画面(Organization → Team/Users → Roles)でロールと権限を確認してください。編集や通知設定は管理者に依頼します。
- サポート問い合わせの手順(推奨項目):
- 問題の概要と再現手順を明記する。
- 使用中のアプリ版(アプリ内の「About」等で確認)、OSバージョン、端末モデルを添える。
- 可能なら端末の診断ログ(Androidのlogcat、iOSのデバイスコンソール)やサーバ側の関連ログを添付する。機密情報は必ず伏せるか編集してください。
- Datadogのサポート窓口やドキュメントを参照してから問い合わせると対応が早くなります。
- 参考窓口・ドキュメント: Datadog 公式ドキュメントやヘルプセンターを優先して参照してください(参考リンクは下部にまとめます)。
参考リンク(目的を明示)
以下は参照に有益な公式ページや技術記事です。リンク先の用途を明記しています。
- Datadog モバイルアプリのご紹介(公式ブログ・機能概要): https://www.datadoghq.com/ja/blog/datadog-mobile-app/
- Mobile Application Testing(Datadog Docs・モバイルテスト機能): https://docs.datadoghq.com/ja/synthetics/mobile_app_testing/
- Datadog 公式サイト(ドキュメントトップ/統合設定): https://www.datadoghq.com/
- Datadog サポート/ヘルプ(ヘルプセンター・チケット登録): https://help.datadoghq.com/
- 導入レビュー(技術記事・事例): Qiita / Classmethod 等(導入感想や運用Tipsが参考になります)
まとめ
最後に本ガイドの要点を短く整理します。導入と運用で最も重要なポイントに絞って記載します。
要点
- Datadog モバイルアプリは「通知での即時把握」と「サマリ確認」に優れるが、深い解析はWebを併用する運用が現実的です。
- モバイル通知は厳選して送ること。Criticalのみプッシュ、WarningはSlack、Infoはメールなど運用ルールを定めてください(運用例は一例です)。
- 初回はアプリの通知許可・バックグラウンド更新・お気に入りダッシュボード・テスト通知の受信確認を必須にしてください。
- セキュリティはSSO+MFA、最小権限、MDM、トークンの短寿命化と鍵管理(Keychain/Keystore)で担保してください。
- 問い合わせ時はアプリ版・OS・端末・再現手順・ログを揃えてサポートへ連絡すると解決が速くなります。