AWS Incident Detection and Response(IDR)は、AWSエンタープライズサポートのお客様向けに提供されるインシデント対応サービスで、重要なワークロードの中断を最小限に抑え、迅速な復旧を支援します。
主な特徴
- 24時間365日の監視と対応:AWSのインシデント管理エンジニア(IME)が、重大なアラームを24時間体制で監視し、発生から5分以内に対応します。
- カスタマイズされたレスポンスプラン:各ワークロードに合わせた事前定義のランブックと対応計画を策定し、迅速な問題解決をサポートします。
- AWSサービスイベントへの対応:AWSサービスの障害時にも、ワークロードへの影響を評価し、適切なガイダンスを提供します。
- インシデント後のレビュー:インシデント解決後、詳細なレポートを提供し、将来の障害防止策や対応手順の改善に役立てます。
利用の流れ
- オンボーディング:対象となるワークロードを特定し、IMEと連携してアラーム設定や対応計画を策定します。
- 監視と検出:CloudWatchアラームなどを通じて、ワークロードの状態を常時監視します。
- インシデント対応:重大なアラームが発生した際、IMEが迅速に対応し、復旧に向けたサポートを提供します。
- 事後分析:インシデント後、詳細なレポートを作成し、今後の改善策を提案します。
日本語対応
2024年10月より、AWS Incident Detection and Responseは日本語での対応が可能になり、日本語を話すIMEと直接やり取りができるため、スムーズなコミュニケーションが期待できます。