ポストモーテム
実際に失敗した後から学ぶための取り組み
SREってその辺もカバーするんだmrsekut.icon
ポストモーテムの目的は、インシデントがドキュメント化されること、影響を及ばしたすべての根本原因(群)が十分に理解されること、そして、再発の可能性や影響を削減するための効果的な予防策が確実に導入されるようにすることです。ポストモーテムには次のような事が書かれます。
発生したこととその影響範囲
その緩和や解消のために行われたアクション
根本原因
再発防止策
GPT-4.icon
ポストモーテム(Postmortem)とは、インシデント(障害・事故・失敗など)が発生した後に、その原因や影響、対応状況、再発防止策を振り返るプロセスです。
日本語では「事後検証」「障害報告」「振り返り」とも呼ばれますが、IT業界では「ポストモーテム」という言葉がそのまま使われることも多いです。
ポストモーテムの目的
再発防止:根本原因を特定し、同様のインシデントを防ぐ
組織学習:失敗から学び、チームや会社の知見を蓄積する
透明性の確保:関係者にインシデントの全貌を正しく共有する
心理的安全性の醸成:「個人責任を問わない」文化を作り、率直な共有を促す
一般的なポストモーテムの構成
table:_
項目 内容
概要 発生したインシデントの簡単な説明
影響範囲 どのサービス・ユーザーに影響があったか
タイムライン 発生〜検知〜対応〜復旧までの時系列
原因 直接原因、根本原因
対応内容 実際に取ったアクション
再発防止策 改善点や次に向けた取り組み
学び 今回のインシデントから得た教訓