ポストモーテム
ポストモーテム集
重大事故の時にどうするか
優れたポストモーテムに含まれる項目
Gitlabのフルリモート障害対応
freeeの障害訓練
2022年5月6日 アトラシアンのインシデント対応
なぜ我々はsession.cookieを変更しなければならなかったのか - BASEプロダクトチームブログ
【汎用ソフトスキル】本番障害対応のやり方
反省会
報告が必要になる
障害粒度
を決めておく
データが消失した
無応答時間
が閾値を超えた
レビューで、障害の原因に対して批判しない
ポストモーテムを上げる頻度でその人(チーム)を評価しない
上げることが偉い
どうすれば改善できるのかを考える
ポストモーテム実施で注意すること
人の非難はしない
ふるまい、行動を振り返る
時間をあけずに行う
忘れてしまう
判断に迷ったことも振り返る
「エラーメッセージが読みにくかった」など
/gosyujin-books/0210: システム障害対応の教科書 00.pdf#625ac2cb2c53d800006e0406