重大事故の時にどうするか
2. キックオフが重要
3. チームをわける。そしてチーム毎に一人だけチームリーダをつくる
5. ホワイトボードを用意
6. 食い物と睡眠も復旧対策
7. 広報はユーザーファーストに
9. トップは帰ってはいけない
3. チームをわける。そしてチーム毎に一人だけチームリーダをつくる
以下のように定時連絡をものすごく細かく行っていた障害対応を見た記憶があるんだが、何のサービスだったか思い出せない 「Xという障害が発生しました。詳しくは原因を調査中です。次の連絡はA時です」
「引き続き原因を調査中です。次の連絡はB時です」
「今回は特に報告はありません。次の連絡はC時です」
「Yに原因があると判明しました。対策を検討中です。次の連絡はD時です」
定時報告の場はTwitterだった気がする
これは良い報告
これ以外は当時者じゃないと中々わからない