Gitlabのフルリモート障害対応
オペレーションミスにより本番データベースの大半を消失(2017/01/31)
約6時間前のスナップショットをリストアし、復旧(2017/02/01)
スナップショットより後の6時間分のデータは消失してしまった
バックアップの問題は色々あったけど、それは一旦置いといて…
これは機能していた
それとは別にたまたま6時間前のものがあった
エラーが出ていて取れていなかった
データベースは対象外だった
機能していなかった
障害対応に置ける透明性が高く評価された
Twitter
Google Doc
YouTubeでライブ配信
フルリモートワークでも障害対応は可能であるということが具体例をもってわかった
メンバーのタイムゾーンも異なる