MTTR
from Four Keys
Time to restore service_、平均修復時間_
サービス復旧までの時間
障害が発生したときに、どれくらい早く復旧できるか
短いほど運用の信頼性が高い
Incident Management (dd)の場合は、インシデントが復旧したタイミングでResolvedにしないといけないってことかmrsekut.icon
datadog
定義: 「劣化を引き起こしたchangeとその修復(rollback or rollforward deployment)までの期間」
こっちはfailureイベントが必要。なので:
その期間に1件もchange failureが検出されなければ、そもそも算出対象なし(N/A表示)
0でなく「データなし」になるイメージ
/mrsekut-book-4295004901/054