SRE
Site Reliability Engineering
SREは領域が広いので自分のSREに対するアプローチを明確にする必要がある。
ユーザにどういう側面で貢献するか、から考えてみる。
システム - Reliability
いつでも使える - Availability
可用性 - High availability
クラスタリング
障害復旧 - Resiliency
Let it crashの話
Erlang on BEAM
Akka in Scala
軽快に使える - Reactiveness
性能 - Performance
システムパフォーマンスを測る
使いやすさ - UX with users' mental model friendly(?)
すぐに問題が解消される - Rapid feedback
問題検知 - Monitoring
時系列データ解析・予測
原因特定 - Diagnosis
外部要因により起きうる想定しないルートの作り込み
対処適用 - Providing patch
ここは純粋に開発力だと思うがコンパイラや検査ツールの支援で向上できる品質がある
CI
Automated test - TABOK
メリットのあるテスト
必要なところをテスト
テスト容易性
導入 - Smooth deployment
簡単なデプロイ
Kubernetes