SRE
Site Reliability Engineeringの略称
役職をDev(開発)とOps(運用)に分けてしまうとよくない
Opsつまり純粋なインフラエンジニアの給料査定は、エラーの少なさ、サービス停止時間の短さで決まってしまう Opsが自分の給料を最大化するには
Devが出してくる新機能を全て拒絶するとよい
実装に文句言って却下すればするほど給料が上がる!!
これもう人事評価基準として意味ないよね
サービスの進化が止まってしまう
サービス毎にエラーを起こして良い割合を決める
エラーの割合を「予算」と考え、毎期使い切る事を目標にする
エラーが多いのはOpsとしての責任を果たせていないが
エラーが少なくても、新機能にチャレンジしていない
ストレージサービスのエラー予算は極小
メールサービスもかなり小さいだろう
例えばGoogle Mapのタイル1つが欠ける程度なら、そんなにエラー率は気にしなくていいかもしれない?shokai.icon
ストレージやメールと違ってリロードすればいいし
というわけで、一定量のエラーを毎期必ず出せ、という人事評価制度らしい 導入事例