SRE というチームを発足する時に僕だったらまず何を考えるんだろう
そもそもSREってなんだろう?
ウェブサイトの信頼性を担保することが仕事なのはわかる。そして信頼性というと結局ウェブサイトが落ちないか、そこがメインになる気がする。もうちょっと抽象的に言うと「ウェブサイトが正常に使えることを担保する」ということになるのかな
そこを目指すために色々なことをする。そして基本的には守りの仕事になる。
よくあるのはSLAとかSLOとかウェブサイトの信頼性を定量化し、そこで定量化した指標をどうにかして守りに行く仕事になるんだと思う。でもそれ以上に実際の仕事ってなると多岐にわたるよね。
インフラ周りの設計構築とかオペレーションが回ってくることもあるし、セキュリティ周りの仕事が回ってくることもある。コードを書くこともあればQAの領域をやることもあるんじゃないかな?
というのでSREと一言でいっても実際に何やるかってめちゃくちゃ変わるよね
それに加えてその会社が toB か toC かによっても違うし、、、
と色々書いてみたけど大体方向性としては似たようなことになるんじゃないかな?
下記2つ?
サービスの可用性
セキュリティ
この2つをどうにかするための活動がほとんどになる、、、気がする
一応定義としては DevOps も入っているらしいのでそれ含めてやるべきではあるらしい