SRE
SRE ≠ インフラエンジニア
いやマジでこの勘違いしてる会社多いと思うぞ
SRE のお仕事
そもそも SRE(Site Reliability Engineering/Engineer)の仕事とは「Web サイトの『信頼性』を保つこと」すなわち「プロダクトがいつでも使える状態を保つこと」
SRE はプロダクト、開発者、運用者、ビジネスが密結合になった DevOps という文化のもとはじめて生まれてくる 計画
プロダクトに利用するツール・手法の選定、スケジュールの調整
開発
SRE の「目的」を達成するのに必要なライブラリ・ツールの選定を開発者たちと突き合わせる
CI/CD ツールを用いたコードのテスト・ビルド・デプロイの自動化
構成
クラウドインフラの自動化・コード化
監視
プロダクトの状態を継続的に監視しビジネスにフィードバックする
CI/CD、構成当たりに目がいきがちだが一番重要なのは監視である
「プロダクトをいつでも使えるようにする」という目的達成には定量的に議論を行うため数値が必要で、その数値はある程度理論付けられた監視から得られる
すなわち監視はビジネスの決定に直結する
したがって SRE は開発と密接な関係を持ち、かつプロダクトのドメイン知識に理解がないと行うことが出来ない