SRE
Site Reliability Engineering
システム管理とサービス運用に対するアプローチ
「信頼性」をシステムの重要な機能の1つと位置づける
信頼性向上のために、手作業してた箇所をコード化したりする
e.g.
IaC
Googleが提唱
Ben Treynor Sloss
このへんをやる
コードのデプロイ
設定
監視
サービスの可用性
遅延対応
変更管理
緊急対応
容量管理
etc.
https://sre.google/books/
/herp-technote/HERPにおけるSRE実践のこれまで 2023年版
https://qiita.com/t2y/items/99e40560a67b76ea1ff5
https://qiita.com/Hassan/items/6f7fb1c206f77716ee2a
https://blog.ytake.jp.net/entry/2023/08/27/180000
『SREの探求』
https://blog.yuuk.io/entry/2023/srenext2023
SREの現場から
技術評論社
の連載
https://gihyo.jp/list/group/SREの現場から
https://speakerdeck.com/nago/srenoshi-shi-toha