SRE
SREのお仕事を大雑把に表現すると、サービス開発者が作成したアプリケーションを、動かす環境を用意し、安全・効率的に動かし続けることだと思っています。
構築
今:クラウドの準備、OSイメージの作成、アプリの稼働
運用
どのようなメトリクスがあり、何が正常なのかを理解する
アラートの整備
エラーログ・遅い処理を減らす
外部環境が遅かったりする
アプリケーション内容を理解していないとできない
トラフィックを発生させることはそんなにもずかしくない
SREにとっては、数少ないクライアントの理解のチャンス
経営的観点でプレッシャーが最もきつい
一口に費用試算といっても色々あり、
既存リソースを『構築』の工夫や『運用』の観測によりコスト削減を図る切り口や、
新規リソースを『負荷試験』により最適なコスト投入に導くこともできます。
インフラ的観点
アプリ的観点
CPU処理量を減らすコードにする
ダウンロード量の削減
サービスの品質を満たしたまま安くする、ということは、適用前よりレスポンス速度が下がることはないし、障害率も下がらないけど、コストだけ下げるということです。これだけ見たらそんな都合のいい話があるわけねーって思える文ですが、システム全体の仕組みや状況を把握していけば、このクラウド時代ならではで、けっこう調整や工夫によって実現できるものです。