SRE
Site Reliability Engineer(ing)
Next, we focus on system reliability. Ben Treynor Sloss, Google’s VP for 24/7 Operations, originator of the term SRE, claims that reliability is the most fundamental feature of any product: a system isn’t very useful if nobody can use it! Because reliability is so critical, SREs are focused on finding ways to improve the design and operation of systems to make them more scalable, more reliable, and more efficient. However, we expend effort in this direction only up to a point: when systems are “reliable enough,” we instead invest our efforts in adding features or building new products.
DeepL.icon次に、システムの信頼性に注目します。SREという言葉の生みの親であるGoogleの24/7オペレーション担当副社長のベン・トレイナー・スロスは、「信頼性は製品の最も基本的な特徴である。信頼性が非常に重要であるため、SREはシステムの設計と運用を改善して、よりスケーラブルで、より信頼性が高く、より効率的なシステムにする方法を見つけることに重点を置いています。システムの信頼性が十分に高まったら、機能追加や新製品の開発に力を注ぎます。
more スケーラビリティ、信頼性、効率
信頼できるか否か ← これだけが計測指標
製品によって確保する
なんで信頼を重視するん?
使ってもらえないと価値ないから
使ってもらうのに信頼性が肝だから
ソフトウェアエンジニアに運用チームの設計を依頼したときにできあがるもの