入門 監視
https://www.oreilly.co.jp/books/9784873118642/
監視とは、大きな問題の塊である
一つのツールで解決できるものではない
専用のツールを組み合わせて解決する
役割としての監視を作らない
アプリケーションに一番詳しいのは、アプリケーションエンジニアである
スキルとしての監視
監視ツールを提供する専門チームはあっても良いが、全員が監視に責任を持って、デザインをしていくこと
動いているかどうかを監視する
システムが「動いている」とはどういう状態か
ユーザーに近いところから監視をする
ユーザーはシステムの詳細を気にしない
低レベル(OS) のメトリクスは、アラートに値しない。CPUが高負荷であってもユーザーにとって動いていれば問題はない
ただし、診断やパフォーマンス分析には重要なのでとっておくことは大事
ツール選び
成功したチームのツールをみて、盲目的に信仰しない
自分たちのあったツールを慎重に選ぶ
感想
監視というと、色々な勘所があって、色々なメトリクスの見方を知っていて…というイメージがあり、経験がない自分にはどうすればいいかわからない、というハードルがあった
「動いているかどうかを監視する」というのは、良い気づきを与えてくれた基準であり、こういう考え方であればうまく実践していけそうに思えたし、実際の効果も高いだろうと思う。
「役割としての監視」についても、共感があった。チームの全員が、アプリケーションの運用に関心を持ち、責任を持ち、改善のために動ける、というチームは素晴らしいと思う
基盤チーム(自分)としては、良いツールを提供する、良い相談役になる、情報提供をする、など、アプリケーションエンジニアが監視を活用したいと思ったときに、うまくサポートできると良い
Observability という単語が少し出てきたが、microservices の文脈でシステムが複雑になってきていて、そういう中で、単純なOSレベル・ネットワークレベルのメトリクスだけでは、アプリケーションの状態や問題を把握しきれなくなってきている、と思う。アプリケーションエンジニアも監視に関心を持ち、どういう情報があれば、アプリケーションの状態を知れるか、重要な情報は何か、というのを考えなければならない時代なのではないか、と思ったりもした。
#読書