Metrics
from Observability
メトリクス
システムの状態を数値で計測・記録したもの
参考
/mrsekut-book-4814400128/079 (5.2 構成要素としてのメトリクスの限界)
/mrsekut-book-4814401027/062: 3.1.2 メトリクス
#wip
こんな感じの整理かなmrsekut.icon
Telemetryは、広義のデータ収集のこと
Metrics, Logsなども全て包含する
「リクエストにN秒かかった」みたいな実際のデータなども含む
Metricsはそれらのデータを集計した数値的な意味合い?
リクエスト数、エラー率、平均レスポンスタイムみたいな
1つのデータの値というよりは、複数のデータを集計した結果の値
SLIは、そのMetricsが異常かどうかを判断する基準みたいな
GPT-4.icon
主な特徴
table:_
構造化されている 数値データ(タグ/ラベル付き)
軽量かつ高速 集約しやすく、リアルタイム性が高い
アラート向き SLO/SLIのベースになりやすい
代表的なメトリクス
Request latency(応答時間)
Error rate(エラー率)
Throughput(処理量)
Resource usage(CPU, Memory)
ツールの例
Prometheus, Grafana, Datadog