Metrics - mrsekut-p

Metrics

from Observability

メトリクス

システムの状態を数値で計測・記録したもの

参考

/mrsekut-book-4814400128/079 (5.2 構成要素としてのメトリクスの限界)

/mrsekut-book-4814401027/062: 3.1.2 メトリクス

こんな感じの整理かなmrsekut.icon

Telemetryは、広義のデータ収集のこと

Metrics, Logsなども全て包含する

「リクエストにN秒かかった」みたいな実際のデータなども含む

Metricsはそれらのデータを集計した数値的な意味合い？

リクエスト数、エラー率、平均レスポンスタイムみたいな

1つのデータの値というよりは、複数のデータを集計した結果の値

SLIは、そのMetricsが異常かどうかを判断する基準みたいな

GPT-4.icon

主な特徴

table:_

構造化されている数値データ（タグ/ラベル付き）

軽量かつ高速集約しやすく、リアルタイム性が高い

アラート向き SLO/SLIのベースになりやすい

代表的なメトリクス

Request latency（応答時間）

Error rate（エラー率）

Throughput（処理量）

Resource usage（CPU, Memory）

ツールの例

Prometheus, Grafana, Datadog