Metrics
from Observability
メトリクス
参考
/mrsekut-book-4814400128/079 (5.2 構成要素としてのメトリクスの限界)
#wip
こんな感じの整理かなmrsekut.icon
Telemetryは、広義のデータ収集のこと
Metrics, Logsなども全て包含する
「リクエストにN秒かかった」みたいな実際のデータなども含む
Metricsはそれらのデータを集計した数値的な意味合い?
リクエスト数、エラー率、平均レスポンスタイムみたいな
1つのデータの値というよりは、複数のデータを集計した結果の値
SLIは、そのMetricsが異常かどうかを判断する基準みたいな
GPT-4.icon
何か?
数値的な集計データ・パフォーマンス指標
時系列で可視化・集約される(例:CPU使用率 = 65%、リクエスト数 = 120/分)
主な特徴
table:_
構造化されている 数値データ(タグ/ラベル付き)
軽量かつ高速 集約しやすく、リアルタイム性が高い
アラート向き SLO/SLIのベースになりやすい
代表的なメトリクス
Request latency(応答時間)
Error rate(エラー率)
Throughput(処理量)
Resource usage(CPU, Memory)
ツールの例
Prometheus, Grafana, Datadog