prometheus.yml
expr:
に記述された
PromQL
を実行することで
アラート
の評価を実現している.
up
で対象の
メトリクス
を収集できているかどうかを判定できる.
for
でその状態の継続を定義する.
瞬間的な
ダウン
などでの
アラート
を回避できる.
code:alert_rules.yml
groups:
- name: target_status
rules:
- alert: scrape_failed
expr: up == 0
for: 1m
labels:
severity: error
annotations:
summary: monitoring target failed.