batchの定期実行を監視

It would be great if you could support push-based uptime checks (I think it's also refered to as "heartbeat monitoring"). I.e. as long as the source pings an endpoint of Pingdom every X minutes it is seen as being alive.

If you could implement this one wouldn't have to open up ports to one's internal network. This is a feature which can be crucial to some enterprises.

push-based uptime

heartbeat monitoring

https://logz.io/blog/monitor-service-uptime/

heartbeat(ツール)でサービスの監視をしてlog出力し、 logz を使ってElasticSearchに送って、kibanaで確認する

https://www.elastic.co/products/beats/heartbeat

heartbeat (ツール)。自分で監視サービスを走らせる場合に使えそう

Zabbix Sender によるバッチ処理結果の監視 | Tricorn Tech Labs

バッチ処理が実行されていない状態の検知 △

アイディア

1分間に何回ログが出てるかの閾値を監視することはできるか

batch起動時のログは出ている

このログの継続性を監視すればよさそう

このためには、ログを送信する必要がある -> CloudWatch Logs でできるかな？

時間あたりのログの記録数をカウントして、アラーム条件に使えばできるかも

batchの実行状態を書いたページを公開して、実行状態の内容をチェックする

Running since HH:MM:SS, Sleeping since HH:MM:SS みたいに書いておくとか？

時刻で検知するには、相対時間の計算が必要。

RunningやSleepingで検知する場合、監視サービスのタイミング次第でずっとSleepingしか表示されてないとかありそう