RDS Aurora mysqlのUPTIMEモニタリングについて
RDS Auroraでmysqlクラスタを運用していると、時折基盤側で障害が発生してフェイルオーバーすることがある
CloudWatch AlarmでクラスタのノードのUPTIMEメトリクスを監視しておくと、フェイルオーバーあるいはOSレベルの再起動を検知できるのでオススメ
CloudWatch Alarm→SNS→ChatBotでSlack通知もできる
フェイルオーバそのものを確かに認知したいのであれば、RDSとそのノードのイベントを通知する仕組みを実装する必要あり
これは今のところ、CloudWatchEventとSNSで構築する形になる