ネットワークエラーとデータベースエラー、どうやって管理する?
多くの場合、ネットワークが不調なだけの場合、しばらくしてから再実行すれば問題ないことが多い。
再実行すれば何とかなるかもしれないエラーか、どうしようもないエラーなのかは判断が難しい。
システム側でタイムアウトする要因
輻輳
大量のリクエストあるいはレスポンスにより、CPU, I/Oを使い切ってしまう。
メモリ不足
スラッシングを起こしてパフォーマンスが大幅に落ちる。
不適切なアルゴリズム
もっと効率の良いアルゴリズムがあるのに、そうなっていない。
ネットワークが不調になる要因
輻輳
大量のリクエストあるいはレスポンスにより、帯域を使い切ってしまう。
DoS, DDoS などによる大量の通信
経路上の何らかの障害
経路上のハードウェアの故障
回線品質の問題(パケットロスするような状況)
機器のパフォーマンス不足
Wi-Fi やモバイル通信で電波が弱いなど
ネットワーク配線の品質
名前解決の失敗
DNS の輻輳
DNS の設定ミス(部分的に正しい場合、とても分かりづらい)
ルーティングのミス
BGP の設定ミスで正しくルーティングされなくなったことがあった。