GPU has fallen off the bus
Linux で NVIDIA の GPU がクラッシュした時に dmesg に出るログ
もしかすると他のメーカーでも似たようなエラーは出るかも
NIVIDIA の Linux driver がこのエラーメッセージを出してる
エラーID は Xid 79
この状態になると GPU は Linux から認識されなくなり再起動するしかなくなる
UEFI BIOS の設定によってはファンがフルスピードで回る場合とそうはならない場合がある
原因
熱暴走
よくあるらしい
PC ケースの排熱が上手く出来てないとこうなる
対処方はケース内の空気循環をよくすること
つまるところPCの内部温度を下げる
電源容量不足
これもありがちなパターン
昨今の GPU は消費電力が多いため電源容量が足りなくなっている場合もある
PC 全体の容量が足りていたとしても GPU への給電が足りてないと起きるのかもしれない
ハードウェア同士の相性
UEFI BIOS でも同じ問題が起きていた場合に該当する
この場合、UEFI BIOS で以下のような設定をすると解決するかもしれない(しない場合もある)
Global C-State Control を Enabled にする
GPU が挿さっているスロットのリンク速度を調整する
例えば Auto となっている設定を Gen 5, Gen 4 or Gen 3 と下げていく
実際、Gen 5 対応マザーボードでトラブルが起きた場合に Gen 4 へと下げる workaround がある
ドライバの問題
現在進行中(2025/06/11時点で)
NVIDIA の GPU ドライバが原因で起きる
570系や 575系ではこの手のトラブル報告がかなり多い
ただし問題の報告は GPU は RTX 40xx 系など、Blackwell 以前のアーキテクチャを持つ GPU が多め
この場合、熱暴走や電源問題が起きづらいラップトップでも起きてるのが特徴
対処法としてはドライバのロールバック
安定していたバージョンまで巻き戻せば問題が解決できる
ロールバックができない場合泣くしかない
nyarla.icon
3月頃に買った RTX 5070 がこの状態になってて泣いてる
RTX 5070 は動くと言えば動くんだけど、突如としてこのエラーが出るので正直使い物になってない
アイドル時や軽いワークロードの時に起きるので発動条件が不明な事もつらい
現状どうしようもないので今は以前から使ってたGPUに戻している
つまりせっかく買ったのにお蔵入りになってます
つらい