Ubuntu 20.04 に upgrade 後 GPU まわりを修正3
Aim
PyTorch 1.11.3 に対応するため CUDA を 11.3 -> 11.7に変更
Ploblems
と思ったが,デスクトップ画面表示されない or nvidia-smi で "Device not found" みたいになるので果てしなく困った.
HDMI -> DVI でモニタ出力していたが HDMI 出力の範囲がおかしいくてセカンドディスプレイのように認識?
マウスを画面左端に移動させるとまだ動ける.
画面共有でも黒い画面にマウスカーソルしか見えていない.
recomend のドライバを入れるだけだと画面表示は戻るが CUDA と合わせて GPU が認識されない.
バージョンを以前のものに戻してもダメになってしまった
HDMI -> HDMI でもだめなので, HDMI の出力がおかしいかも
Solution...
DP で別のモニタに接続したらデスクトップ表示された.
driver ( 530)も CUDA (12.1)も最新版にしてしまったので,tesorflow, pytorch が動かないかも.
基本は,画面共有で繋ぐので物理ディスプレイはなくても大丈夫.
What I did...
1. NVIDIA-driver, CUDA, CUDNN の uninstall
code: uninstall
sudo apt remove --purge nvidia*
sudo apt remove --purge cuda*
sudo apt remove --purge cudnn*
sudo apt remove --purge libnvidia
sudo apt autoremove
sudo apt autoclean
sudo reboot
そのほか,/usr/local/ にある cuda* も削除した sudo rm -rf /usr/local/cuda*
2. CUDA の install v11.7.0 or 11.7.1
Linux -> x86_64 -> Ubuntu -> 20.04 -> deb(local)
code: install_cuda.sh
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt update
sudo apt-get -y install cuda-11-7
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.1-515.65.01-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-11-7
#sudo apt-get -y install cuda だと最新版が入る可能性 bashrc に追加
code:bashrc
export PATH=/usr/local/cuda-11.***/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.***/lib64:$LD_LIBRARY_PATH
# *** は バージョン
この後 GPU 認識されない
HDMI ではなくDPでもにた出力にしたらいけた
Date :2023/01/13
Modified Date :2023/04/17
Author :lattice.icon