且看張小白如何用暗影精靈玩轉MindSpore(三)3080的崛起
ubuntu和Nvidia好像就是天然死對頭似的,去年張小白使用ThinkPad P52工作站的Quardo P1000(4G)顯卡安裝Ubuntu 18.04的時候,就遇到過一系列問題。
當時張小白還寫過一篇博客:
張小白GPU安裝MindSpore給你看(Ubuntu 18.04.5) https://bbs.huaweicloud.com/blogs/198357
這次是新出爐的Nvidia GeoForce RTX 3080 Laptop顯卡,張小白仍然遇到了不少幺蛾子。
好在張小白的心理足夠強大,他的朋友圈也足夠強大。所以遇到難題都一一化解了。
其實有了上次裸裝Ubuntu的經驗,這次本來安裝Nvidia顯卡驅動應該是很快的事情。
比如,應該先刪除舊的nvidia驅動:
sudo apt-get purge nvidia*
。。。
sudo vi /etc/modprobe.d/blacklist-nouveau.conf
添加以下內容:
blacklist nouveau options nouveau modeset=0
sudo update-initramfs -u
重啟機器。
sync
sync
sudo reboot
確認nouveau是否已被禁用:
lsmod | grep nouveau
這個時候ubuntu還是有圖形界面的。
init 3
先安裝gcc,g++,make的ubuntu自帶的軟件包:
sudo apt install gcc
sudo apt install g++
sudo apt install make
到Nvidia官網下載對應的顯卡驅動
打開 https://www.nvidia.cn/Download/index.aspx?lang=cn
按以下方式選擇后,點擊搜索:
在彈出的結果頁面點擊download即可下載nvidia驅動。(看support頁簽是支持3080移動版顯卡的)
下載鏈接如下:
https://us.download.nvidia.com/XFree86/Linux-x86_64/470.86/NVIDIA-Linux-x86_64-470.86.run
下載完畢后將其傳到ubuntu服務器上。(或者直接wget下載也行)
由于前面下載類型的選擇不同,當時張小白下載的是460.91.03版本:
sudo ./NVIDIA-Linux-x86_64-460.91.03.run -no-x-check -no-nouveau-check -no-opengl-files
進入了界面:
選擇continue installation:
一個警告可以忽視掉,好像是32位兼容的什么問題。
問要不要更新X配置。暫時選擇No吧。
安裝完畢:
查看nvidia-smi:
重啟下機器后,ubuntu進不了圖形界面了:
但可以按ctrl-alt-F2/F3..進入終端,還可以登錄:
張小白又拿前面下載好的 NVIDIA-Linux-x86_64-470.86.run 驅動試了一下,nvidia-smi顯示降級了,但是依然報前面的錯。
張小白懷疑是CUDA版本問題(當然這種判斷后來證明是錯誤的),于是下載了CUDA 10.1安裝盤,然后開始安裝:
sudo sh?cuda_10.1.105_418.39_linux.run
進入界面:
輸入accept
只選 CUDA ToolKit 10.1 ,其他統統不選
選擇install
修改PATH和LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.1/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH
執行. ~/.bashrc 使得環境變量生效。
打開 https://developer.nvidia.com/rdp/cudnn-archive
下載CUDA 10.1對應的cuDNN 7.6.X的版本:
下載7.6.5吧:
點擊Linux版本后:
需要登錄:
輸入郵箱和密碼后:
點擊登錄:
nvidia會發給你一個郵件:
收到郵件后,點擊verify。
前面的頁面即可開始下載:
耐心等待下載結束:
上傳到ubuntu:
tar -zxvf cudnn*.tgz
將兩個目錄下的文件拷貝到/usr/local/cuda-10.1對應的目錄下去:
cd cuda
sudo cp ./include/* /usr/local/cuda-10.1/include/
sudo cp ./lib64/* /usr/local/cuda-10.1/lib64/
再重啟機器,還是老樣子:
那么升級到CUDA11.1試一下吧。
打開:https://developer.nvidia.com/cuda-11.1.0-download-archive
下載cuda11.1
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
安裝11.1的CUDA
sudo sh?cuda_11.1.0_455.23.05_linux.run
accept
要不要降級看看能不能匹配上。因為前面 nvidia-smi顯示11.2版本,現在這個是11.1版本:
出現提示:
打yes就是,以前指向10.1,現在指向11.1
安裝完畢。同樣提示修改一下.bashrc
那就更新下吧:
使得環境變量生效:
. ~/.bashrc
同樣的方式下載cuda11.1對應的8.0.5
傳到ubuntu上:
解壓
tar -zxvf cudnn cudnn-11.1-linux-x64-v8.0.5.39.tgz
老樣子,拷貝到/usr/local/cuda-11.1/include和lib64目錄:
再重啟,還是老樣子:
張小白沒招了,在模型營的群里面問了一句,還有辦法嗎?還有王法嗎?
@Nishizumimiho 同學給了張小白一個方案:在Ubuntu的系統更新頁面去更新驅動。
他還貼出了友好的界面:
張小白恍然大悟,他打開了ubuntu系統更新(software & updates)的頁面,切換到Additional Drivers頁簽,原來的選擇是最后一個:
張小白將其改為第一個,然后點擊Apply Changes:
耐心等待系統Applying結束:
雖然ubuntu 18.04并沒有認出這是個3080顯卡。(@Nishizumimiho 的1080Ti的顯卡型號可是清清楚楚的顯示出來的)
但是到底行不行呢?重啟一下試試。
居然有圖形界面了!
安裝Ubuntu上的Nvidia顯卡真的蠻不容易的——張小白感慨地說。
(未完待續)
AI GPU加速云服務器 MindSpore Ubuntu
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。