【MindSpore第六期兩日集訓營】踩坑實錄
寫在最前面:
本markdown僅針對第六期訓練營中出現的坑來做填坑處理,避免新人跟我之前一樣被勸退了無數次而心態爆炸。詳細做題過程移步論壇張小白處。
2020-11-10
繼專家判定之前北京四的服務器可能被我折騰壞了之后,重新開了一個新加坡的服務器從頭做人。
切到新加坡服務器之后,git報錯如下:
解決方法不是網上能搜到的,很簡單,直接重裝git即可解決。
Transformer-moe第一個作業
2021-11-11
裝cmake的時候說找不到openssl,但是我實際上加了路徑進環境變量
解決方法:sudo apt-get install libssl-dev
之后正常安裝cmake就不報錯了。
cmake最好不要裝最新的,裝18.x版本的就行,我裝的18.1,群里的大佬有裝18.3的,然后解答說小版本差異不太大,所以看個人喜好了。
根據我的經驗,裝了cmake18.x版本之后,./build.sh -t on不在報錯,能成功編譯。
還有報錯:
根據大佬提示說可能是openmpi沒有裝,鏈接比較難找我扔下面了:
https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.3.tar.gz
因為hccl是跟這個通信的?不懂
下載好之后解壓:
tar -zxvf openmpi-4.0.3.tar.gz
進入目錄
cd openmpi-4.0.3
./configure --prefix=$HOME/opt/openMpi
make all
sudo make install
配置環境變量
vim ~/.bashrc
export PATH=$PATH:/root/opt/openMpi/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/root/opt/openMpi/lib
(以上路徑是我自己的安裝路徑,根據自己不同的自己改,不會的問我也行,不要錢)
裝完了之后看下版本:
mpiexec --version
mpirun --version
然而貌似還是不行,但是以上安裝openMpi的方法是正確的,有需要的可以自取。
后來經過他人指點,原來是由于PYTHONPATH沒有添加的原因導致。執行如下命令后,成功。
export PYTHONPATH=/root/mindspore/tests/ut/python
(后面的路徑根據自己不同情況進行更改,不會的同樣可以私聊我)
至此,這個卡了兩天一夜的問題徹底解決。
曬個圖紀念下
Transformer-moe第二個作業
基本沒碰到什么困難,直接把盤古的backbone移植過來的,盤古的backbone源代碼鏈接:https://gitee.com/mindspore/models/blob/master/official/nlp/pangu_alpha/src/pangu_alpha.py
位置:
Mindspore Lite作業
作業一
首先安裝adb工具(過程略)
然后(本人mate 40 pro)打開開發者模式,打開USB調試,打開PTP,連接wifi,并查看本機的IP地址
執行命令:adb connect 192.168.10.137:5555
提示無法連接
將USB線連接在手機和電腦上,執行命令:adb tcpip 5555
斷開手機與電腦的連接,再次執行adb connect 192.168.10.137:5555
成功連接。
模型轉換的時候碰到報錯:
進入自己的mindspore_camp文件夾后,重新export環境變量,跑完了
連接手機提示未授權,網上有些不靠譜的方法坑死人
經本人測試方法有效:
1、打開開發人員模式
2、打開USB調試
3、選擇USB配置為MTP
4、重新連接即可獲得權限。
2021-11-12
adb push報錯:
好吧要root權限。。。。(后來經過老師糾正之后明白不需要root,網上又是瞎說的)
push文件報錯,找了下原來是要輸入電腦路徑和手機路徑,-s只是指定多個設備用的,一個設備直接adb push就可以了。
運行benchmark的時候,報錯說c++依賴不存在,但是我也沒在原先的文件中找到這個依賴
報libmslite_converter_plugin.so不存在的話,加環境變量,最好從絕對路徑開始加起(即最底層目錄開始)
export LD_LIBRARY_PATH=/home/xiaodouzi/mindspore_camp/mindspore-lite-1.5.0-linux-x64/tools/converter/lib:$LD_LIBRARY_PATH(僅供參考 根據實際情況更改,不懂的隨時問)
繼續運行又發現libc++_shared.so這個庫不存在,于是從網上下了扔進去
(附網盤鏈接,有需要的可以自行下載 鏈接:https://pan.baidu.com/s/13b66eA609YzvRKUZEw19vg
提取碼:gem7 --來自百度網盤超級會員V4的分享)
繼續執行照樣報錯,那就加環境變量,注意是把整個tmp文件夾加進去而不是只加這一個庫,加了這個庫也不行,我也不知道為什么,必須整個文件夾
如圖所示,執行成功。
轉換固定比特權重量化報錯:
原因:要寫絕對路徑
建議:最好使用find / -name XXXXXX來查找,這樣找出來的就是絕對路徑下的。
(提示:本地WSL與Windows互傳文件,執行explorer.exe .即可打開圖形窗口)
另:家里路由器后臺看不到手機ip地址的,可以手機開啟熱點電腦連接,然后找到手機網關地址,同樣adb connect可以連接上。
MindSpore
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。