華為云2020 AI實戰營 第七章 NLP 打卡指南
一、課程打卡
課程內容為《7.3 課程打卡》,打卡的方法如下:
下載課程中提供的pdf文件。點擊7.3課程打卡后,選擇右邊的“下載文檔”
打開pdf文件,根據pdf的提示一一執行。關鍵內容是:打開?https://nbviewer.jupyter.org/?網址:
在url位置貼入pdf中的 .ipynb結尾的URL:
https://github.com/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_nlp_bert_ner/nlp_ner.ipynb
點擊Go。系統會彈出以下操作指導頁面:
這個文檔非常細致。逐一執行即可。
一般情況下,按照步驟執行應該能得到預期的結果。但是本節課仍然有點例外,主要是因為如果選擇免費實例:
會在按照順序執行操作的第八步的時候,系統會報錯:
所以,建議此時選用收費實例,我選擇的是8核64G的實例:
則可以成功完成課程全過程,第八步也是一步就過。
其中,訓練,驗證,測試完成的截圖如下:
交互測試的截圖如下:
按照教材提供的文本測試好像都沒啥問題。
自己輸入了2-3條:
最后第3個能識別。前2個是不是因為找不到人,地點和組織,所以解析不出來。。
(課程打卡完畢)
二、作業1打卡
作業內容為 生成三國演義云圖。
下載課程中提供的pdf文件。點擊7.4作業打卡后,選擇右邊的“下載文檔”
打開pdf文件,根據文件的要求在鏈接:https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/gen_wordcloud.py
下載 詞云圖生成腳本gen_wordcloud.py
在鏈接:https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三國演義.txt? 下載三國演義全文。
在鏈接?https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三足鼎.jpg?下載三足鼎立的圖片。。。(就是個鼎。。。)
依然創建Notebook(建議還是使用8核64G的。大了保險。。。今天監督學習直播課的專家也說了,資源越大越保險。。。。)
將三國演義.txt和三足鼎.jpg上傳到notebook
然后進去Notebook,創建Tensorflow 1.13.1,將下載的python腳本一一貼入執行:
當然了,如果不出意外的話,你會在解析 三國演義.txt的文件時出錯:
因為下載的 txt文件是GB2312編碼,所以你需要將其轉換為UTF-8編碼,可以使用UltraEdit或者Vscode工具進行另存即可:
重新上傳三國演義文件。(系統會提示是否覆蓋,顯然要覆蓋。。。)
重新執行后續的Python腳本:
最終應得出一張可愛的圖片:
拿這個圖片去打卡即可。記得將notebook名字改為你的華為云賬號。
(作業1打卡完畢)
三、作業2打卡
作業2是要部署模型并進行預測。
根據上面下載的pdf的要求,到鏈接?https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_ner/model.zip?下載模型zip文件。解壓后生成model目錄。
然后用你自己的OBS上傳這個目錄(如果沒有需要去申請。。)
我這邊是使用OBS Browser+創建目錄:
注意目的前后不要有空格,因為根據菊花廠的料性,你加了前后空格它照樣幫你建立帶前后空格的目錄,而這個是兵家大忌。。
然后你上傳目錄到OBS桶:
等文件傳送完畢:
(不要羨慕哥的速度,這是個安靜的夜晚。。。)
進入模型管理-模型-導入界面
選擇OBS文件夾導入:
(是的,你看到了,上圖那些亂七八糟的文件夾就是筆者測試的 前中后帶空格的文件夾,只要你愿意,菊花廠都給你建,,我曾經提過建議,說windows前后空格的目錄都建不起來,為啥你可以建起來?它理直氣壯的沒有回答這個問題。
創建這個導入的模型:
等待模型構建:
構建完畢
選擇,部署成在線服務:
此時好像可以選擇免費的服務。。。
等待部署結束進入運行狀態:
選擇預測:
左邊輸入:
{"sentence":"中國男籃與委內瑞拉隊在北京五棵松體育館展開小組賽最后一場比賽的爭奪,趙繼偉12分4助攻3搶斷、易建聯11分8籃板、周琦8分7籃板2蓋帽。"}
點擊預測,獲得右邊的返回結果:
{
"LOC": [
"北京",
"五棵松體育館"
],
"PER": [
"趙繼偉",
"易建聯",
"周琦"
],
"ORG": [
"中國男籃",
"委內瑞拉隊"
]
}
又隨便搜索了一條新聞測試:
新聞為:
{"sentence":"在8月14日,廣東衛健委通報一名深圳市羅湖區水貝盒馬鮮生超市員工在老家汕尾陸豐市確診為新冠肺炎后,廣東已排查出5例無癥狀感染者,其中深圳2例,汕尾報告3例。隨后,深圳、汕尾開始收緊防控措施。其中,深圳超市門店經營場所范圍內暫停堂食服務,盒馬鮮生在深圳的21家門店暫停營業,進行全面消殺。汕尾陸豐市開展免費核酸檢測、暫停電影院營業、暫停零售藥店銷售“退燒藥”等。"}
預測結果為:
{
"LOC": [
"深圳市",
"羅湖區",
"水貝盒馬鮮生超市",
"汕尾",
"陸豐市",
"廣東",
"深圳",
"汕尾",
"深圳",
"汕尾",
"深圳超",
"深圳"
],
"PER": [
"馬鮮生"
],
"ORG": [
"廣東衛健委"
]
}
可見,已成功完成預測。
你就可以將最后的預測結果圖截圖發到指定的打卡貼即可。記得截圖的時候需要包含右上角的華為云賬號。
至此,第七章的打卡就做完了。
想想還有最后一章就結束了。還有點期待。。。。畢竟GT手表這個東西,確實沒用過,也不知道它是Great Teacher的GT,還是GoTop的GT。
(全文完,謝謝閱讀)
AI開發平臺ModelArts EI企業智能
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。