《scikit-learn機器學習常用算法原理及編程實戰(zhàn)》—3.8 復習題
3.8? 復習題
1.什么是過擬合?什么是欠擬合?怎么樣去診斷算法是否過擬合或欠擬合?
2.模型的擬合成本是什么意思?它和模型的準確性有什么關(guān)系?
3.我們有哪些指標來評價一個模型的好壞?
4.為什么需要交叉驗證數(shù)據(jù)集?
5.什么是學習曲線?為什么要畫學習曲線?
6.打開ch03.02.ipynb,運行這個示例代碼。
7.參考ch03.02.ipynb,換成隨機森林回歸算法sklearn.ensemble.RandomForestRegressor來擬合曲線,并畫出學習曲線。提示:讀者可以閱讀scikit-learn文檔以獲得幫助。不過不需要深入了解算法原理,由于scikit-learn提供了一致的接口,對大部分有編程經(jīng)驗的讀者,這個任務不會是太大的障礙。
8.為什么需要查準率和召回率來評估模型的好壞?查準率和召回率適合哪些問題領(lǐng)域?
機器學習 scikit-learn
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。