《R數據科學實戰:工具詳解與案例分析 》 —2.3.4 replace_na / drop_na/—默認值處理工具
2.3.4 replace_na / drop_na/—默認值處理工具
一旦明確了默認值的替代方式,replace_na和drop_na兩個函數就可以通過對指定列的查詢來將NA替換成需要的數值,例如,去掉所有存在默認值的觀察值。表2-16中列出了函數的功能簡介及使用時應注意的事項。讀者可以參照幫助文檔中的例子結合表2-16中的提示來自行練習這兩個函數的功能。
表2-16 函數replace_na和drop_na對比
下面的代碼列出了如何使用兩個函數:
> df %>%
gather(key, value, -序號) %>%
separate(key, c("性別","key")) %>%
replace_na(list(value = "missing"))
> df %>%
gather(key, value, -序號) %>%
separate(key, c("性別","key")) %>%
drop_na()
這里必須提醒一下讀者關于默認值替換的情況,將所有默認值全部替換成0是很危險的行為,不推薦使用這種做法,因為0代表該數據是存在的,只是數值為0,而默認值則可能代表數據不存在和存在兩種情況,只是因為某些原因而導致數據采集失敗。因此對默認值的處理一定要視具體情況而定。
數據挖掘
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。