寵物集市-寵物集市華東、華南、華北排行榜一覽表
674
2022-05-29
貝葉斯算法中最重要用的用的最廣的是
使用多項式樸素貝葉斯的地方是文本分類,其中特征與待分類文檔中的字數或頻率有關。
將使用20個新聞組語料庫中的稀疏字數功能來將這些短文檔分類。
數據集的介紹
使用 sklearn.datasets中的 fetch_20newsgroups
該數據集介紹
20 newsgroups數據集18000篇新聞文章,一共涉及到20種話題,所以稱作20 newsgroups text dataset,分文兩部分:訓練集和測試集,通常用來做文本分類.
詳細可看
https://blog.csdn.net/imstudying/article/details/77876159
開始
from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups() data.target_names
1
2
3
['alt.atheism', 'comp.graphics', 'comp.os.ms-windows.misc', 'comp.sys.ibm.pc.hardware', 'comp.sys.mac.hardware', 'comp.windows.x', 'misc.forsale', 'rec.autos', 'rec.motorcycles', 'rec.sport.baseball', 'rec.sport.hockey', 'sci.crypt', 'sci.electronics',
1
2
3
4
5
6
7
8
9
10
11
12
13
機器學習
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。