貝葉斯學習舉例--學習分類文本
“我感興趣的電子新聞稿”或“討論機器學習的萬維網頁”。在這兩種情況下,如果計算機可以精確地學習到目標概念,就可從大量在線文本文檔中自動過濾出最相關的文檔顯示給讀者。
這里描述了一個基于樸素貝葉斯分類器的文本分類的通用算法。
將要展示的樸素貝葉斯算法遵循以下的問題背景:
1、考慮實例空間X包含了所有的文本文檔(即任意長度的所有可能的單詞和標點符號串)。
2、給定某未知目標函數f(x) 的一組訓練樣例,f(x)的取值來自于某有限集合V。此任務是從訓練樣例中學習,以預測后續文本文檔的目標值。
作為示例,這里考慮的目標函數是:將文檔分類為對某人是否感興趣,使用目標值like 和dislike代表這兩類。
在應用樸素貝葉斯分類器時包含的兩個主要設計問題是:
1、首先要決定怎樣將任意文檔表示為屬性值的形式,
機器學習
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。