hadoop學習-倒排索引
倒排索引是文檔搜索系統中常用的數據結構。它主要用來存儲某個詞組在一個或多個文檔中的位置映射。通常情況下,倒排索引由詞組以及相關的文檔列表組成。如下表所示。

表1:
單詞 ? ? ?文檔列表
從表1可以看出單詞1出現在{文檔1,文檔2,文檔3},單詞2出現在{文檔2,文檔4,文檔5},單詞3出現在{文檔3,文檔5,文檔6}。
實際使用中還需要給文檔添加一個權值,用來表示該詞組與文檔的相關性。如表2所示。
表2:
單詞 ? ? 文檔列表
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。