Py之gensim:gensim的簡介、安裝、使用方法之詳細(xì)攻略
Py之gensim:gensim的簡介、安裝、使用方法之詳細(xì)攻略

目錄
gensim的簡介
gensim的安裝
gensim的使用方法
gensim的簡介
Gensim是一個用于主題建模、文檔索引和大型語料庫相似檢索的Python庫。目標(biāo)受眾是自然語言處理(NLP)和信息檢索(IR)社區(qū)。
Gensim是一個免費(fèi)的Python庫,用于從文檔中自動提取語義主題,盡可能高效(計算機(jī)方面)和無痛苦(人類方面)。GeNSIM被設(shè)計成處理原始的、非結(jié)構(gòu)化的數(shù)字文本(“純文本”)。Gensim中的算法,如Word2Vec、FastText、潛在語義分析(LSI、LSA、參見LsiModel)、潛在Dirichlet分配(LDA、參見LdaModel)等,通過檢查訓(xùn)練文檔語料庫中的統(tǒng)計共現(xiàn)模式,自動發(fā)現(xiàn)文檔的語義結(jié)構(gòu)。NTS。這些算法是無監(jiān)督的,這意味著沒有人輸入是必要的-你只需要一個純文本文檔的語料庫。一旦找到這些統(tǒng)計模式,任何純文本文檔(語句、短語、單詞…)都可以在新的語義表示中簡潔地表達(dá),并查詢與其他文檔(單詞、短語…)的主題相似性。
pypi gensim
Gensim API Reference
gensim的安裝
pip install gensim
gensim的使用方法
trained_model.most_similar(positive=['woman','king'], negative=['man'])
[('queen', 0.50882536), ...]
Python
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。