三步搭建自己Google搜索引擎

      網(wǎng)友投稿 896 2022-05-29

      三步搭建自己的Google搜索引擎

      搜索無處不在,尤其是在移動互聯(lián)的今天。無論是社交,電商,還是視頻等APP中,搜索都已經(jīng)在其中扮演了重要的角色。作為信息的入口,搜索能幫用戶從海量信息中找到想要的信息。在搜索框中快速依據(jù)關(guān)鍵字,找出對應(yīng)內(nèi)容,這是網(wǎng)站或APP不可或缺的一個功能。搜索性能、精準度,又是和最終用戶使用體驗息息相關(guān)的。云搜索服務(wù)正是在高性能、全文檢索、自定義詞庫、多種類分詞、模糊查詢、自動糾錯、同近義詞匹配、簡繁體匹配等方面,來滿足用戶對搜索的訴求。

      Google搜索引擎大家都用過,Google的搜索內(nèi)容,都是依靠爬蟲從網(wǎng)絡(luò)上爬取的網(wǎng)頁數(shù)據(jù)。當用戶在輸入框中輸入關(guān)鍵字,Google就會在后臺進行內(nèi)容相關(guān)性計算,然后以相關(guān)性從高到低返回結(jié)果。對于一個網(wǎng)站或者APP來說,我們也希望擁有類似于Google的搜索框。只不過搜索的內(nèi)容,是網(wǎng)站自己提供的內(nèi)容。

      三步搭建自己的Google搜索引擎

      接下來,就以一個網(wǎng)站的搜索框作為舉例,通過構(gòu)建網(wǎng)站的搜索框,帶您體驗網(wǎng)站搜索場景中云搜索服務(wù)的應(yīng)用。這個網(wǎng)站的內(nèi)容包含注冊用戶,以及用戶發(fā)的帖子。包括三個搜索場景:用戶搜索,根據(jù)用戶名稱匹配度、是否VIP、最近登錄時間、發(fā)帖數(shù)、粉絲數(shù)綜合評分得出搜索結(jié)果;帖子搜索,根據(jù)帖子內(nèi)容匹配度、發(fā)布時間、查看數(shù)、評論數(shù)、數(shù)綜合評分得出搜索結(jié)果;同義詞搜索,根據(jù)表達意思相同的詞,得到相應(yīng)的搜索結(jié)果。

      總體分為三個步驟:第一步準備環(huán)境,主要會用到云搜索服務(wù)、彈性云服務(wù)器和虛擬私有云。云搜索服務(wù)(Cloud Search Service)是一個基于Elasticsearch且完全托管的在線分布式搜索服務(wù),為用戶提供結(jié)構(gòu)化、非結(jié)構(gòu)化文本的多條件檢索、統(tǒng)計、報表。完全兼容開源Elasticsearch軟件原生接口。彈性云服務(wù)器(Elastic Cloud Server)是一種可隨時自助獲取、可彈性伸縮的云服務(wù)器,幫助用戶打造可靠、安全、靈活、高效的應(yīng)用環(huán)境,確保服務(wù)持久穩(wěn)定運行,提升運維效率。虛擬私有云(Virtual Private Cloud)是用戶在華為云上申請的隔離的、私密的虛擬網(wǎng)絡(luò)環(huán)境。用戶可配置VPC內(nèi)的IP地址段、子網(wǎng)、安全組等子服務(wù),可申請彈性帶寬和彈性IP搭建業(yè)務(wù)系統(tǒng)。

      第二步索引數(shù)據(jù)。索引數(shù)據(jù)是將數(shù)據(jù)源中的數(shù)據(jù),在Elasticsearch集群中建立索引。通常會使用數(shù)據(jù)同步工具或者ETL工具,從MySQL拉取數(shù)據(jù),寫入Elasticsearch。在本次課程里,我們的數(shù)據(jù)源是磁盤上的很多JSON文件,因此,我們寫了一個程序IndexingApp,從磁盤上讀取文件內(nèi)容后,調(diào)用Elasticsearch的寫接口,將輸入寫入Elasticsearch集群。

      第三步搜索請求。搜索請求是從搜索框中接收用戶的輸入,然后構(gòu)造搜索查詢語句,調(diào)用Elasticsearch的搜索接口下發(fā)檢索數(shù)據(jù)請求到Elasticsearch。在本次課程里,我們試用SearchApp來模擬一個網(wǎng)站的前后臺。結(jié)合用戶輸入和搜索范圍選擇,來顯示相應(yīng)的搜索結(jié)果。

      進入華為云學(xué)院(https://edu.huaweicloud.com/),學(xué)習(xí)課程《21天晉級大數(shù)據(jù)實戰(zhàn)營》,獲取更多操作教程!

      云搜索服務(wù) CSS

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應(yīng)法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:MRS Pulsar:下一代分布式消息流平臺全新發(fā)布!
      下一篇:華為云常見術(shù)語簡介
      相關(guān)文章
      亚洲综合激情五月色一区| 亚洲成a人片在线观看中文动漫| 亚洲字幕在线观看| 内射干少妇亚洲69XXX| 亚洲国产精品无码av| 亚洲国产婷婷六月丁香| 亚洲精品无码久久久久sm| 亚洲综合无码AV一区二区| 国产午夜亚洲精品理论片不卡| 亚洲一级片内射网站在线观看| 亚洲精品线路一在线观看| 久久久久国产亚洲AV麻豆| 久久精品国产精品亚洲人人| 国产亚洲精品高清在线| 中文亚洲成a人片在线观看| 亚洲午夜久久久影院伊人| 亚洲精品无码av人在线观看 | 亚洲字幕AV一区二区三区四区| 亚洲kkk4444在线观看| 亚洲色成人网站WWW永久四虎 | 亚洲综合精品第一页| 亚洲国产精品无码久久98| 精品久久久久久亚洲综合网| 国产产在线精品亚洲AAVV| 亚洲黄片毛片在线观看| 伊人婷婷综合缴情亚洲五月| 亚洲国产综合无码一区| 亚洲一本综合久久| 亚洲午夜电影在线观看| 日韩亚洲产在线观看| 亚洲av无码专区在线电影| 蜜臀亚洲AV无码精品国产午夜.| www国产亚洲精品久久久日本| 亚洲精品无码专区2| 国产成人精品日本亚洲| 亚洲一区免费观看| 亚洲一级免费毛片| 亚洲国产精品成人午夜在线观看 | 亚洲精品第一国产综合精品99 | 国产亚洲精午夜久久久久久| 久久亚洲综合色一区二区三区|