ELK 設(shè)置定時清理腳本清理索引
845
2025-03-31
項目里一直使用的lucene,中間大概升級了2-3次lucene版本,然后項目的負(fù)荷也不重,沒有太多的分布式需求, 所以也就沒有切換到Solr;分詞器早期的時候是用的庖丁,后來由于庖丁沒有停用詞和同義詞并且也長期無人維護就切換到了word中文分詞;
經(jīng)常看到一些elasticsearch相關(guān)的推送,今天就摘錄一下一些粗略的對比;
Solr的主要特點:
全文索引
高亮
分面搜索
實時索引
動態(tài)聚類
數(shù)據(jù)庫集成
NoSQL特性和豐富的文檔處理(例如Word和PDF文件)
Elasticsearch主要特性:
分布式搜索
多租戶
查詢統(tǒng)計分析
分組和聚合
solr一樣,Elasticsearch構(gòu)建在Apache Lucene庫之上,同是開源搜索引擎
Solr專注于文本搜索,而Elasticsearch則常用于查詢、過濾和分組分析統(tǒng)計
Solr?基于Apache ZooKeeper也實現(xiàn)了類似ES的分布式部署模式,相對比,Elasticsearch有一個內(nèi)置的類似ZooKeeper的名為Zen的組件,通過內(nèi)部的協(xié)調(diào)機制來維護集群狀態(tài)。
Solr接受來自不同來源的數(shù)據(jù),包括XML文件,逗號分隔符(CSV)文件和從數(shù)據(jù)庫中的表提取的數(shù)據(jù)以及常見的文件格式(如Microsoft Word和PDF)。
Elasticsearch還支持其他來源的數(shù)據(jù),例如ActiveMQ,AWS SQS,DynamoDB(Amazon NoSQL),F(xiàn)ileSystem,Git,JDBC,JMS,Kafka,LDAP,MongoDB,neo4j,RabbitMQ,Redis,Solr和Twitter。還有各種插件可用。
Solr的優(yōu)缺點
優(yōu)點
Solr有一個更大、更成熟的用戶、開發(fā)和貢獻者社區(qū)。
支持添加多種格式的索引,如:HTML、PDF、微軟 Office 系列軟件格式以及 JSON、XML、CSV 等純文本格式。
Solr比較成熟、穩(wěn)定。
不考慮建索引的同時進行搜索,速度更快。
缺點
建立索引時,搜索效率下降,實時索引搜索效率不高
Elasticsearch的優(yōu)缺點**:
優(yōu)點
Elasticsearch是分布式的。不需要其他組件,分發(fā)是實時的,被叫做”Push replication”。
Elasticsearch 完全支持 Apache Lucene 的接近實時的搜索。
處理多租戶(multitenancy)不需要特殊配置,而Solr則需要更多的高級設(shè)置。
Elasticsearch 采用 Gateway 的概念,使得完備份更加簡單。
各節(jié)點組成對等的網(wǎng)絡(luò)結(jié)構(gòu),某些節(jié)點出現(xiàn)故障時會自動分配其他節(jié)點代替其進行工作。
缺點
只有一名開發(fā)者(當(dāng)前Elasticsearch GitHub組織已經(jīng)不只如此,已經(jīng)有了相當(dāng)活躍的維護者)
還不夠自動(不適合當(dāng)前新的Index Warmup API)
參考:
solr-vs-elasticsearch-top-open-source-search
Solr vs. Elasticsearch誰是開源搜索引擎王者
http://i.zhcy.tk/blog/elasticsearchyu-solr/
https://opensourceconnections.com/blog/2019/02/28/stop-worrying-solr-elasticsearch/
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。