精品亚洲视频在线,亚洲国产成人乱码精品女人久久久不卡,亚洲va中文字幕无码

白話 Elasticsearch51-深入聚合數(shù)據(jù)分析之text field聚合以及fielddata原理

網(wǎng)友投稿 873 2022-05-29

文章目錄

概述

官網(wǎng)

示例

對于分詞的field執(zhí)行aggregation，報錯

給分詞的field，設置fielddata=true，可執(zhí)行

使用field.keyword，對分詞的field進行聚合，可執(zhí)行

分詞field+fielddata的工作原理

概述

繼續(xù)跟中華石杉老師學習ES，第51篇

課程地址： https://www.roncoo.com/view/55

官網(wǎng)

fielddata：戳這里

示例

對于分詞的field執(zhí)行aggregation，報錯

先構造下模擬索引及數(shù)據(jù)

PUT /artisan_index { "mappings": { "artisan_type": { "properties": { "artisan_filed": { "type": "text" } } } } } PUT /artisan_index/artisan_type/1 { "artisan_filed": "artisan_1" } PUT /artisan_index/artisan_type/2 { "artisan_filed": "artisan_2" }

GET /artisan_index/_mapping/artisan_type

白話Elasticsearch51-深入聚合數(shù)據(jù)分析之text field聚合以及fielddata原理

我們建立的 artisan_filed是text類型，默認是分詞的，那么我們對該字段進行 aggs看下

GET /artisan_index/artisan_type/_search { "size": 0, "aggs": { "group_by_artisan_field": { "terms": { "field": "artisan_filed" } } } }

報錯如下：

{ "type": "illegal_argument_exception", "reason": "Fielddata is disabled on text fields by default. Set fielddata=true on [artisan_filed] in order to load fielddata in memory by uninverting the inverted index. Note that this can however use significant memory. Alternatively use a keyword field instead." }

對分詞的field，直接執(zhí)行聚合操作，會報錯，大概意思是說，你必須要打開fielddata，然后將正排索引數(shù)據(jù)加載到內存中，才可以對分詞的field執(zhí)行聚合操作，而且會消耗很大的內存 .

當然了，排序這種操作也是不行的。

給分詞的field，設置fielddata=true，可執(zhí)行

#刪除索引 DELETE artisan_index #創(chuàng)建索引，設置text類型的字段的fielddata為true PUT /artisan_index { "mappings": { "artisan_type": { "properties": { "artisan_filed": { "type": "text", "fielddata": true } } } } } #模擬數(shù)據(jù) PUT /artisan_index/artisan_type/1 { "artisan_filed": "artisan_1" } PUT /artisan_index/artisan_type/2 { "artisan_filed": "artisan_2" } #查看映射 GET /artisan_index/_mapping/artisan_type ---------------

# 聚合操作 GET /artisan_index/artisan_type/_search { "size": 0, "aggs": { "group_by_artisan_field": { "terms": { "field": "artisan_filed" } } } }

如果要對分詞的field執(zhí)行聚合操作，必須將fielddata設置為true

使用field.keyword，對分詞的field進行聚合，可執(zhí)行

#直接寫入數(shù)據(jù)，讓ES自動創(chuàng)建索引 PUT /artisan_index/artisan_type/1 { "artisan_filed": "artisan_1" } PUT /artisan_index/artisan_type/2 { "artisan_filed": "artisan_2" } #查看映射 GET /artisan_index/_mapping/artisan_type

# artisan_filed.keyword es內置的keyword也可以在沒設置fielddata=true的情況下聚合 GET /artisan_index/artisan_type/_search { "size": 0, "aggs": { "group_by_artisan_field": { "terms": { "field": "artisan_filed.keyword" } } } }

artisan_filed.keyword es內置的keyword也可以在沒設置fielddata=true的情況下。

當然了，如果對不分詞的field執(zhí)行聚合操作，直接就可以執(zhí)行，不需要設置fieldata=true

分詞field+fielddata的工作原理

doc value --> 不分詞的所有field，可以執(zhí)行聚合操作 --> 如果你的某個field不分詞，那么在index-time，就會自動生成doc value --> 針對這些不分詞的field執(zhí)行聚合操作的時候，自動就會用doc value來執(zhí)行。

分詞field，是沒有doc value的。。。在index-time，如果某個field是分詞的，那么是不會給它建立doc value正排索引的，因為分詞后，占用的空間過于大，所以默認是不支持分詞field進行聚合的

分詞field默認沒有doc value，所以直接對分詞field執(zhí)行聚合操作，是會報錯的

對于分詞field，必須打開和使用fielddata，完全存在于純內存中。。。結構和doc value類似。。。如果是ngram或者是大量term，那么必將占用大量的內存。。。

如果一定要對分詞的field執(zhí)行聚合，那么必須將fielddata=true，然后es就會在執(zhí)行聚合操作的時候，現(xiàn)場將field對應的數(shù)據(jù)，建立一份fielddata正排索引，fielddata正排索引的結構跟doc value是類似的，但是只會將fielddata正排索引加載到內存中來，然后基于內存中的fielddata正排索引執(zhí)行分詞field的聚合操作

如果直接對分詞field執(zhí)行聚合，報錯，提示讓我們開啟fielddata=true，告訴我們，會將fielddata uninverted index（正排索引），加載到內存，會耗費內存空間

為什么fielddata必須在內存？分詞的字符串，需要按照term進行聚合，需要執(zhí)行更加復雜的算法和操作，如果基于磁盤和os cache，那么性能會很差

Elasticsearch 實時流計算服務 CS 數(shù)據(jù)挖掘

深入 理解JAVA中MyBatis框架（1）">深入 理解JAVA中MyBatis框架（1）

873 2022-05-29

深入javascript中的exec與match方法">深入javascript中的exec與match方法

873 2022-05-29

深入理解遞歸思想">【python】深入理解遞歸思想

873 2022-05-29

白話 Elasticsearch51-深入 聚合數(shù)據(jù)分析之text field聚合以及fielddata原理

深入 理解JAVA中MyBatis框架（1）">深入 理解JAVA中MyBatis框架（1）

深入javascript中的exec與match方法">深入javascript中的exec與match方法

深入理解遞歸思想">【python】深入理解遞歸思想

推薦文章

企業(yè)生產(chǎn)管理是什么，企業(yè)生產(chǎn)管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統(tǒng)哪個簡單好用？進銷存系統(tǒng)優(yōu)點

工廠生產(chǎn)管理（工廠生產(chǎn)管理流程及制度）

生產(chǎn)管理軟件，機械制造業(yè)生產(chǎn)管理，制造業(yè)生產(chǎn)過程管理軟件

進銷存軟件和ERP有什么區(qū)別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統(tǒng)？

數(shù)據(jù)庫訂單管理系統(tǒng)有哪些功能？數(shù)據(jù)庫訂單管理系統(tǒng)怎么設計？

什么是數(shù)據(jù)庫管理系統(tǒng)？

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數(shù)字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統(tǒng)：重新定義家庭生活方式

友情鏈接

白話Elasticsearch51-深入聚合數(shù)據(jù)分析之text field聚合以及fielddata原理

深入理解JAVA中MyBatis框架（1）">深入理解JAVA中MyBatis框架（1）

深入javascript中的exec與match方法">深入javascript中的exec與match方法

深入理解遞歸思想">【python】 深入理解遞歸思想

推薦文章

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

友情鏈接

白話 Elasticsearch51-深入聚合數(shù)據(jù)分析之text field聚合以及fielddata原理

深入理解遞歸思想">【python】深入理解遞歸思想