<del id="qqgia"></del>

<ul id="qqgia"></ul>

ClickHouse kafka表引擎使用故障問題 (一)

網友投稿 2318 2025-03-31

場景與問題：MRS ClickHouse客戶，在執行滾動重啟操作后，發現manager界面“集群隊列大小”有大量業務擁塞，檢查后臺信息“Too many parts (303). Parts cleaning are processing significantly slower than inserts…”

客戶數據表情況：

（1）客戶報錯信息設計數據表test.dwd_c_vehicle_upload_real_detail采用vin?String 設置分區鍵，“PARTITION?BY?xxHash32(vin)?%?100”

ClickHouse kafka表引擎使用故障問題 (一)

（2）kafka引擎數據表，參數僅配置了必須配置的參數

SETTINGS?kafka_broker_list?=?‘xx.xx.xx.xx:9092,xx.xx.xx.xx:9092,xx.xx.xx.xx:9092’,

kafka_topic_list?=?‘pro_dwd_c_vehicle_upload_real_detail’,

kafka_group_name?=?‘clickhouse_pro_new’,

kafka_format?=?‘JSONEachRow’,

kafka_num_consumers?=?1

（3）客戶數據插入的頻次不詳，每次插入數據大致在幾百條。

根據報錯信息定位源碼信息與相關參數信息：

（1）\ClickHouse_Kernel-master\src\Storages\MergeTree\MergeTreeData.cpp

size_t parts_count_in_partition = getMaxPartsCountForPartition(); ……. if (parts_count_in_partition >= settings->parts_to_throw_insert) { ProfileEvents::increment(ProfileEvents::RejectedInserts); throw Exception( ErrorCodes::TOO_MANY_PARTS, "Too many parts ({}). Parts cleaning are processing significantly slower than inserts", parts_count_in_partition); }

查閱官方文檔parts_to_throw_insert默認值為300；

（2）根據kafka表引擎，其他參數分析，影響kafka數據表性能的重要參數：'kafka_max_block_size’默認值為65536即64K。

結合以上信息得出結論：由于客戶數據表采用hash值作為分區鍵，數據表分區相對較多，再由于客戶kafka表引擎參數“kafka_max_block_size”采用默認值65536，導致數據塊較小，進而也就導致了數據插入時數據塊較多，相應的分區part數量很容易超過“parts_to_throw_insert”默認值300，進而觸發異常報錯。

給客戶建議：建議客戶根據數據表情況、數據插入頻次和每次插入數據的條數，對kafka表引擎數據表進行合理化配置，也可對clickhouse相應配置進行更改。例如：可以修改parts_to_throw_insert的默認值，可以增加“kafka_max_block_size”默認值，社區建議將“kafka_max_block_size”設置應增加為521K-1M，實現單表的最佳性能。

參考鏈接：

https://github.com/ClickHouse/ClickHouse/issues/3174

https://github.com/ClickHouse/ClickHouse/issues/9053

https://altinity.com/blog/clickhouse-kafka-engine-faq

ClickHouse Kafka

標簽：ClickHouse 表分區

Clickhouse如何實現數據更新

2318 2025-03-31

Oracle SQL調優系列之表設計與性能

2318 2025-03-31

表分區？漲知識了">MySQL 表分區？漲知識了

2318 2025-03-31

<ul id="u8ygw"></ul>

<ul id="u8ygw"></ul>

ClickHouse kafka表引擎使用故障問題 (一)

Clickhouse如何實現數據更新

Oracle SQL調優系列之表設計與性能

表分區？漲知識了">MySQL 表分區？漲知識了

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接