公眾號文章匯總
801
2025-04-03
在配置DMS for Kafka監控的過程中經常會遇到以下的問題:
從哪些緯度去監控Kafka?
怎么做才能讓Kafka持續、有效的提供服務?
Kafka出問題后,如何第一時間收到告警短信/郵件?
......
啊啊啊...這些問題太讓人抓狂了......
別擔心,本期云小課帶您學習配置DMS for Kafka告警通知的方法。
監控指標
DMS for Kafka主要從4個維度監控服務的運行情況,分別為:實例、節點、隊列和消費組。
下表介紹DMS for Kafka中必須配置的監控指標,在實際業務中,建議按照以下告警策略,配置監控指標的告警規則。如果想了解所有的監控指標,請戳這里
指標名稱
正常范圍
告警策略
指標說明和告警處理建議
磁盤容量使用率
0~100
告警閾值:原始值>85
連續觸發次數:3
告警級別:緊急
指標說明:該指標為從Kafka節點虛擬機層面采集的磁盤容量使用率。單位:%。
處理建議:出現該告警時,需要修改實例存儲空間。具體操作,請參考變更實例規格。
CPU核均負載
0~2
告警閾值:原始值>1.5
連續觸發次數:3
告警級別:重要
指標說明:該指標為從Kafka節點虛擬機層面采集的CPU每個核的平均負載。
處理建議:出現該告警時,需要修改實例基準帶寬/代理個數,即擴節點。具體操作,請參考變更實例規格。
內存使用率
0~100
告警閾值:原始值>85
連續觸發次數:3
告警級別:緊急
指標說明:該指標為Kafka節點虛擬機層面采集的內存使用率。單位:%。
處理建議:出現該告警時,需要修改實例基準帶寬/代理個數,即擴節點。具體操作,請參考變更實例規格。
Kafka進程JVM堆內存使用率
0~100
告警閾值:原始值>85
連續觸發次數:3
告警級別:緊急
指標說明:該指標從Kafka節點Kafka進程JVM中采集的堆內存使用率。單位:%。
處理建議:出現該告警時,需要修改實例基準帶寬/代理個數,即擴節點。具體操作,請參考變更實例規格。
配置告警通知
消費組可消費消息數是判斷消息是否堆積的重要指標,下面以配置消費組可消費消息數的告警通知為例,向您介紹配置Kafka監控的方法。
請參考配置消費組可消費消息數告警通知的方法,配置DMS for Kafka其他監控指標的告警通知。
前提條件
在配置消費組可消費消息數告警通知前,確保已購買Kafka實例、創建Topic,并且已成功消費消息。
配置消費組可消費消息數的告警通知
登錄DMS for Kafka控制臺,在需要創建告警通知的實例所在行,單擊,進入云監控服務頁面。
在“消費組”頁簽,設置需要創建告警通知的消費組。
消費組:選擇需要創建告警通知的消費組。
隊列:選擇“全部隊列”。
選中“消費組可消費消息數”圖表,單擊,創建告警規則。
在“創建告警規則”界面,設置告警名稱。
名稱:您自定義的告警名稱,用于識別不同的告警。
描述:告警規則描述,可以不填。
企業項目:告警規則所屬的企業項目。只有擁有該企業項目權限的用戶才可以查看和管理該告警規則。
在“創建告警規則”界面,設置告警策略。
選擇類型:選擇“自定義創建”。
告警策略:觸發告警規則的告警策略,是否觸發告警取決于連續周期的數據是否達到閾值。
告警級別:根據實際情況選擇告警等級。
在“創建告警規則”界面,設置告警通知對象。
發送通知:選擇開啟。
通知對象:選擇已創建的主題,主題的訂閱信息中包含需要接收告警信息的手機號/郵箱地址。
如果尚未創建主題,參考如下操作創建主題:單擊“創建主題”,進入消息通知服務中,創建主題和添加訂閱。創建完成后,返回“創建告警規則”頁面,在“通知對象”后單擊刷新,然后選擇創建的主題。
生效時間:該告警規則僅在生效時間內發送通知消息。
觸發條件:觸發告警通知的條件。
單擊“立即創建”,完成告警規則的設置。
告警規則創建完成后,在云監控服務的“告警 > 告警規則”界面,查看新創建的告警規則。
以上,是本次云小課為您帶來的全部內容,想了解更多DMS for Kafka相關內容,請戳這里。
Kafka 云小課 分布式消息服務 Kafka
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。