大數(shù)據(jù)“復(fù)活”記
800
2025-03-31
本文將從一下幾個(gè)方面介紹DMS告警框架:
數(shù)據(jù)庫(kù)智能監(jiān)控系統(tǒng)告警框架的來(lái)源
告警框架的實(shí)現(xiàn)
告警框架的不足和期望
一、數(shù)據(jù)庫(kù)智能監(jiān)控系統(tǒng)告警框架的簡(jiǎn)介
告警功能是各大云平臺(tái)必不可少的模塊,包括阿里云、騰訊云,乃至華為云本身都提供了十分豐富的告警功能。個(gè)性化的告警配置,為幫助用戶和運(yùn)維人員及時(shí)發(fā)現(xiàn)問(wèn)題發(fā)揮著重要作用。
數(shù)據(jù)庫(kù)智能監(jiān)控系統(tǒng)(簡(jiǎn)稱DMS)告警框架(以下簡(jiǎn)稱告警框架)用于監(jiān)控數(shù)據(jù)倉(cāng)庫(kù)的集群信息,且基于8.1.1以上版本的集群進(jìn)行開(kāi)發(fā),如果您的集群版本低于8.1.1或沒(méi)有安裝DMS,則不能適用次告警功能。
告警功能是結(jié)合產(chǎn)品自身需求、業(yè)務(wù)需求、客戶需求獨(dú)立進(jìn)行設(shè)計(jì)與開(kāi)發(fā),為了能夠讓用戶更快速的熟悉和使用次功能,告警功能在設(shè)計(jì)之處也參照了其他平臺(tái)的使用方式、相關(guān)概念,并結(jié)合自身情況進(jìn)行調(diào)整,完成了初版的設(shè)計(jì)與開(kāi)發(fā)。
二、告警框架的實(shí)現(xiàn)與使用
1. 告警框架的實(shí)現(xiàn)
在說(shuō)具體實(shí)現(xiàn)之前,先了解下告警框架中涉及的相關(guān)概念。
告警指標(biāo):告警指標(biāo)是實(shí)際監(jiān)控的內(nèi)容,如:CPU使用率、磁盤(pán)使用率、IO等。
告警策略:告警策略是觸發(fā)告警的最小單元,每一條策略針對(duì)一種告警指標(biāo)。告警策略分為閾值策略、狀態(tài)策略等。
告警規(guī)則:告警規(guī)則是實(shí)際監(jiān)測(cè)(任務(wù)調(diào)度)的最小單元,是告警策略的集合。告警規(guī)則包含自默認(rèn)規(guī)則和自定義規(guī)則。
默認(rèn)告警規(guī)則:默認(rèn)規(guī)則是系統(tǒng)提供的基礎(chǔ)告警項(xiàng),用戶只需根據(jù)業(yè)務(wù)簡(jiǎn)單的配置,即可收到告警信息。
義告警規(guī)則:當(dāng)默認(rèn)告警規(guī)則不能滿足實(shí)際需求時(shí),用戶可根據(jù)自己的實(shí)際需求創(chuàng)建自定義告警規(guī)則。
規(guī)則、告警策略、告警指標(biāo)三者關(guān)系:一個(gè)告警規(guī)則(默認(rèn)/自定義)可包含多個(gè)告警策略,并且規(guī)則中的策略存在不同關(guān)系,當(dāng)前已知策略關(guān)系如下:
相互獨(dú)立(或):策略之間并無(wú)實(shí)際聯(lián)系,只要一個(gè)策略滿足條件則發(fā)送告警;
優(yōu)先級(jí):一般指同一規(guī)則下,所有策略監(jiān)控的指標(biāo)項(xiàng)相同,但觸發(fā)的閾值不同,按照閾值遞減順序判斷是否發(fā)送告警;
與:所有策略都滿足條件則發(fā)送告警。
了解了以上概念,再來(lái)說(shuō)下告警框架的組成,告警框架主要分為三大部分,監(jiān)控指標(biāo)采集、告警策略定制、告警任務(wù)調(diào)度。
監(jiān)控?cái)?shù)據(jù)庫(kù),必須要對(duì)數(shù)據(jù)庫(kù)各指標(biāo)數(shù)據(jù)進(jìn)行采集,通過(guò)合理的統(tǒng)計(jì)查詢,獲得實(shí)時(shí)或周期性的數(shù)據(jù)庫(kù)和集群的狀態(tài),結(jié)合告警策略觸發(fā)告警。
下圖所示是告警策略的組成,通過(guò)各配置項(xiàng)的不同組合,達(dá)成多樣化的配置,后續(xù)版本的迭代中,會(huì)加入更多的可配置項(xiàng),以支持更多的業(yè)務(wù)場(chǎng)景。
監(jiān)控指標(biāo)是周而復(fù)始的過(guò)程,需要一個(gè)穩(wěn)定的調(diào)度器支撐告警框架的任務(wù)調(diào)度,目前采用的是分布式調(diào)度框架Quartz。下圖所示是調(diào)度任務(wù)的執(zhí)行邏輯。
2. 告警框架的使用
DMS告警框架位于【數(shù)據(jù)倉(cāng)庫(kù)服務(wù)】中的【告警管理】菜單中。
首頁(yè)提供了告警統(tǒng)計(jì)功能,包含了一周內(nèi)發(fā)生的告警,用戶可查看統(tǒng)計(jì)數(shù)字和告警詳細(xì)信息。
點(diǎn)擊【查看告警規(guī)則】查看告警規(guī)則列表。
告警框架提供了自定義告警規(guī)則和默認(rèn)告警規(guī)則,默認(rèn)告警規(guī)則未系統(tǒng)內(nèi)置,用戶可根絕自身需求添加自定義告警。
點(diǎn)擊【創(chuàng)建規(guī)則】或【修改】按鈕進(jìn)入配置頁(yè)面。
目前可修改的內(nèi)容只有“綁定集群”、“閾值”、“持續(xù)周期”、“抑制條件”、“告警級(jí)別”,其他選項(xiàng),將在后續(xù)的版本中放開(kāi)為用戶提供更豐富的配置選擇。
修改綁定集群可以設(shè)置次告警規(guī)則適用的集群范圍,默認(rèn)為全部,可多選;
修改閾值可以調(diào)整觸發(fā)告警的上限或下限,每種指標(biāo)默認(rèn)提供了閾值范圍,可按照頁(yè)面提示和實(shí)際情況進(jìn)行合理修改。
修改持續(xù)周期,可以拉長(zhǎng)或縮短指標(biāo)數(shù)據(jù)的查詢范圍,檢測(cè)的是長(zhǎng)周期的指標(biāo)變化趨勢(shì),還是某時(shí)刻的指標(biāo)異常變化。
修改抑制條件可以控制告警的發(fā)送頻率,處于抑制期的告警不會(huì)重復(fù)發(fā)送。
當(dāng)前版本支持的告警
查詢語(yǔ)句堆積數(shù)量超閾值告警
查詢語(yǔ)句觸發(fā)下盤(pán)量超閾值告警
節(jié)點(diǎn)交換分區(qū)使用率超閾值告警
節(jié)點(diǎn)CPU使用率超閾值告警
節(jié)點(diǎn)系統(tǒng)CPU使用率超閾值告警
節(jié)點(diǎn)數(shù)據(jù)盤(pán)I/O利用率超閾值告警
節(jié)點(diǎn)日志盤(pán)I/O利用率超閾值告警
節(jié)點(diǎn)系統(tǒng)盤(pán)I/O利用率超閾值告警
節(jié)點(diǎn)數(shù)據(jù)盤(pán)inode使用率超閾值告警
節(jié)點(diǎn)系統(tǒng)盤(pán)inode使用率超閾值告警
節(jié)點(diǎn)日志盤(pán)inode使用率超閾值告警
節(jié)點(diǎn)數(shù)據(jù)盤(pán)使用率超閾值告警
節(jié)點(diǎn)系統(tǒng)盤(pán)使用率超閾值告警
節(jié)點(diǎn)日志盤(pán)使用率超閾值告警
節(jié)點(diǎn)系統(tǒng)盤(pán)時(shí)延超閾值告警
節(jié)點(diǎn)數(shù)據(jù)盤(pán)時(shí)延超閾值告警
節(jié)點(diǎn)日志盤(pán)時(shí)延超閾值告警
chema空間使用率超閾值告警
告警框架的不足與期望
DMS告警框架還在建設(shè)當(dāng)中,存在諸多不足,譬如:還需提供更多的監(jiān)控指標(biāo),支持多種策略配置方式,告警項(xiàng)的拓展不夠便捷等。
除了解決上述的痛點(diǎn),更多的希望告警框架能夠和系統(tǒng)的功能模塊聯(lián)動(dòng)起來(lái),讓監(jiān)控系統(tǒng)更“智能”。
想了解GuassDB(DWS)更多信息,歡迎微信搜索“GaussDB DWS”關(guān)注微信公眾號(hào),和您分享最新最全的PB級(jí)數(shù)倉(cāng)黑科技,后臺(tái)還可獲取眾多學(xué)習(xí)資料哦~
EI企業(yè)智能 Gauss AP Java 數(shù)據(jù)倉(cāng)庫(kù)服務(wù) GaussDB(DWS)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。