OpenStack高可用集群(上冊):原理與架構(gòu)》—3 集群資源管理系統(tǒng)">《OpenStack高可用集群(上冊):原理與架構(gòu)》—3 集群資源管理系統(tǒng)
730
2025-04-01
1.4.2 業(yè)務(wù)系統(tǒng)容災(zāi)恢復(fù)
HA與DR是有區(qū)別的,HA更多的是強(qiáng)調(diào)本地系統(tǒng)的高可用,即將某個應(yīng)用系統(tǒng)運(yùn)行在數(shù)據(jù)中心的多個服務(wù)器上,當(dāng)其中的任一服務(wù)器出現(xiàn)任意故障時,應(yīng)用程序和系統(tǒng)能迅速切換到其他服務(wù)器上運(yùn)行從而保證業(yè)務(wù)系統(tǒng)的高可用性,其實現(xiàn)過程主要是本地系統(tǒng)的集群和數(shù)據(jù)的熱備份,從設(shè)計上來講,HA往往通過共享存儲來實現(xiàn)數(shù)據(jù)的同步,因此通常RPO=0,而更多要考慮的是RTO的設(shè)計。
DR則更多的是強(qiáng)調(diào)異地災(zāi)備中心的容災(zāi)恢復(fù),即DR通常被認(rèn)為是在另一數(shù)據(jù)中心重構(gòu)恢復(fù)當(dāng)前出現(xiàn)災(zāi)難數(shù)據(jù)中心的計劃或過程。災(zāi)難(Disaster)是指由于人為或自然災(zāi)害致使當(dāng)前數(shù)據(jù)中心內(nèi)的IT系統(tǒng)受到嚴(yán)重破壞或者直接癱瘓,并最終導(dǎo)致相應(yīng)的業(yè)務(wù)系統(tǒng)功能訪問中斷或者服務(wù)水平不可接受且達(dá)到特定時間的突發(fā)性、嚴(yán)重性、災(zāi)難性的事件,災(zāi)難的出現(xiàn)通常迫使當(dāng)前數(shù)據(jù)中心的系統(tǒng)不得不切換到備用數(shù)據(jù)中心運(yùn)行。容災(zāi)恢復(fù)即當(dāng)災(zāi)難發(fā)生且生產(chǎn)數(shù)據(jù)中心受到嚴(yán)重程度破壞時在異地數(shù)據(jù)中心內(nèi)恢復(fù)數(shù)據(jù)、應(yīng)用或者業(yè)務(wù)的能力。容災(zāi)恢復(fù)的前提是企業(yè)具備容災(zāi)能力。容災(zāi)是指企業(yè)除了日常的生產(chǎn)數(shù)據(jù)中心以外,在異地還有備份的數(shù)據(jù)中心隨時可以接管生產(chǎn)中心的業(yè)務(wù)系統(tǒng),例如IBM倡導(dǎo)的“兩地三中心”容災(zāi)方案,就是在同城建立備份中心,然后在地理位置更遠(yuǎn)的異地再建個容災(zāi)中心。衡量容災(zāi)系統(tǒng)的兩個指標(biāo),仍然是RTO和RPO。圖1-18顯示了影響業(yè)務(wù)系統(tǒng)恢復(fù)時RTO和RPO的數(shù)據(jù)恢復(fù)方式與業(yè)務(wù)系統(tǒng)的恢復(fù)方式。
圖1-18 業(yè)務(wù)系統(tǒng)高可用的RTO與RPO
從圖1-18中可以看到,如果數(shù)據(jù)中心之間進(jìn)行的是數(shù)據(jù)的同步復(fù)制,則容災(zāi)恢復(fù)過程中的RPO是秒級別的,即幾乎不丟失數(shù)據(jù),而如果是通過帶庫之類的備份恢復(fù),則可能會丟失幾天到幾周不等的數(shù)據(jù)。同時,如果業(yè)務(wù)系統(tǒng)建立有HA,則恢復(fù)過程幾乎是秒級別的,而如果是通過熱備數(shù)據(jù)中心來恢復(fù),則可能需要幾個小時到幾天不等。容災(zāi)恢復(fù)總體上可以分為數(shù)據(jù)級別、應(yīng)用級別、業(yè)務(wù)級別:
數(shù)據(jù)級別。數(shù)據(jù)級別的容災(zāi)通常是建立異地容災(zāi)中心,通過數(shù)據(jù)的遠(yuǎn)程備份來實現(xiàn),數(shù)據(jù)級別的容災(zāi)可以確保在災(zāi)難發(fā)生之后原有的數(shù)據(jù)不會丟失或者遭到破壞。但在發(fā)生災(zāi)難時應(yīng)用是會中斷的,因為數(shù)據(jù)級的容災(zāi)方式其實就是一個遠(yuǎn)程的數(shù)據(jù)備份中心,并不具有業(yè)務(wù)恢復(fù)的能力,此外,數(shù)據(jù)級容災(zāi)的恢復(fù)時間比較長,但是相比其他容災(zāi)級別來講它的費(fèi)用比較低,而且構(gòu)建實施也相對簡單,即RTO最長,總體擁有成本(TCO)最低。
應(yīng)用級別。在數(shù)據(jù)級容災(zāi)的基礎(chǔ)之上,在備份站點(diǎn)同樣構(gòu)建一套相同的應(yīng)用系統(tǒng),通過同步或異步復(fù)制技術(shù)在數(shù)據(jù)中心之間傳遞數(shù)據(jù),這樣可以保證關(guān)鍵應(yīng)用在允許的時間范圍內(nèi)恢復(fù)運(yùn)行,盡可能減少災(zāi)難帶來的損失,讓用戶基本感受不到災(zāi)難的發(fā)生,這樣就使系統(tǒng)所提供的服務(wù)是完整、可靠和安全的。這一級別的RTO相對數(shù)據(jù)級別要優(yōu)很多,同時TCO也相對較小。
業(yè)務(wù)級別。幾乎就是生產(chǎn)數(shù)據(jù)中心的模板復(fù)制,全部業(yè)務(wù)系統(tǒng)都做了應(yīng)用級別的災(zāi)備,同時除了必要的IT相關(guān)人員和技術(shù),還要求具備全部的基礎(chǔ)設(shè)施。在嚴(yán)重災(zāi)難發(fā)生后,原有的辦公場所都會受到破壞,在業(yè)務(wù)級別的容災(zāi)環(huán)境下,除了數(shù)據(jù)和應(yīng)用的恢復(fù),業(yè)務(wù)系統(tǒng)的正常開展也要被恢復(fù)。當(dāng)然,這一級別的容災(zāi)恢復(fù)RTO是最低的,同時TCO是最昂貴的。
OpenStack 云計算
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。