大數據“復活”記
693
2025-04-02
隨著GaussDB(DWS)用戶數據的不斷增長,用戶原有的集群規模,無論從存儲容量還是算力,均已經無法滿足用戶日益增長的業務需求,為提升用戶體驗,GaussDB(DWS)對外提供了集群擴容方案,該方案中包括以下幾個步驟:
集群下發:用戶購買新機器,此時下發后的新節點處于裸機狀態,還無法使用;
構建新節點:對下發后的裸機進行初始化,加入到集群中,此時新節點已經加入到集群中,但是用戶數據還未搬遷到新節點中,數據處于不均衡狀態,新集群的算力還未達標;
數據重分布:進行數據搬遷,將數據從老集群重分布到新集群中,算力提升。
在上述三個步驟中,可能會對用戶業務產生影響:
集群下發不會對用戶業務產生影響
構建新節點包含兩種模式,一種模式為read-only模式,該模式下用戶業務必須離線,阻塞用戶業務,另外一種模式為insert模式,該模式下用戶業務受阻程度較小,阻塞時間為分鐘級。通常情況下,構建新節點的時間與用戶數據量、用戶新增節點數量和CN數量相關,通常為小時級。
數據重分布也包含兩種模式,read-only模式和insert模式,與構建新節點不同的是,數據重分布時間較長,通常為小時級至天級,具體需要依據用戶表數據規模、磁盤類型進行估計。
綜上,構建新節點和數據重分布可能會對用戶業務造成一定影響,為減少對用戶業務的影響,通常用戶會選擇業務低峰期進行擴容,然而,用戶業務低峰期有可能是不連續的,例如說,用戶業務低峰期為每天的00:00:00至05:00:00,而數據重分布時長總長為12小時,也就是說用戶擴容可能會持續三天,每天只有5小時的擴容時間。為實現該目標,GaussDB(DWS)提供了分段擴容方案,雖然目前分段擴容方案已經逐步成熟,在多個局點取得了良好的效果,獲得了用戶的好評,但現階段分段擴容方案依然面臨著人力成本投入過高的問題。在分段擴容方案實施過程中,運維人員需要在用戶業務低峰期,手動在后臺通過命令行執行數據重分布,在用戶低峰期時間窗結束時,再手動暫停重分布。
為了解決人力成本投入過高的問題,GaussDB(DWS)利用調度器(https://bbs.huaweicloud.com/blogs/262904)功能,實現了智能擴容方案。相比于已有的擴容方案,調度模式擴容具備以下特點:
【調度擴容-時間窗】
在調度模式重分布方案中,用戶需預先將重分布時間窗信息寫入配置文件,而調度器將自動在指定時間窗內執行重分布,調度器會在每個時間窗開始時,將重分布進程拉起,并在每個時間窗結束時,自動將重分布暫停。
若在所有時間窗耗盡后,重分布依然未完成,將進行告警處理,需要用戶重新配置新的時間窗。
【調度模式擴容-容錯】
在數據重分布過程中,可能會出現集群網絡閃斷,CN/DN進程重啟,或者錯表壞表的情況,會導致數據重分布失敗。在調度模式擴容過程中,具備一定的容錯能力,若發生部份表重分布失敗,將跳過失敗的表,繼續重分布其他表,以避免浪費低峰期時間窗。對于重分布失敗的表,需要用戶手動修復重分布失敗的表,或通知調度器進行重試。
【調度模式擴容-并發調節】
通常情況下,重分布會占用用戶IO資源,現有擴容方案通過并發數量實現IO資源控制,高并發表示占用IO資源較高,低并發表示占用IO資源較少,現網實施過程中,通常通過手動調整并發數實現IO控制,需要運維人員實時跟蹤擴容IO占用。
在調度模式重分布過程中,支持智能并發調節,調度器依據集群IO狀態,自動執行并發調節。其中集群IO狀態依據木桶原理,以集群中IO負載最高的節點作為集群整體IO。
【調度模式擴容-優先級表】
數據重分布支持“早投資早收益”的原則,即重分布完成的表將立即獲得算力和容量的提升。因此,在調度模式重分布過程中,支持實時變更修改重分布優先級,用戶可以手動指定表重分布順序,對于用戶業務頻繁訪問的表,可優先重分布,以立即獲取算力和容量的提升。
【調度模式擴容-表重分布資源估計】
在調度模式重分布過程中,調度器將針對每張表的重分布執行時長進行估計,若當前時間窗不足以完成該表的重分布,則調度器不會針對該表進行重分布。
【調度模式擴容-多庫并行】
調度模式重分布支持多庫并發執行重分布。
調度模式重分布在已有擴容方案的基礎上,依據現網擴容實時方案的反饋結果進行改進,主要針對人力成本、易用性進行改善,未來會成為GaussDB(DWS)主流擴容實施方案。
Gauss AP 數據倉庫服務 GaussDB(DWS) 運維
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。