五大關(guān)鍵能力,華為云原生數(shù)據(jù)倉庫GaussDB(DWS)深度技術(shù)解讀

      網(wǎng)友投稿 722 2022-05-30

      “云原生”在2020年成為備受矚目的熱詞,云原生在確保企業(yè)數(shù)字化轉(zhuǎn)型中資源快速供給、按需使用的同時,支持敏捷的應(yīng)用開發(fā)、穩(wěn)定的交付運(yùn)維,加速企業(yè)的敏捷創(chuàng)新,是企業(yè)數(shù)字化轉(zhuǎn)型、智能化升級的必經(jīng)之路。

      GaussDB(DWS)云原生數(shù)據(jù)倉庫五大核心競爭力

      關(guān)鍵能力1- 融:云原生架構(gòu),支持跨源數(shù)據(jù)融合分析、冷熱數(shù)據(jù)分級存儲

      融合分析能力是云原生數(shù)據(jù)倉庫GaussDB(DWS)核心亮點(diǎn)之一。GaussDB(DWS)采用一套SQL引擎,支持Oracle、Mysql、HDFS等多源數(shù)據(jù)融合分析,并通過算子下推、加速集群等技術(shù)對分析性能進(jìn)行了大幅優(yōu)化,在數(shù)據(jù)免搬遷的前提下,實現(xiàn)了跨源數(shù)據(jù)免搬遷、高效分析。

      GaussDB(DWS)云原生數(shù)據(jù)倉庫支持冷熱數(shù)據(jù)多溫存儲,熱數(shù)據(jù)存儲于數(shù)倉內(nèi)部,以獲得良好的查詢分析性能,冷數(shù)據(jù)可分級存儲到更低成本的OBS中,不僅降低存儲成本,并且在OBS內(nèi),通過合法鑒權(quán),數(shù)據(jù)能夠共享開放,供其他引擎處理分析,GaussDB(DWS)當(dāng)前已經(jīng)支持表內(nèi)不同分區(qū)間的冷熱數(shù)據(jù)存儲,未來還將支持更細(xì)粒度、更加智能的冷熱數(shù)據(jù)管理。

      關(guān)鍵能力2 - 快 :聚合云海量算力,軟硬垂直優(yōu)化,效率最優(yōu)

      第二大特點(diǎn),快。GaussDB(DWS)主要通過多層級全并行架構(gòu)來實現(xiàn)。

      并行的第一個層級,是集群內(nèi)物理節(jié)點(diǎn)間的并行,CN將計劃動態(tài)分布到多個服務(wù)器,通過分布式執(zhí)行框架,將查詢計劃在集群內(nèi)多臺物理節(jié)點(diǎn)并行執(zhí)行;

      第二個層級,是算子級并行,在每個服務(wù)器內(nèi),查詢算子能夠利用一個節(jié)點(diǎn)內(nèi)多個CPU核心進(jìn)行并行計算;

      第三個層級,是在一個CPU核心的指令序列中支持SIMD指令,結(jié)合我們的向量化引擎,實現(xiàn)一個指令同時操作多條數(shù)據(jù)。

      同時,我們還集成了現(xiàn)代編譯器技術(shù),利用LLVM框架,運(yùn)行時動態(tài)生成執(zhí)行代碼,減少無關(guān)指令生成;數(shù)據(jù)量越大,可獲得的性能提升效果越好。

      正是因為有這樣一個全并行計算引擎,我們可以將系統(tǒng)資源最大化利用,提供極致的分析性能。

      隨著金融風(fēng)控,以及IoT場景對數(shù)據(jù)實時處理分析的訴求,我們正式發(fā)布了GaussDB(DWS)實時數(shù)倉版本,快上加快,將快發(fā)揮到極致。

      實時數(shù)倉的快主要體現(xiàn)在兩個方面。首先是入庫速度快,與傳統(tǒng)數(shù)倉不同,數(shù)據(jù)的加載不再是T+1的大批量加載模式,而是更加實時的高并發(fā)小批量模式。DWS實時數(shù)倉時序數(shù)據(jù)單機(jī)入庫性能達(dá)10w/s,流數(shù)據(jù)達(dá)60w/s,并能夠線性擴(kuò)展。其次是計算分析快,支持基于流式數(shù)據(jù)的持續(xù)計算查詢,預(yù)置了豐富的時序和流處理函數(shù),通過SQL即可完成復(fù)雜流式計算,可實現(xiàn)億級數(shù)據(jù),秒級聚合。

      正所謂一切皆SQL,經(jīng)歷了幾十年的發(fā)展,SQL依然是最簡潔高效的數(shù)據(jù)開發(fā)語言,能極大的簡化應(yīng)用開發(fā)。以Druid監(jiān)控的一個場景為例,原先1900行的腳本,在GaussDB(DWS)實時數(shù)倉中采用SQL語句,僅用150行代碼就能實現(xiàn)同樣的功能,開發(fā)效率提升10+倍。

      關(guān)鍵能力3 - 大 :云分布式、按需擴(kuò)展,支持10PB級數(shù)據(jù),大而有序

      第三個特點(diǎn),大。我們在Shared-Nothing全分布式架構(gòu)下,不僅實現(xiàn)了容量線性擴(kuò)展,在數(shù)據(jù)加載、數(shù)據(jù)分析性能上同樣實現(xiàn)了線性擴(kuò)展,從小集群逐步擴(kuò)展到大集群規(guī)模過程中,隨著節(jié)點(diǎn)數(shù)增加,線性擴(kuò)展比可以高達(dá)0.9。

      從技術(shù)上看,大集群需要攻克通信風(fēng)暴、故障容錯和數(shù)據(jù)備份恢復(fù)一致性三大難題。我們通過獨(dú)創(chuàng)的Multi-Streams多流通信技術(shù),支持集群內(nèi)百億級的通信連接,突破了大規(guī)模通信的技術(shù)瓶頸。在高可用方面,大規(guī)模集群下硬件故障成為常態(tài),我們積累了多年,做了大量硬件故障感知及容錯處理的工作,來保證大規(guī)模集群下的集群自愈和業(yè)務(wù)可用。在備份恢復(fù)方面,我們不僅通過多層級并行實現(xiàn)了線性擴(kuò)展,還做到了完全在線的全局強(qiáng)一致物理備份,甚至支持表級別的細(xì)粒度恢復(fù),競爭力達(dá)到了業(yè)界領(lǐng)先。

      GaussDB(DWS)現(xiàn)網(wǎng)運(yùn)行的PB級數(shù)據(jù)量以上的大集群已經(jīng)有10+個,最大商用單集群規(guī)模達(dá)到240節(jié)點(diǎn)。在產(chǎn)品能力上,GaussDB(DWS)可擴(kuò)展至2048節(jié)點(diǎn),并且該規(guī)模在12月已通過信通院的權(quán)威評測,樹立了業(yè)界新標(biāo)桿。另外,我們還實現(xiàn)了邏輯集群特性,一套物理集群可針對不同業(yè)務(wù)劃分多個邏輯集群,數(shù)據(jù)相互隔離,支持跨邏輯集群的計算資源調(diào)動。通過邏輯集群,可以進(jìn)一步擴(kuò)展集群的規(guī)模。

      五大關(guān)鍵能力,華為云原生數(shù)據(jù)倉庫GaussDB(DWS)深度技術(shù)解讀

      關(guān)鍵能力4 - 穩(wěn):高可用設(shè)計,支持跨AZ容災(zāi),數(shù)據(jù)無憂、永遠(yuǎn)在線

      第四大特點(diǎn),穩(wěn)。首先,產(chǎn)品所有內(nèi)部組件CN、DN、GTM、CM等采用多活或主備設(shè)計,通過集群管理進(jìn)行故障檢測和切換。其次,在硬件層面,除了最基本的宕機(jī)、斷網(wǎng)的直接故障外,GaussDB(DWS)還針對夯死、慢節(jié)點(diǎn)、亞健康等僵而不死的復(fù)雜場景,做了大量的建模和針對性優(yōu)化,能夠?qū)崿F(xiàn)故障的準(zhǔn)確探測和自愈。

      在數(shù)據(jù)可靠性方面,對于數(shù)倉而言,數(shù)據(jù)存一份有單點(diǎn)故障問題,存三份又太浪費(fèi)資源,一般來講數(shù)據(jù)一主一備是個相對合理的選擇,但在故障造成網(wǎng)絡(luò)分區(qū)的場景下,很容易出現(xiàn)雙主“腦裂”問題,造成數(shù)據(jù)不一致。GaussDB(DWS)獨(dú)創(chuàng)的“主-備-從”技術(shù),引入“主”、“備”、“從”三種角色。集群正常時數(shù)據(jù)僅在主備間進(jìn)行同步,發(fā)生單點(diǎn)故障時數(shù)據(jù)向“從”同步,從而保證任何狀況下都有兩副本的數(shù)據(jù)冗余。在網(wǎng)絡(luò)分區(qū)等異常場景下,一旦主備產(chǎn)生數(shù)據(jù)分叉,從備又可以承擔(dān)仲裁者的角色,通過日志比對找到持有正確數(shù)據(jù)的節(jié)點(diǎn)繼續(xù)提供服務(wù)。從而既完美解決了一主一備的腦裂問題,又能夠僅用兩副本空間代價實現(xiàn)接近三副本的可靠性。

      對于可靠性要求更高的客戶,我們還提供了雙集群容災(zāi)能力,通過跨AZ、跨Region的物理復(fù)制,實現(xiàn)異構(gòu)集群容災(zāi)。

      時間有限,我們本次只粗略介紹了GaussDB(DWS)高可用技術(shù)的一小部分,通過多年的技術(shù)積累,我們基本做到了“數(shù)據(jù)無憂、永遠(yuǎn)在線”的目標(biāo)。

      關(guān)鍵能力5 - 易:快速遷移傳統(tǒng)數(shù)倉,助力企業(yè)輕松上云

      第五個特點(diǎn),易。利用GaussDB(DWS)的遷移工具,用戶能夠非常容易的將數(shù)據(jù)從線下的Teradata、Oracle等傳統(tǒng)數(shù)倉快速搬遷上云。

      遷移主要分為應(yīng)用遷移和數(shù)據(jù)遷移兩部分。

      應(yīng)用遷移是指由于線下傳統(tǒng)數(shù)據(jù)倉庫的語法及功能不同,導(dǎo)致業(yè)務(wù)腳本、存儲過程等需要改造適配,為此,GaussDB(DWS)把深耕市場多年、成功遷移數(shù)十套Teradata和Oracle數(shù)倉的成功經(jīng)驗,開發(fā)為一套完整的語法遷移工具,能夠支持對數(shù)據(jù)類型、SQL語法、DSQL腳本、存儲過程等語法的自動化轉(zhuǎn)換,對Teradata的常用語法自動化轉(zhuǎn)換率超過90%,對Oracle超過60%。

      對于動輒幾十TB、數(shù)百TB的海量數(shù)據(jù)而言,數(shù)據(jù)遷移速度極大程度影響業(yè)務(wù)停機(jī)的時間,這對網(wǎng)絡(luò)、入庫能力和遷移工具的效率都提出了很高的要求,以我們?nèi)ツ甑哪炒螖?shù)據(jù)搬遷為例,1PB的數(shù)據(jù)僅用11小時即完成傳輸,加上準(zhǔn)備工作和數(shù)據(jù)校驗的時間,端到端也僅用時17小時,搬遷速率91TB/小時,并且做到數(shù)據(jù)0丟失。

      GaussDB(DWS)經(jīng)過近10年的技術(shù)沉淀,已服務(wù)于全球1000+客戶,廣泛應(yīng)用于金融、政府、運(yùn)營商、交通、物流、互聯(lián)網(wǎng)等領(lǐng)域。

      篇幅有限,本次簡單解讀GaussDB(DWS)的幾個關(guān)鍵能力,了解更多內(nèi)容請掃碼關(guān)注GaussDB(DWS)公眾號哦~

      華為云數(shù)倉GaussDB(DWS)

      和您分享最新最全的PB級數(shù)倉黑科技

      EI企業(yè)智能 Gauss AP 數(shù)據(jù)倉庫服務(wù) GaussDB(DWS)

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:為客戶與伙伴持續(xù)創(chuàng)造價值,華為發(fā)布數(shù)字基礎(chǔ)設(shè)施七大創(chuàng)新
      下一篇:數(shù)據(jù)湖探索的Serverless計算
      相關(guān)文章
      亚洲女初尝黑人巨高清| 亚洲春色另类小说| 亚洲最大中文字幕| 亚洲AV无码专区电影在线观看| 国产亚洲精久久久久久无码| 亚洲成av人片在线天堂无| 亚洲色偷偷偷鲁综合| 日本亚洲色大成网站www久久| 国产成人无码综合亚洲日韩| 久久人午夜亚洲精品无码区| 亚洲免费网站在线观看| 中文亚洲AV片不卡在线观看| 亚洲日韩乱码中文字幕| 亚洲视频在线观看视频| 亚洲中文久久精品无码| 亚洲人成网77777色在线播放| 怡红院亚洲怡红院首页| 国产亚洲精品福利在线无卡一| 国产亚洲精久久久久久无码AV | 亚洲特级aaaaaa毛片| 亚洲黄色一级毛片| 亚洲午夜精品一区二区公牛电影院 | 亚洲熟妇中文字幕五十中出| 亚洲色偷拍另类无码专区| 色久悠悠婷婷综合在线亚洲| 亚洲乱色熟女一区二区三区丝袜| 亚洲国产综合无码一区 | 亚洲成AV人片在线观看无码| 久久久久亚洲av无码专区导航| 亚洲欧洲自拍拍偷午夜色无码| 精品国产亚洲一区二区三区 | 亚洲中文字幕无码久久精品1| 亚洲欧洲日产国码av系列天堂 | 在线观看日本亚洲一区| 亚洲av永久无码一区二区三区| 亚洲香蕉在线观看| 亚洲一区中文字幕| 亚洲国产精品yw在线观看| 国产精品亚洲专区在线观看 | 亚洲成a人片77777kkkk| 亚洲高清无在码在线电影不卡|