50億海量數據如何高效存儲和分析? GaussDB (for Cassandra) 3個秘訣搞定

      網友投稿 851 2022-05-29

      當下,信息社會正在從互聯網時代走向物聯網時代,信息交互變得更加龐雜、高效和智能。對于互聯網公司和IOT企業來說,既是機遇,也是挑戰。因為,企業不可避免的要面對數據量劇增帶來的一系列問題:如何高效存儲和擴容,如何在對原有業務改動最小的情況下做到智能化和實時分析。

      針對挑戰,華為云GaussDB (for Cassandra) 為客戶提供了強擴展、高存儲、高效導入/導出和實時分析等一系列能力,并成功服務了眾多互聯網公司和IOT企業,獲得了客戶的高度認可和支持。本文將以其中一個客戶業務的痛點問題舉例,聊聊高效存儲和實時分析的3個秘訣。

      海量存儲,PB級無感擴展

      50億海量數據如何高效存儲和分析? GaussDB (for Cassandra) 3個秘訣搞定

      該用戶在線下本地化部署使用數據庫或者使用其他的存儲為云盤的數據庫時,常常需要在容量達到閾值時,提前規劃和申購存儲資源,可能還需要連帶擴容不必要的計算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構,可單獨擴展存儲,高效擴容,業務無感,最高可擴展到PB級。

      此外,客戶為了做大數據分析,將數據庫中的數據再寫入一份到HDFS中,供MapReduce和Spark分析,同時需要維護兩套資源,維護和資源成本成為了痛點。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數據庫存儲和對接大數據分析的功能,同時GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發,而不是資源管理。

      數據變更捕獲和實時分析

      客戶的一個使用場景需要將爬蟲或用戶輸入的數據,進行在線分析和實時推薦業務,該業務中全量數據達到了50億條,但增量數據不足5億,分析對象主要是每日新增數據。在這個場景中,GaussDB (for Cassandra)為客戶提供了streaming服務+實時分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數據讀寫和實時分析并行,解決方案如下圖,該解決方案主要有以下幾個階段:

      客戶業務用過開源驅動寫入數據到GaussDB (for Cassandra)

      GaussDB (for Cassandra)對外提供streaming接口,該接口可獲取數據變更捕獲

      客戶構建的流服務組件讀取streaming接口數據寫入到指定的Kafka隊列

      Kafka 隊列將streaming數據寫入到Spark或者Flink中

      客戶在Spark中可對增量數據做分析,也可合并之后做全量分析

      全量數據導出分析

      客戶的另一個業務需要周期性對全量數據進行分析和處理,但不想影響在線業務,希望在閑時處理。GaussDB (for Cassandra)提供了全量數據導出和分析解決方案,可在業務低峰期觸發任務進行數據導出和冷數據分析,數據導出速率是開源的10+倍,同時做到對業務讀寫基本無影響。如下為互聯網客戶每周定期導出數據分析用戶畫像的解決方案,該方案有以下幾個階段:

      客戶根據需求配置ECS規格,并掛載obsfs并行文件系統

      客戶在DLF上配置導出作業,包括ECS信息,導出參數和定時任務

      CDM下發作業任務

      ECS上的導出任務將GaussDB (for Cassandra)中的指定表指定條件的數據導出到obsfs

      Spark從obsfs中讀取全量數據進行數據分析

      通過這3個秘訣,華為云GaussDB (for Cassandra)完美解決了難擴展、高成本、變更不及時等問題,實現了海量數據的高效存儲和實時分析,為互聯網公司和IOT企業的數字化發展提供了更多可能。欲了解更多GaussDB (for Cassandra)詳情信息,歡迎移步華為云官網。

      杭州西安深圳簡歷投遞:zhaojuan.zhao@huawei.com

      更多技術文章,請關注:高斯Cassandra官方博客

      更多產品信息,請關注:高斯Cassandra產品官方主頁

      spark 云數據庫 GaussDB(for Cassandra) 大數據

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:【干貨分享】使用Redis的用戶要請往這瞅瞅,小心數據泄漏!
      下一篇:CentOS 7下NFS 服務器和客戶端安裝
      相關文章
      亚洲av成人无码久久精品| 亚洲欧洲日本在线| 久久精品国产亚洲5555| 亚洲av永久无码| 在线亚洲高清揄拍自拍一品区| 久久亚洲精品成人无码网站| 亚洲国产一区二区a毛片| 亚洲AV无码乱码国产麻豆| 亚洲中文字幕在线乱码| 国产亚洲精品无码专区| 亚洲天堂中文字幕在线| 亚洲成年看片在线观看| 日本中文一区二区三区亚洲| 亚洲av无码专区青青草原| 亚洲第一综合天堂另类专| 亚洲av成人中文无码专区| 亚洲国产成人久久精品软件| 亚洲AV女人18毛片水真多| 亚洲av片在线观看| 亚洲成a人片在线播放| 亚洲AV伊人久久青青草原| 亚洲精品NV久久久久久久久久| 亚洲第一页日韩专区| 久久亚洲av无码精品浪潮| 在线观看亚洲精品国产| 亚洲精品午夜无码电影网| 国产亚洲精品国产| 亚洲国产精品久久| 亚洲综合激情另类小说区| 亚洲另类自拍丝袜第1页| 国产成人精品日本亚洲直接| 亚洲欧美日韩综合久久久久| 亚洲男人的天堂网站| 久久久久亚洲AV无码去区首| 亚洲福利在线播放| 国产亚洲人成无码网在线观看| 久久夜色精品国产嚕嚕亚洲av| 久久精品夜色国产亚洲av| 亚洲综合无码一区二区三区| 亚洲制服丝袜一区二区三区| 亚洲乱亚洲乱妇24p|