HBase使用最佳實踐-HBase Bulkload原理介紹

      網友投稿 1118 2022-05-29

      一、介紹

      HBase有多種方式把數據load進去,最直接的方式是通過HBase Client API逐條寫入,或通過MapReduce調用TableOutputFormat方法寫入,但它們都不是最有效的方式。HBase還提供了另一種比較有效的加載數據方式:ImportTsv工具將數據轉換成HBase內部的組織格式輸出成HFile文件;completebulkload工具將ImportTsv生成的文件直接加載到HBase集群內。使用BulkLoad 將會比使用簡單HBase API方式占用更少的CPU和網絡資源。

      2.HBase BulkLoad原理

      HBase BulkLoad包含兩個主要步驟:

      通過MapReduce任務來準備數據;

      將數據加載到HBase中;

      2.1? ? MR任務準備數據

      HBase使用最佳實踐-HBase Bulkload原理介紹

      MapReduce的執行過程分為Map端、Reduce端。Map函數輸出的經過partitioner已經確定了Reducer,所有這些信息在Map端將寫入到本地磁盤上;Reducer端通過Fetcher不斷從已完成的map上獲取本Reducer相關的數據,所有獲取的數據將合并在一起然后再交由Reducer函數處理,最終結果在Reducer端輸出。

      HBase BulkLoad也需要經過Map端和Reduce端。其中Map端主要完成數據轉換,根據內部算法將輸入文件進行拆分,每個拆分會對應一個Map任務來進行處理;每個Map任務按行讀取文件的內容,將每行數據轉換為HBase相關對象,最終保存在本地文件系統。

      Reduce端主要是讀取本地文件系統,然后按照HBase底層的HFile文件格式生產相應文件,并保存在HDFS目錄。

      2.2? ? ? 加載數據

      通過MapReduce程序生產了HFile文件,但是并沒有導入HBase中。這時需要通過completebulkload工具,將生產的HFile文件導入已經運行的HBase中,從而客戶可以通過HBase獲取到相關數據。

      大體上分為兩個階段:

      掃描出HDFS上的待導入的HFile。

      針對每個HFile,加載到制定的HBase Region對應的數據目錄中。

      三. bulkload實驗樣例如附件所示

      附件: bulkload實驗開源.docx 343.04KB 下載次數:4次

      附件: bulkload實驗_華為.docx 0B 下載次數:3次

      EI企業智能 FusionInsight HBase

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:使用linux搭建單機elk環境
      下一篇:在鯤鵬云服務器制作keycloak docker鏡像
      相關文章
      亚洲同性男gay网站在线观看| 亚洲AV永久青草无码精品| 久久亚洲AV成人无码国产| 亚洲桃色AV无码| 国产性爱在线观看亚洲黄色一级片| 亚洲妇女熟BBW| 亚洲国产精品免费观看| 亚洲制服丝袜精品久久| 亚洲国产精品日韩在线| 7777久久亚洲中文字幕蜜桃| 亚洲日本一区二区| 亚洲免费视频在线观看| 亚洲三级电影网址| 久久久无码精品亚洲日韩京东传媒| 久久精品国产96精品亚洲| 亚洲av日韩av不卡在线观看 | 久久精品国产亚洲av四虎| 亚洲精品乱码久久久久久按摩 | 亚洲丰满熟女一区二区v| 久久精品国产亚洲AV忘忧草18| 亚洲一区二区三区国产精品无码| 亚洲av永久综合在线观看尤物| 77777亚洲午夜久久多喷| 亚洲综合精品第一页| 亚洲欧洲无卡二区视頻| 在线视频亚洲一区| 亚洲偷自拍拍综合网| 亚洲综合国产一区二区三区| 亚洲精品美女久久久久99| 久久精品亚洲视频| 亚洲精品日韩专区silk| avtt天堂网手机版亚洲| 亚洲精品美女久久久久久久| 精品久久久久亚洲| 久久久亚洲精品蜜桃臀 | 亚洲精品国产国语| 丰满亚洲大尺度无码无码专线 | 亚洲精品无码久久久久久| 日韩色日韩视频亚洲网站| 亚洲色偷偷综合亚洲AV伊人| 亚洲一区爱区精品无码|