MapReduce學習(4)

      網友投稿 676 2025-04-02

      Map階段詳解

      在Job提交前,會先將待處理的文件進行分片 (Split)。MR框架默認將一個塊 (Block) 作為一個分片。客戶端應用可以重定義塊與分片的映射關系。

      Map階段先把數據放入一個環形內存緩沖區,當緩沖區數據達到80%左右時發生溢寫 (Spill),需將緩沖區中的數據寫入到本地磁盤。寫入本地磁盤之前通常需要做如下處理:

      分區 (Partition):默認采用Hash算法進行分區,MR框架根據Reduce Task個數來確定分區個數。具備相同Key值的記錄最終被送到相同的Reduce Task來處理。

      排序 (Sort):將Map輸出的記錄排序,例如將(‘Hi’,’1’),(‘Hello’,’1’)重新排序為(‘Hello’,’1’), (’Hi’,’1’)。

      組合 (Combine):這個動作MR框架默認是可選的。例如將 (’Hi’,’1’), (’Hi’,’1’),(‘Hello’,’1’), (Hello’,’1’)進行合并操作為 (’Hi’,’2’), (‘Hello’,’2’)。

      合并 (Spill):Map Task在處理后會產生很多的溢出文件(spill file),這時需將多個溢出文件進行合并處理,生成一個經過分區和排序的Spill File (MOF:MapOutFile)。為減少寫入磁盤的數據量,MR支持對MOF進行壓縮后再寫入。

      MapReduce學習(4)

      MapReduce

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:更好地了解定制
      下一篇:2019wps怎么解壓
      相關文章
      亚洲高清无在码在线电影不卡| 亚洲欧美在线x视频| 97se亚洲综合在线| 亚洲av无码专区在线播放| 国产成人亚洲综合| 亚洲综合色视频在线观看| 亚洲成?v人片天堂网无码| 老子影院午夜伦不卡亚洲| 亚洲成a∨人片在无码2023| 亚洲精品无码久久久久YW| 亚洲国产精品99久久久久久| 亚洲国产精品自在自线观看| 亚洲成a人无码亚洲成av无码| 亚洲精品国产suv一区88| 亚洲av永久无码一区二区三区| 亚洲国产成人无码AV在线| 亚洲a无码综合a国产av中文| 丁香亚洲综合五月天婷婷| 男人的天堂亚洲一区二区三区 | 亚洲一区二区三区国产精华液| 亚洲精品天堂在线观看| 亚洲欧洲无码一区二区三区| 亚洲Aⅴ在线无码播放毛片一线天| 国产精品久久久久久亚洲影视| 亚洲av成人一区二区三区在线观看| 无码国产亚洲日韩国精品视频一区二区三区 | 国产精品亚洲午夜一区二区三区| 久久乐国产综合亚洲精品| 亚洲欧美日韩中文高清www777| 亚洲av成本人无码网站| 亚洲美女在线国产| 亚洲精品美女久久777777| 亚洲福利视频一区| 久久精品亚洲中文字幕无码麻豆 | 亚洲日本在线观看视频| 亚洲精品无码久久久久去q| 亚洲人成网址在线观看| 亚洲六月丁香六月婷婷色伊人| 亚洲日韩国产欧美一区二区三区 | 亚洲精品偷拍视频免费观看| 亚洲欧洲日产国码无码久久99|