<fieldset id="cceqg"><menu id="cceqg"></menu></fieldset>

MapReduce 學習（4）

網友投稿 676 2025-04-02

Map階段詳解

在Job提交前，會先將待處理的文件進行分片 (Split)。MR框架默認將一個塊 (Block) 作為一個分片。客戶端應用可以重定義塊與分片的映射關系。

Map階段先把數據放入一個環形內存緩沖區，當緩沖區數據達到80%左右時發生溢寫 (Spill)，需將緩沖區中的數據寫入到本地磁盤。寫入本地磁盤之前通常需要做如下處理：

分區 (Partition)：默認采用Hash算法進行分區，MR框架根據Reduce Task個數來確定分區個數。具備相同Key值的記錄最終被送到相同的Reduce Task來處理。

排序 (Sort)：將Map輸出的記錄排序，例如將(‘Hi’,’1’),(‘Hello’,’1’)重新排序為(‘Hello’,’1’), (’Hi’,’1’)。

組合 (Combine)：這個動作MR框架默認是可選的。例如將 (’Hi’,’1’), (’Hi’,’1’),(‘Hello’,’1’), (Hello’,’1’)進行合并操作為 (’Hi’,’2’), (‘Hello’,’2’)。

合并 (Spill)：Map Task在處理后會產生很多的溢出文件(spill file)，這時需將多個溢出文件進行合并處理，生成一個經過分區和排序的Spill File (MOF:MapOutFile)。為減少寫入磁盤的數據量，MR支持對MOF進行壓縮后再寫入。

MapReduce學習（4）

MapReduce

版權聲明：本文內容由網絡用戶投稿，版權歸原作者所有，本站不擁有其著作權，亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容，請聯系我們jiasou666@gmail.com 處理，核實后本網站將在24小時內刪除侵權內容。

版權聲明：本文內容由網絡用戶投稿，版權歸原作者所有，本站不擁有其著作權，亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容，請聯系我們jiasou666@gmail.com 處理，核實后本網站將在24小時內刪除侵權內容。

標簽：MapReduce 學習

相關文章

學習 筆記20170601">【PMP】學習 筆記20170601

676 2025-04-02

前端 學習 -- NuxtJS學習筆記">大前端 學習 -- NuxtJS學習筆記

676 2025-04-02

MRS 3.0.x獲取Kafka服務指標Java樣例

676 2025-04-02

亚洲高清无在码在线电影不卡| 亚洲欧美在线x视频| 97se亚洲综合在线| 亚洲av无码专区在线播放| 国产成人亚洲综合| 亚洲综合色视频在线观看| 亚洲成?v人片天堂网无码| 老子影院午夜伦不卡亚洲| 亚洲成a∨人片在无码2023| 亚洲精品无码久久久久YW| 亚洲国产精品99久久久久久| 亚洲国产精品自在自线观看| 亚洲成a人无码亚洲成av无码| 亚洲精品国产suv一区88| 亚洲av永久无码一区二区三区| 亚洲国产成人无码AV在线| 亚洲a无码综合a国产av中文| 丁香亚洲综合五月天婷婷| 男人的天堂亚洲一区二区三区 | 亚洲一区二区三区国产精华液| 亚洲精品天堂在线观看| 亚洲欧洲无码一区二区三区| 亚洲Aⅴ在线无码播放毛片一线天| 国产精品久久久久久亚洲影视| 亚洲av成人一区二区三区在线观看| 无码国产亚洲日韩国精品视频一区二区三区 | 国产精品亚洲午夜一区二区三区| 久久乐国产综合亚洲精品| 亚洲欧美日韩中文高清www777| 亚洲av成本人无码网站| 亚洲美女在线国产| 亚洲精品美女久久777777| 亚洲福利视频一区| 久久精品亚洲中文字幕无码麻豆 | 亚洲日本在线观看视频| 亚洲精品无码久久久久去q| 亚洲人成网址在线观看| 亚洲六月丁香六月婷婷色伊人| 亚洲日韩国产欧美一区二区三区 | 亚洲精品偷拍视频免费观看| 亚洲欧洲日产国码无码久久99|