亚洲日本VA午夜在线电影,久久91亚洲人成电影网站,亚洲免费在线观看视频

網友投稿 920 2022-05-29

這篇文章是我閱讀 MapReduce 論文：《MapReduce: Simplified Data Processing on Large Clusters》的筆記，這篇筆記概述了 MapReduce 是什么，它的工作流程，一些細節問題，以及我的個人理解與思考。

MapReduce 是什么？

MapReduce 是 Google設計的一種用于大規模數據集的分布式模型，它具有支持并行計算、容錯、易使用等特點。它的設計目標如下：

支持并行

用于分布式

能夠進行錯誤處理（比如機器崩潰）

易于使用（程序員友好）

負載均衡

模型流程

MapReduce 模型主要分為 2 個部分：Map 和 Reduce。

在 Map 過程中，Map 函數會獲取輸入的數據，產生一個臨時中間值，它是一個 K/V 對，然后MapReduce Library 會按 Key 值給鍵值對（K/V）分組然后傳遞給 Reduce 函數。而后，Reduce 接收到了這些 K/V 對，會將它們合并。

以論文中的字數統計程序為例：

現在我們來考慮，如果我們有許多文檔，然后我們想要統計在這些文檔中每個字出現的次數，現在用 MapReduce 來解決這個問題。Map 函數所做的工作，就是進行分詞，產生一組形如下表的 K/V 鍵值對：

然后將這組鍵值對傳遞給 Reduce，由 Reduce 進行合并。

MapReduce 閱讀筆記

具體流程如下：

由用戶程序中調用的 MapReduce Library 將文件分成 M 塊（M 要遠大于 Map Worker 的數量，每塊大小16MB~64MB），此時，進入 MapReduce 過程；

由 Master 給空閑的 Worker 分配任務，共有 M 個 Map 任務，R 個 Reduce 任務；

Map Worker 讀取文件，將文件處理為 K/V 鍵值對，K/V 鍵值對緩存于內存中（此時存在一個問題，如果斷電怎么辦？往下看后邊有解釋）；

將緩存于內存的 K/V 鍵值對寫入磁盤，分成 R 堆（分堆方法有很多種，論文中提到了使用 Hash 散列函數），然后將結果發送給 Master；

Master 將這些 K/V 鍵值對的存儲地址告知 Reduce，Reduce Worker 通過 RPC（遠程過程調用）進行讀取，讀取完畢之后會根據 Key 值進行排序（這樣，相同 Key 值的就會在一起。但是存在一個問題，如果內存不夠大，排序該怎么進行？可以使用外部排序）；

Reduce Worker 將已經排序的結果進行遍歷，將每個 Key 值所對應的一組 Value，所組成的傳遞給用戶所編寫的 reduce 函數進行處理；

所有的 Map，Reduce 任務都完成后，告知用戶程序，MapReduce 已經結束，返回用戶程序。

容錯處理（Fault-Tolerance）

MapReduce 中的容錯處理是非常重要的，因為MapReduce 是運行于分布式環境中的，在分布式環境中經常會有機器出現錯誤，我們不能讓個別機器的錯誤影響到整體。

Worker 崩潰

Master 通過定期給 Worker 發送心跳（heartbeat）來檢測 Worker 是否還在正常工作，如果 Worker 無應答或者是應答有誤，我們認定它已經宕機（fail）。如果正在工作的 Worker 宕機了，那么運行在它上面的 map 任務會進行初始化（初始狀態為 idle，任務還有其他2種狀態，in-progress處理中，completed 已完成），重新被分配到正常的 Worker 上。

如果說 Map Worker 已經完成了一些工作，我們仍然要對運行在它上面的所有任務重新進行分配，這是為什么呢？這里同時可以解決上面的那個問題。因為 Map Worker 處理后的中間結果存在于內存中，或者是 local disk 中，一旦它宕機，這些數據就獲取不到了。

但是對于 Reduce Worker，它完成的任務不用重做，因為它處理后的結果是保存在全局存儲中的。

如果，在 Map Worker A 宕機之后，它所做的任務被重新分配給了 Map Worker B，后邊的 Reduce Worker 會被告知，A 已經宕機，要去 B 去讀取數據。

Master 崩潰

如果說 MapReduce 的 Master 宕機了，又該如何處理呢？

MapReduce 中的 Master 會定期進行 checkpoint 備份，如果 Master 宕機，會根據之前的 checkpoint 進行恢復，但是恢復期間，MapReduce 任務會中斷。

一些細節問題

1. 考慮用戶編寫的 reduce 函數是確定的（deterministic，對于同樣的輸入執行的結果是一樣的），如果有多個 Reduce Worker 都執行了一個 Reduce 任務該怎么辦？

因為用戶的 reduce 函數是 deterministic 的，所以即使有多個 Reduce Worker 都執行了同一個任務，但是它們執行的結果都是一樣的，并不影響最后的結果。

2. 如果用戶編寫的 reduce 函數是不確定（non-deterministic）的呢？

正是因為 reduce 函數是 non-deterministic 的，本來每次執行的結果也不確定，所以更不會產生影響。

3. 我們所需要處理的輸入文件是如何保存的？

Input 文件保存于 GFS 中，GFS 會將它們分塊保存（每塊16MB~64MB），GFS 會對每個文件有3個備份，備份在不同的機器上。

4. Master 是如何分配任務的？

遵循就『近』原則，將任務分配給離任務所保存的位置最『近』的 Worker，這里對『近』的定義是網絡層面上的，比如說在同一個交換機下的兩個機器就是距離『近』的。

5. MapReduce 是如何做到負載均衡的？

一開始將文件分塊時，分為 M 塊，遠大于 Map Worker 的數量就有助于負載均衡。同時，這樣做還有一個好處，就是當一個 Worker 宕機的時候，可以將任務迅速分配開來，分到多個 Worker 上去。如果 M 比較小，有可能當一個 Worker 宕機時，它的任務不夠分配到剩下的 Worker 中，會有 Worker 閑置。

6. 如何解決 straggler 問題（其他 Worker 都已經完成了自己的任務，但是有一個異常慢的機器，它還有任務沒完成，拖慢了整體的速度）？

MapReduce 有一種機制應對這種情況：MapReduce 會對未完成的任務（in-progress）定時執行備份執行操作（即，把這些正在某些 Worker 上執行但未完成的任務再次分配給其他 Worker 去執行），不論這個任務被哪個 Worker 完成都會被標記為已完成。

7. 如果在 Map 任務中有一個 key 特別多，可能會拖慢整個網絡的速度，該怎么辦？（例如，在字數統計的例子中，the 這個詞的數量特別多）

MapReduce 給用戶提供了一個 Combiner 函數，這個函數可以將結果在發送到網絡之前進行合并，例如發送鍵值對<”by”, 3>。

MapReduce

學習 筆記20170601">【PMP】學習 筆記20170601

920 2022-05-29

MRS 3.0.x獲取Kafka服務指標Java樣例

920 2022-05-29

課堂 筆記">HTML課堂 筆記

920 2022-05-29

MapReduce 閱讀 筆記

學習 筆記20170601">【PMP】學習 筆記20170601

MRS 3.0.x獲取Kafka服務指標Java樣例

課堂 筆記">HTML課堂 筆記

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接