亚洲激情中文字幕,2048亚洲精品国产,中文亚洲AV片在线观看不卡

干貨，圖文詳解 HDFS 的工作機制及其原理

網友投稿 1614 2022-05-29

HDFS 是基于流數據訪問模式的分布式文件系統（HDFS放寬了一部分 POSIX約束，來實現流式讀取文件系統數據的目的），支持存儲海量的數據，可以運行在低成本的硬件上。其提供高吞吐量、高容錯性的數據訪問，非常適合大規模數據集上的應用。了解 HDFS 的工作機制，可以加深我們對分布式系統的理解，以及增強遇到問題時的分析解決能力，以下介紹下 HDFS 的工作機制。

如果想了解 HDFS ，可以參考這篇文章：HDFS 及其組成框架介紹。

一、機架感知

干貨，圖文詳解 HDFS 的工作機制及其原理

機架感知的設計，考慮到兩個方面：

不同節點之間的通信，希望在同一機架內進行（Hadoop集群會分布在很多機架上），而不是跨機架；

為了提高容錯能力，NameNode （名稱節點）會盡可能把數據塊的副本放在多個機架上。

DataNode 的網絡拓撲圖如下：

如上圖，D1、R1是交換機，最底層是 DataNode 。可執行腳本文件返回各 DataNode 的機架 ID ，即 RackID（比如，H1 的 parent 是R1，R1的 parent 是D1，則 H1 的 RackID=/D1/R1/H1）。

有了這些 RackID 信息，就可以計算任意兩臺 DataNode 之間的距離了：

distance(/D1/R1/H1,/D1/R1/H1)=0 //相同的 DataNode distance(/D1/R1/H1,/D1/R1/H2)=2 //同一個 Rack 下不同的 DataNode distance(/D1/R1/H1,/D1/R1/H4)=4 //同一 IDC 下不同的 DataNode distance(/D1/R1/H1,/D2/R3/H7)=6 //不同 IDC 下的 DataNode

~IDC是互聯網數據中心，可以理解為機房。~

默認情況下，HDFS 不能自動判斷集群中各個 DataNode 的網絡拓撲情況，集群默認都處在同一個機架名為 /default-rack的機架上（在這種情況下，任何一臺 DataNode 機器，不管在物理上是否是屬于同一個機架，都會被認為是在同一個機架下）。

通常，我們通過外在腳本實現機架感知，需要配置 net.topology.script.file.name屬性（屬性值一般是一個可執行腳本文件的路徑）。腳本接收一個值，再輸出一個值（一般都是接收 IP地址，輸出這個地址所對應的機架信息）。

二、副本冗余存儲策略

HDFS 上的文件對應的數據塊保存有多個副本（默認保存3個副本），且提供容錯機制，副本丟失或宕機（即死機）時自動恢復。

下面，以保存 3個副本為例：

第一個副本（副本一）：放置在上傳文件的數據節點上（若是在集群外提交，則隨機挑選一個 CPU比較空閑、磁盤不太滿的節點）。

第二個副本（副本二）：放置在與第一個副本不同的機架的節點上。

第三個副本（副本三）：放置在與第二個副本相同機架的其他節點上。

如果有更多副本，那么這些副本隨機選擇節點存放。

需要注意的是，副本并不都是均勻分布在不同的機架上。

副本冗余存儲策略，主要有三個優點：

減少了機架間的數據傳輸，提高了寫操作的效率。（不會影響數據的可靠性和可用性，因為機架的錯誤遠遠比節點的錯誤小）

減少了讀取數據時所需的網絡傳輸總帶寬。（因為數據塊只放在兩個不同的機架上）

在不損害數據可靠性和讀取性能的情況下，改進了寫操作的性能。（一個副本在一個機架的一個節點上，另外兩個副本在另一個機架的不同節點上，其他副本則均勻分布在剩下的機架中。如 2.1 所介紹。）

三、文件傳輸過程

在 HDFS 中讀寫數據的過程都是通過數據流完成的。HDFS 提供了數據流的 I/O操作類（包括 FSDataInputStream 和 FSDataOutputStream ）

HDFS 文件讀取（即數據下載）過程如圖所示：

⑴ HDFS 客戶端通過 DistributeFileSystem 對象的 open() 方法打開需要讀取的文件。

⑵ DistributeFileSystem 向遠程的 NameNode 節點發起 RPC調用，得到文件的數據塊信息，返回數據塊列表。（對于每個數據塊，NameNode 返回該數據塊的 DataNode 地址）

⑶ DistributeFileSystem 返回一個 FSDataInputStream 對象給客戶端，客戶端調用 FSDataInputStream 對象的 read() 方法讀取數據。

⑷ 通過對數據流反復調用 read() 方法，把數據從數據節點傳輸到客戶端。

⑸ 當一個節點的數據讀取完畢時， DFSInputStream 對象會關閉與此數據節點的連接，然后連接此文件下一個數據塊的最近數據節點。

⑹ 當客戶端讀取完數據時，調用 FSDataInputStream 對象的 close() 方法關閉輸入流。

FSDataInputStream 輸入流類的常用方法：

pos 指定從輸入流中讀取數據的位置；offset 指定數據寫入緩沖區的位置（偏移量）；len 指定讀操作的最大字節數。

HDFS 文件寫入（即數據上傳）過程如圖所示：

⑴ 客戶端調用 DistributedFileSystem 對象的 create() 方法創建一個文件輸出流對象。

⑵ DistributedFileSystem 對象遠程的 NameNode 節點發起一次 RPC調用，NameNode 檢查這個文件是否存在，以及客戶端是否有權限新建文件。

⑶ 客戶端調用 FSDataOutputStream 對象的 write() 方法寫數據（數據鮮卑寫入緩沖區，再被切分為一個個數據包）。

⑷ 每個數據包被發送到由 NameNode 節點分配的一組數據節點中的一個數據節點上，在這組數據節點組成的管道上依次傳輸數據包。

⑸ 管道上的節點按反向順序返回確認信息，最終由管道的第一個數據節點將整條管道的確認信息發送給客戶端。

⑹ 客戶端完成寫入，調用 close() 方法關閉文件輸出流。

⑺ 通知 NameNode 文件寫入成功。

FSDataOutputStream 輸入流類的常用方法：

len 指定讀操作的最大字節數。

四、數據容錯

HDFS 能夠在出錯的情況下，保證數據存儲的可靠性。常見的出錯情況有 NameNode 節點出錯、DataNode 節點出錯和數據出錯這三種情況。

HDFS 中所有元數據都保存在 NameNode （名稱節點）上，NameNode 節點維護 edits 和 fsimage 這兩個文件。（如果這兩個文件損壞，HDFS 就會失效）

Hadoop 提供了兩個機制，來確保 NameNode 的安全：

把 NameNode 節點上的元數據信息同步存儲到其他文件系統（比如 NFS ），當 NameNode 出現故障時，HDFS 自動切換到備用的 NameNode 上（HDFS HA ，就是采用共享存儲系統來存儲 edits 的）。

運行一個 SecondaryNameNode 節點，當 NameNode 宕機時，利用 SecondaryNameNode 的元數據信息進行系統恢復（仍然會有部分數據丟失）。

通常，這兩個方法結合使用。

NameNode 通過心跳信號來檢測近期不發送心跳信號的 DataNode，并將其標志為宕機（每個 DataNode 周期性地向 NameNode 發送心跳信號），不再發送新的 I/O請求給它們。

數據塊需要重新復制的情況：

某個 DataNode 節點丟失；

DataNode 上的硬盤出錯；

某個副本損壞；

某個數據塊的副本系數低于設定值。

從 DataNode 獲取的數據塊，有可能本身就是損壞的（比如可能是因為網絡錯誤、軟件bug 或者 DataNode的存儲設備錯誤）。

HDFS 使用校驗和來判斷數據塊是否損壞。HDFS 的每個 DataNode 節點，保存了檢測校驗的日志（客戶端的每一次檢驗都會被記錄）。

BigData Pro 大數據大數據

干貨 | Docker中用到的主要Linux安全技術有哪些？">干貨 | Docker中用到的主要Linux安全技術有哪些？

1614 2022-05-29

面向對象編程 詳解">JavaScript面向對象編程 詳解

1614 2022-05-29

異步編程Ajax的詳解，并對其進行封裝整理">異步編程Ajax的詳解，并對其進行封裝整理

1614 2022-05-29

干貨，圖文 詳解 HDFS 的工作機制及其原理

干貨 | Docker中用到的主要Linux安全技術有哪些？">干貨 | Docker中用到的主要Linux安全技術有哪些？

面向對象編程 詳解">JavaScript面向對象編程 詳解

異步編程Ajax的詳解，并對其進行封裝整理">異步編程Ajax的詳解，并對其進行封裝整理

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統：重新定義家庭生活方式

友情鏈接