大數據技術原理與應用之【HDFS】習題
答:分布式文件系統在物理結構上是由計算機集群中的多個節點構成的,這些節點分為兩類,一類叫“主節點”(Master Node)或者也被稱為“名稱結點”(NameNode),另一類叫“從節點”(Slave Node)或者也被稱為“數據節點”(DataNode)
答:在傳統的文件系統中,為了提高磁盤讀寫效率,一般以數據塊為單位,而不是以字節為單位。
HDFS中的塊,默認一個塊大小為64MB,而HDFS中的文件會被拆分成多個塊,每個塊作為獨立的單元進行存儲。HDFS在塊的大小的設計上明顯要大于普通文件系統。
答:名稱節點負責管理分布式文件系統系統的命名空間,記錄分布式文件系統中的每個文件中各個塊所在的數據節點的位置信息;
數據節點是分布式文件系統HDFS的工作節點,負責數據的存儲和讀取,會根據客戶端或者是名稱節點的調度來進行數據的存儲和檢索,并向名稱節點定期發送自己所存儲的塊的列表。
hadoop fs -ls
顯示
指定的文件的詳細信息
hadoop fs -cat
將
指定的文件的內容輸出到標準輸出
hadoop fs -mkdir
創建
指定的文件夾
hadoop fs -get [-ignorecrc] [-crc] 復制指定的文件到本地文件系統指定的文件或文件夾。-ignorecrc選項復制CRC校驗失敗的文件。使用-crc選項復制文件以及CRC信息。
hadoop fs -put 從本地文件系統中復制指定的單個或多個源文件到指定的目標文件系統中。也支持從標準輸入(stdin)中讀取輸入寫入目標文件系統。
hadoop fs -rmr
刪除
指定的文件夾及其的所有文件
Hadoop 大數據
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。