亞寵展、全球寵物產業(yè)風向標——亞洲寵物展覽會深度解析
1026
2022-05-28
2.1.2 RAID技術
在正式介紹HDFS的設計之前,我想先帶大家回憶一下傳統(tǒng)的RAID(獨立冗余磁盤陣列)技術。
RAID技術是由加州大學伯克利分校在1987年提出的,最初是為了組合多個小的廉價磁盤來代替大的昂貴磁盤,同時希望磁盤損壞時不會使數據的訪問受損而開發(fā)出的一種數據保護技術。RAID可以提升硬盤速度和增大硬盤容量,并且提供容錯功能以確保數據安全性。它易于管理的優(yōu)點使得在任何一塊硬盤出現問題的情況下都可以繼續(xù)工作,應用程序不會受到損壞硬盤的影響。
1.?RAID 0
RAID 0的思路簡單來說是將每個文件拆分成多個數據塊,然后將各個數據塊分別存儲到多塊不同的磁盤之上。在讀寫文件的時候可以采用異步并行的方式同時操作多個數據塊,以此來提升文件的讀寫性能。其次通過這種方法也能突破單塊磁盤的存儲限制從而提升存儲容量,如圖2-1所示。
文件以數據塊為單位被平均存儲在不同的磁盤之上,兩塊磁盤之上不會存在相同的數據塊。
2.?RAID 1
RAID 1的思路簡單來說是將每個文件分成多個數據塊,然后同時將一個數塊冗余存儲到多塊不同磁盤之上。那么在一塊磁盤損壞的情況下不會造成數據的丟失,如圖2-2所示。
文件以數據塊為單位同時存儲在多塊磁盤之上,兩塊磁盤之上會存在相同的數據塊。
3.?HDFS與RAID
現在我們再回到HDFS這兒來。通過剛才對RAID技術的簡單回顧我們不難發(fā)現,從某種角度來看HDFS最根本的設計思路其實和RAID技術是一樣的,只是HDFS
是從軟件層面來實現的RAID。
HDFS首先以數據塊作為文件的最基本單元,然后通過分塊存儲的方式增強數據的讀寫性能并突破單機的物理存儲瓶頸(RAID 0)。接著使用數據塊多份冗余存儲的方式實現數據的可靠性,保證數據不會丟失(RAID 1)。
接下來我們介紹一下HDFS的一些重要特性。
大數據 Hadoop
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發(fā)現本站中有涉嫌抄襲或描述失實的內容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。