大數據技術為什么快?
在之前的博客《什么是大數據?看這一篇就足夠了!》中,小菌為大家較為詳細的介紹了一些關于大數據的知識。其中提到了大數據的四個特點,即海量化,多樣化,快速化和高價值。本篇博客,小菌決定就以
快速化
這個特點展開,為大家科普下大數據技術為什么快?
文章目錄
拓展性
縱向擴展
橫向擴展
分布式
資源集中(計算與存儲)
集中式計算
集中式存儲
分布式(計算與存儲)
分布式計算
分布式存儲
拓展性
單份數據
多份數據(數據復制)
模型
移動數據
移動計算程序
先讓我們來看下傳統數據與大數據處理方式的對比:
接下來小菌將根據這個四個角度來為各位小伙伴們好好分析。
拓展性
縱向擴展
表示在需要處理更多負載時通過提高單個系統處理能力的方法來解決問題。最簡單的情況就是為應用系統提供更為強大的硬件。
例如如果數據庫所在的服務器實例只有8G內存、低配CPU、小容量硬盤,進而導致了數據庫不能高效地運行,那么我們就可以通過將該服務器的內存擴展至16G、更換大容量硬盤或者更換高性能服務器來解決這個問題。
橫向擴展
是將服務分割為眾多的子服務并在負載平衡等技術的幫助下在應用中添加新的服務實例
例如如果數據庫所在的服務器實例只有一臺服務器,進而導致了數據庫不能高效地運行,那么我們就可以通過增加服務器數量,將其構成一個集群來解決這個問題。
分布式
傳統的方式資源(cpu/內存/硬盤)集中,大數據方式資源(cpu/內存/硬盤)分布(前提:同等配置的前提下)
資源集中(計算與存儲)
數據計算幾乎完全依賴于一臺中、大型的中心計算機的處理能力。和它相連的終端(用戶設備)具有各不相同的智能程度。實際上大多數終端完全不具有處理能力,僅僅作為一臺輸入輸出設備使用。
指建立一個龐大的數據庫,把各種信息存入其中,各種功能模塊圍繞信息庫的周圍并對信息庫進行錄入、修改、查詢、刪除等操作的組織方式。
分布式(計算與存儲)
是一種計算方法,是將該應用分解成許多小的部分,分配給多臺計算機進行處理。這樣可以節約整體計算時間,大大提高計算效率。
是一種數據存儲技術,通過網絡使用企業中的每臺機器上的磁盤空間,并將這些分散的存儲資源構成一個虛擬的存儲設備,數據分散的存儲在企業的各個角落,多臺服務器。
拓展性
傳統數據備份方式單份備份,大數據數據備份方式多分備份(數據復制,默認三個副本)
單份數據
多份數據(數據復制)
模型
傳統的計算模型是移動數據到程序端,大數據計算模型是移動程序到數據端。io 和網絡的使用率都非常低,且多節點存儲,多節點計算(眾人拾柴火焰高)
移動數據
移動計算程序
本次的分享就到這里了,喜歡的小伙伴們不要忘了加關注ヾ(????)?"
分布式 大數據
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。