學(xué)習(xí)筆記 華為云云原生王者之路集訓(xùn)營(yíng)-黃金階段(中)
988
2025-03-31
對(duì)象存儲(chǔ)的發(fā)展歷程
對(duì)象存儲(chǔ)并不是最近幾年才產(chǎn)生的,它的歷史可以追溯到1998年出現(xiàn)的CAS(Content Addressable Storage),作為多家技術(shù)公司顧問的Philippe Nicolas貼出的一張圖片,比較直觀詳細(xì)的介紹了對(duì)象存儲(chǔ)的發(fā)展史,當(dāng)然他的圖里列的公司和產(chǎn)品也并不全,國(guó)內(nèi)除了華為的UDS之外,其他的一些公司的產(chǎn)品并未列在這里。
存儲(chǔ)在線的一篇文章比較詳細(xì)的對(duì)該圖進(jìn)行了解析,感興趣的可以點(diǎn)擊閱讀。
這里提煉主要的內(nèi)容:
和很多創(chuàng)新一樣,幾乎所有的系統(tǒng)最初都來自小型廠商,之后經(jīng)過大型企業(yè)升級(jí)改造逐漸擴(kuò)大影響力形成標(biāo)準(zhǔn)并創(chuàng)造更大的商業(yè)價(jià)值。
一部分公司通過借鑒大公司披露出來的技術(shù)(通過發(fā)表論文或技術(shù)文檔等形式展示出的google的三駕馬車及Cloud ? ? ?Storage、亞馬遜的Dynamo、微軟的WAS、雅虎的MObStor和之后的COS、Facebook的HayStack和Cassandra、LinkedIn的Ambry等)實(shí)現(xiàn)自研的產(chǎn)品。
開源項(xiàng)目(比如Ceph、Swift等)的飛速發(fā)展,使得一些公司得以快速的形成自己產(chǎn)品和方案。
從這張圖上可以看到,對(duì)象存儲(chǔ)將近50多家公司在搞,而且計(jì)算機(jī)領(lǐng)域知名的公司都在這個(gè)名單里。其中一些公司的對(duì)象存儲(chǔ)起源于自身業(yè)務(wù)的需求,產(chǎn)品不斷打磨,之后因?yàn)橥獠啃枨髮⒆约旱漠a(chǎn)品提煉成服務(wù)對(duì)外發(fā)布,另一些公司,則完全是為了滿足外部需求。那究竟為什么市場(chǎng)對(duì)對(duì)象存儲(chǔ)有這么大的需求呢?
2.?存儲(chǔ)的發(fā)展源于業(yè)務(wù)需求的變化
商業(yè)公司發(fā)力在做產(chǎn)品,主要原因還是因?yàn)檫@塊有利可圖,甚至有大利可圖。那究竟有多大呢?有IDC公司之前做過一項(xiàng)調(diào)查,預(yù)測(cè)到2020年,全球每年創(chuàng)建和復(fù)制的非結(jié)構(gòu)化數(shù)據(jù)將達(dá)到44澤字節(jié),也就是44萬(wàn)億吉字節(jié)。這比2013年預(yù)測(cè)的4.4澤字節(jié)提高了10倍。如果你覺得這有點(diǎn)夸大,不妨考慮這個(gè):在2015年,非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)占所有數(shù)字?jǐn)?shù)據(jù)的90%!
這么龐大的非結(jié)構(gòu)化數(shù)據(jù),其對(duì)存儲(chǔ)提出了更多的要求:要易于訪問、PB級(jí)的存儲(chǔ)容量、可動(dòng)態(tài)線性擴(kuò)展、要具備更高可靠性和可用性,另外就是要成本夠低。在這些需求下,傳統(tǒng)的NAS/SAN等存儲(chǔ)已經(jīng)不能滿足,所以才逐漸將對(duì)象存儲(chǔ)推上熱潮。
這里提到了非結(jié)構(gòu)化的數(shù)據(jù),那必然還有結(jié)構(gòu)化的數(shù)據(jù),他們的區(qū)別是什么呢?
·???只要是能存在SQL數(shù)據(jù)庫(kù)中的數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù),比如編程常用的XML文本就是結(jié)構(gòu)化的數(shù)據(jù),比如注冊(cè)賬號(hào)時(shí)候填寫的表格就是典型的架構(gòu)化數(shù)據(jù),年齡,性別,姓名,出生年月等一個(gè)個(gè)字段可以用模板套格式化結(jié)構(gòu)化的數(shù)據(jù)。
·? ?相對(duì)應(yīng)的非結(jié)構(gòu)化數(shù)據(jù)就是沒什么固定格式,大小不一的數(shù)據(jù),比如一段在線聊天記錄,比如一張圖片,比如一個(gè)文檔、一個(gè)音頻等。
結(jié)構(gòu)化數(shù)據(jù)進(jìn)行增加、刪除、修改、查詢都很方便。而非結(jié)構(gòu)化的數(shù)據(jù)在想找特定的內(nèi)容時(shí)速度會(huì)很慢,進(jìn)行格式轉(zhuǎn)化就很麻煩,而且量非常大,需要在大的空間內(nèi)存放這些數(shù)據(jù)。
非結(jié)構(gòu)化數(shù)據(jù)爆炸性的增長(zhǎng)主要源自于互聯(lián)網(wǎng)的發(fā)展帶動(dòng)了相關(guān)行業(yè)的業(yè)務(wù)發(fā)展,大概概括起來,這些業(yè)務(wù)可能包括以下:
·???電商、互聯(lián)網(wǎng)金融、在線教育等行業(yè)的Web和移動(dòng)應(yīng)用,商品圖片,互聯(lián)網(wǎng)金融行業(yè)的用戶證件照,在線交易視頻等文件等,需要存儲(chǔ),此前的做法是搭建文件服務(wù)器,文件服務(wù)器的擴(kuò)展性、并發(fā)性都有問題。
·???企業(yè)網(wǎng)盤,傳統(tǒng)企業(yè)文檔管理面臨多終端訪問、數(shù)據(jù)分散、數(shù)據(jù)量大、管理使用難、安全風(fēng)險(xiǎn)高等諸多挑戰(zhàn),需要提供統(tǒng)一的文檔存儲(chǔ)和一站式數(shù)據(jù)保險(xiǎn)箱服務(wù),支持PC/移動(dòng)多終端、海量和5TB超大文件上傳、秒傳、端到端數(shù)據(jù)安全。
·? ?靜態(tài)網(wǎng)站托管,比如企業(yè)網(wǎng)站。靜態(tài)網(wǎng)站可以直接托管在對(duì)象存儲(chǔ)里,對(duì)接CDN加速異地訪問體驗(yàn)。小規(guī)模的網(wǎng)站需要更新時(shí),把文件更新到對(duì)象存儲(chǔ)相應(yīng)的目錄里就可以了,筆者所在的存儲(chǔ)在線網(wǎng)站上存儲(chǔ)圖片技術(shù)就是對(duì)象存儲(chǔ)技術(shù)。
·???大數(shù)據(jù)分析,大數(shù)據(jù)分析首先要解決數(shù)據(jù)存儲(chǔ)的問題,許多企業(yè)尤其是傳統(tǒng)行業(yè),都只是把數(shù)據(jù)存起來但不知道怎么用。此前的存儲(chǔ)架構(gòu)對(duì)外部訪問不友好,做大數(shù)據(jù)分析還要解決數(shù)據(jù)訪問的問題,而對(duì)象存儲(chǔ)能很好地支持大數(shù)據(jù)系統(tǒng),在做比如輿情分析、互聯(lián)網(wǎng)金融風(fēng)控、BI報(bào)表、3D建模,都能提供幫助,幫助用戶做數(shù)據(jù)分析。
·???圖片處理。進(jìn)行簡(jiǎn)單的翻轉(zhuǎn)、剪裁等操作,高級(jí)點(diǎn)的還有圖片鑒黃功能,其中,鑒黃功能就是一種第三方服務(wù),這顯示出對(duì)象存儲(chǔ)還能方便地接入第三方的處理能力,支持這中能力的是事件驅(qū)動(dòng)框架。從根本的技術(shù)上來講,我們也可以將這種方式視作對(duì)象存儲(chǔ)的一種靈活性,靈活的訪問到存儲(chǔ)的數(shù)據(jù)然后做加工處理。
·???視頻云。許多行業(yè)客戶包括電力行業(yè)、交通行業(yè)、建筑行業(yè),都有大量的視頻,存儲(chǔ)需求很大,傳統(tǒng)存儲(chǔ)成本造價(jià)太高,存儲(chǔ)后的檢索、點(diǎn)播能力較差,對(duì)象存儲(chǔ)在這一領(lǐng)域也有很大應(yīng)用空間。
·???備份歸檔。傳統(tǒng)的存儲(chǔ)也會(huì)做備份歸檔,把企業(yè)的郵件、日志通過備份工具備份出來,對(duì)象存儲(chǔ)在這一部分與歸檔存儲(chǔ)工具有部分重合,不過,對(duì)象存儲(chǔ)的訪問能力要比傳統(tǒng)的備份系統(tǒng)要好的多。
·???異地災(zāi)備。用戶可以從一個(gè)對(duì)象存儲(chǔ)遷移到另外一個(gè)對(duì)象存儲(chǔ)節(jié)點(diǎn)區(qū)域,作為遠(yuǎn)程備份滿足企業(yè)同城或者異地災(zāi)備的需求。
以上這些業(yè)務(wù)場(chǎng)景也是對(duì)象存儲(chǔ)服務(wù)廠商需要優(yōu)先關(guān)注解決的。
3.?華為的對(duì)象存儲(chǔ)服務(wù)
華為在傳統(tǒng)存儲(chǔ)服務(wù)方面的積累深厚,其中陣列存儲(chǔ)已經(jīng)躋身Gartner通用存儲(chǔ)陣列魔力四象限報(bào)告的領(lǐng)導(dǎo)者象限,其分布式NAS OceanStor9000在國(guó)內(nèi)的市場(chǎng)份額牢牢占據(jù)第一的位置,全閃存Dorado也取得了不俗的成績(jī)。當(dāng)然華為也是緊跟市場(chǎng)需求,早就開始布局云計(jì)算方面的業(yè)務(wù),其中對(duì)象存儲(chǔ)服務(wù)也在較早階段投入,并最終在華為云上發(fā)布了對(duì)象存儲(chǔ)服務(wù)(ObjectStorage Service,簡(jiǎn)稱OBS)。
華為的對(duì)象存儲(chǔ)服務(wù)是面向?qū)ο?文件的、海量的互聯(lián)網(wǎng)存儲(chǔ)服務(wù)。OBS能讓用戶不用關(guān)心底層的存儲(chǔ)技術(shù),也不用關(guān)心存儲(chǔ)容量規(guī)劃和擴(kuò)容減容問題,直接通過RESTful API調(diào)用海量的存儲(chǔ)資源,或者通過華為云服務(wù)網(wǎng)站的管理控制臺(tái)、第三方云存儲(chǔ)客戶端,為應(yīng)用存取數(shù)據(jù)。更多信息請(qǐng)參考:http://www.huaweicloud.com/product/obs.html
當(dāng)然華為在云服務(wù)特別是對(duì)象存儲(chǔ)這塊的投入、創(chuàng)新和優(yōu)化并未停止,目標(biāo)也十分明確,從性能、可靠性乃至最終全方位的超越現(xiàn)在的霸主AWS的S3服務(wù)。這樣的努力已經(jīng)開始,并且即將有一些階段性的成果面世,接下來文章中我會(huì)對(duì)其中的一些改進(jìn)進(jìn)行介紹。
OBS 對(duì)象存儲(chǔ)服務(wù) 對(duì)象存儲(chǔ)服務(wù) OBS 華為云
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。