大數據“復活”記
1139
2025-03-31
上一期我們聊了數據庫和數據庫管理系統。
這一期我們再來扒一扒數據庫的發展歷史。
受硬件和軟件發展水平的影響,數據庫發展階段大致劃分為如下幾個階段:人工管理階段、文件系統階段、數據庫系統階段、高級數據庫階段。
人工管理階段
年代 上世紀50年代中期以前 。
背景 ? ? ?計算機主要用于科學計算 。
硬件上,外存只有磁帶、卡片、紙帶,沒有磁盤等直接存取的存儲設備 。
軟件上,沒有操作系統、沒有管理數據的軟件。
數據處理方式是批處理。
因為無系統管理軟件,數據與程序不具有獨立性 。數據的組織方式由程序員自行設計。
應用程序與數據的關系:一 一對應,數據面向應用程序。
文件系統階段
年代 ? 從上世紀50年代后期到60年代中期
背景 ? ?計算機不僅用于科學計算,還大量用于管理。
硬件上,外存儲器有了磁盤、磁鼓等直接存取的存儲設備;
軟件上,操作系統中已經有了專門的管理數據軟件(文件系統)。
數據處理方式有文件批處理和聯機實時處理。
因此這階段依然存在數據和程序缺乏獨立性 、增刪數據困難的缺點。
文件系統的三個缺陷:數據冗余性、 數據不一致性、數據聯系弱。
數據庫系統階段
年代 上世紀60年代后期開始。
背景 ? ?計算機更大規模的用于管理,數據量急劇增長,數據的共享要求越來越強;
硬件上,外存儲器有了大容量的磁盤;
軟件價格上升,硬件價格下降;
數據處理方式上,聯機實時處理要求更多了,并開始提出和考慮分布處理。
特點 ? ?面向全組織的復雜的數據結構(結構化、集成化);
數據冗余度小,易擴充;
引進DBMS,實現了數據的:獨立性、安全性、完整性、并發控制
數據的最小存取單位是數據項;實現數據共享的最小單位是數據項。
總結:
一、人工管理階段:特點
數據的管理者:人
數據面向的對象:某一應用程序
數據的共享程度:無共享,冗余度極大
數據的獨立性:不獨立,完全依賴于程序
數據的結構化:無結構
數據控制能力:應用程序自己控制
二、文件系統階段:特點
數據的管理者:文件系統
數據面向的對象:某一應用程序
數據的共享程度:共享性差,冗余度大
數據的獨立性:獨立性差
數據的結構化:記錄內有結構,整體無結構
數據控制能力:應用程序自己控制
三、數據庫系統階段:特點
數據的管理者:數據庫管理系統
數據面向的對象:整個應用系統
數據的共享程度:共享性高,冗余度小
數據的獨立性:具有高度的物理獨立性和邏輯獨立性
數據的結構化:整體結構化,用數據模型描述
數據控制能力:由數據庫管理系統提供數據安全性、完整性、并發控制和恢復能力
(編者注:通過理解上一期所說的數據庫和數據庫管理系統的概念,我們不難總結出:人工管理階段和文件系統階段的數據庫只是存放數據的庫,而數據庫系統階段和高級數據庫階段,則不僅有庫,而且已經是DBMS了)
--------------------------------------------我是華麗麗的分割線-----------------------------------------------------------------------------
進入數據庫系統階段后,DBMS的發展先后發展出了網狀型數據庫、層次型數據庫和關系數據庫。
網狀型數據庫
最早出現的網狀型DBMS數據庫,是美國通用電氣公司Bachman等人在1961年開發成功的IDS(Integrated DataStore)。
1961年通用電氣公司(General ElectricCo.)的Charles Bachman ;成功地開發出世界上第一個網狀DBMS也是第一個數據庫管理系統——集成數據存儲(Integrated DataStore IDS),奠定了網狀數據庫的基礎,并在當時得到了廣泛的發行和應用。
IDS?,具有數據模式和日志的特征。但它只能在GE主機上運行,并且數據庫只有一個文件,數據庫所有的表必須通過手工編碼來生成。之后,通用電氣公司一個客戶——BF Goodrich Chemical 公司最終不得不重寫了整個系統。并將重寫后的系統命名為集成數據管理系統(IDMS)。
1973年Cullinane公司(也就是后來的Cullinet軟件公司),開始出售Goodrich公司的IDMS改進版本,并且逐漸成為當時世界上最大的軟件公司。
網狀數據庫模型對于層次和非層次結構的事物都能比較自然的摸擬,在關系數據庫出現之前網狀DBMS要比層次DBMS用得普遍。在數據庫發展史上,網狀數據庫占有重要地位。
特點:它反映著現實世界中實體間更為復雜的聯系,其基本特征是,結點數據間沒有明確的從屬關系,一個結點可與其它多個結點建立聯系。
如圖所示的四個城市的交通聯系,不僅是雙向的而且是多對多的。
層次型數據庫
層次型DBMS是緊隨網絡型數據庫而出現的,最著名最典型的層次數據庫系統是IBM 公司在1968 年開發的IMS(Information Management System)。IMS,一種適合其主機的層次數據庫。這是IBM公司研制的最早的大型數據庫系統程序產品。從60年代末產生起,如今已經發展到IMS15,提供群集、N路數據共享、消息隊列共享等先進特性的支持。這個具有50年歷史的數據庫產品在如今的WWW應用連接、商務智能應用中扮演著新的角色。
(編者注:特意查到的IMS官網奉上。https://www.ibm.com/it-infrastructure/z/ims)
層次型數據庫圖示如下:
關系數據庫
網狀數據庫和層次數據庫已經很好地解決了數據的集中和共享問題,但是在數據獨立性和抽象級別上仍有很大欠缺。用戶在對這兩種數據庫進行存取時,仍然需要明確數據的存儲結構,指出存取路徑。而后來出現的關系數據庫較好地解決了這些問題。
主流的關系數據庫有:Oracle(中文名叫甲骨文)公司的Oracle數據庫;IBM(中文名稱是國際商務機器公司)的DB2,Informix;微軟的SQL Server,Access;Sybase公司的Sybase;以及開源數據庫MySQL、Postgres等。
發展趨勢:
隨著信息管理內容的不斷擴展,出現了豐富多樣的數據模型(層次模型,網狀模型,關系模型,面向對象模型,半結構化模型等),新技術也層出不窮(數據流,Web數據管理,數據挖掘等)。每隔幾年,國際上一些資深的數據庫專家就會聚集一堂,探討數據庫研究現狀,存在的問題和未來需要關注的新技術焦點。
各種新型的數據庫技術:演繹數據庫、主動數據庫、基于邏輯的數據庫、時態數據庫、模糊數據庫、并行數據庫、多媒體數據庫、內存數據庫……….
數據庫發展大事記:
1951:Univac系統使用磁帶和穿孔卡片作為數據存儲。
1956:IBM公司在其Model 305 RAMAC中第一次引入了磁盤驅動器
1961:通用電氣(GE)公司的Charles Bachman開發了第一個數據庫管理系統——IDS
1969: E.F. Codd發明了關系數據庫。
1973:由John J.Cullinane領導Cullinane公司開發了 IDMS——一個針對IBM主機的基于網絡模型的數據庫。
1976:Honeywell公司推出了Multics Relational Data Store——第一個商用關系數據庫產品。
1979:Oracle公司引入了第一個商用SQL關系數據庫管理系統。
1983:IBM推出了DB2數據庫產品。
1985:為Procter & Gamble系統設計的第一個商務智能系統產生。
1991:W.H.“Bill” Inmon發表了”構建數據倉庫”。
前期匯總:
【小資說庫】第1期 什么是數據庫
存儲
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。