數據平臺、大數據平臺、數據中臺……還分的清不?

      網友投稿 714 2025-03-31

      造概念,在IT行業可不是一件陌生的事兒,中文博大精深,新名詞、新概念往往簡單準確,既可以被大眾接受,又可以被專家把玩,真正做到雅俗共賞、各有趣味。近年來,數據中臺之火爆,什么數據平臺、數據中臺、數據湖、數據集市等等,不同的叫法把大家繞的云里霧里,概念混淆不清,著實讓人摸不著頭腦……


      正如我們清楚的知道企業要進行數字化驅動架構之前,必須要建立統一的數據標準和規范,用統一的、大家都了解的語言描述一件事情是多么重要。同樣的道理,在理解“大數據”“數據中臺”相關知識之前,我們有必要先將常遇到的包括數據倉庫、數據集市、數倉湖、大數據平臺、數據中臺等概念一次性說清,以便在今后的學習與建設中能夠清楚的區別開來。

      在回答上述問題之前,我們先來看看數據中臺應該怎么理解?阿里認為數據中臺其三項核心能力分別為:OneModel負責統一數據構建及管理,OneID負責將核心商業要素資產化,OneService負責向上提供統一的數據服務。

      小編認為,數據中臺的核心能力是數據能力的抽象、共享與復用,兩者對數據中臺的定義看似差異巨大,但仔細分析,相差無幾。換言之,“抽象”是為了達成“OneModel”、“共享”則是為了“OneID”、“復用”才能讓“OneService”更有意義。

      數字化運營不同階段,運營手段各盡所能

      隨著大數據技術的不斷更新與迭代,數據管理工具得到了飛速的發展,從數據庫、數據倉庫、數據集市與數據湖,再到大數據平臺與如今的數據中臺,其實將它們比喻成一場“數據的旅程”就不難理解在數字化運營的不同階段,各運營手段并不一定是誰替代了誰,準確的講,它們都有自己的功能、特點所在,技術之間的互補,每個手段都各盡所能的為自己的用例服務。下面我們就來簡明扼要的歸納一下數字化運營不同階段中各運營手段的功能與亮點。

      1、數據庫:傳統的關系型數據庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。

      2、數據倉庫:數據倉庫系統的主要應用是OLAP,支持復雜的數據分析,側重決策支持,并且提供直觀易懂的查詢結果,可做到業務的歷史快照,總結性數據以及高緯度分析。

      3、數據集市:可以理解為是一種"小型數據倉庫",只包含單個主題,且關注范圍也非全局,數據從企業范圍的數據庫、數據倉庫中抽取出來,迎合專業用戶群體的特殊需求,其面向部門級業務或某一個特定的主題,良好地解決了靈活性和性能之間的矛盾。

      4、數據湖:存儲企業各種各樣原始數據的大型倉庫,其中的數據可供存取、處理、分析及傳輸,主要解決的是“看見數據”的問題,作為全局數據匯總及處理的一個核心功能,數據湖在數據中臺建設中必不可少,除了為數據倉庫提供原始數據之外,數據湖也可以直接為上層的數據應用提供服務。

      5、大數據平臺:個性化、多樣化數據,以處理海量數據存儲、計算及流數據實時計算等場景為主的一套基礎設施,使用大數據平臺,企業可以比競爭對手更快地作出數據驅動的決策,更快地推出適應客戶需求的產品。

      6、數據中臺:我們知道所有關于數據工具的建設,其目的都是為了從數據中提取價值來支持更有效的數據運營,那么不能指導實際行動,創造實際價值的數據以及從數據中產生的知識是無用的,那花大價錢來做這個系統也沒有必要。

      說到底,數據工具的建設還是要以 ROI(Return On Investment)來支持,數據中臺概念的出現,很大程度上是原來的大數據系統建設的ROI 不如人意,企業投入了大量的物力、財力和人力建設了大數據平臺,卻發現并沒有給企業帶來應用的價值,大數據平臺更多的淪為“形象工程“,甚至產生了新的數據孤島,更不用說實現數據能力的全局抽象、復用和共享了,而數據中臺可以說是為此類大數據平臺了個“補丁”,其全局的數據倉庫、大數據協調共享等能力,真正解決了重復開發、數據標準不統一、數據孤島等問題,從而提高了數據價值實現效率和ROI。

      常見混淆概念梳理:傳統大數據平臺、硅谷大數據平臺、數據中臺

      其實,數字化運營不同階段的運營手段相對來說是比較好理解的,但是我們常常能聽到一些字面意思相近的概念,尤其是當我們了解到原來在美國硅谷“中臺”其實早已有之,只不過這種方法論在被引入到國內之后,被冠以“中臺”之名時混淆的概念常常讓我們不知所措。

      那么,在硅谷所謂的“中臺”叫什么?國外的大數據平臺與國內的大數據平臺又有什么區別?接下來就讓我們統一相關概念并梳理其關系,一次性說清讓大家一目了然。

      1、大數據平臺1.0

      大數據平臺1.0=傳統大數據平臺

      大數據平臺1.0時期,其實就是我們通常所看到的國內“傳統大數據平臺”的概念,此時的大數據平臺是以處理海量數據存儲、計算及流數據實時計算等場景為主的一套基礎設施,以Hadoop、Spark、Hive等作為大數據基礎能力層,在大數據組件上搭建包括數據分析,機器學習程序等ETL流水線,以及包括數據治理系統、數據倉庫系統、數據可視化系統等核心功能。

      但是在大數據平臺1.0時期,硬件投資與軟件開發投入量巨大,極大增加了研發的難度、調試部署的周期、運維的復雜度,且經常由于架構的缺陷,數據應用開發運維的困難,多租戶資源隔離的復雜度等原因造成數據孤島、應用孤島的問題。

      傳統大數據平臺

      2、大數據平臺2.0

      大數據平臺2.0=新一代大數據平臺=大數據平臺1.0+數據中臺的功能+數據運營的功能

      大數據平臺2.0時期充分詮釋了硅谷“中臺”早已有之的說法,但為什么硅谷沒有“數據中臺”概念?原因是硅谷公司從起步開始,管理層就將打造數據驅動需要的基礎架構作為必須的功課之一,公司內部都有一個 Data Platform(數據平臺)部門負責建設公司的數據平臺,其大數據平臺建設絕大多數是需求驅動,且后續發展都是由這個大數據平臺能產生多少價值來決定的。

      也就是說,在硅谷大家其實也并沒有刻意的去打造什么中臺,但是“避免重復造輪子”“快速迭代”“數據驅動”“業務驅動”是硅谷工程師文化的一些核心概念,也是硅谷高效創新的一個核心,大部分公司在起始架構設計時,就將“數據中臺”所包括的數據抽象、復用與共享的能力,以及一些數據運營的功能設計在內了,其建設目的是一樣的,所以沒有必要在概念上過度糾結。

      3、數據中臺

      數據中臺建設的目標可簡單歸納為通過提供工具、流程和方法論,實現數據能力的抽象、復用和共享,賦能業務部門,提高實現數據價值的效率。阿里提出數據中臺的概念,只是為了強調和國內現有的大數據平臺加以區別,強調解決數據孤島、重復開發的問題,突出數據共享和復用的概念。

      深入探究:數據中臺與Ta的關系

      想必現在你已經從傻傻分不清的狀態中走出來,接下來,我們再深入具體地了解下數據中臺與之相對應的關系,看看你是不是已經游刃有余的掌握了相關概念呢?

      數據中臺與傳統數據倉庫、數據集市、數據湖的關系

      數據倉庫與數據集市的出現,就是為了解決信息化階段OLTP(聯機事務處理過程)在分析場景下的局限性,它們將OLTP中的數據采集過來,做成面向歷史、主題、分析的一些數據集,從而可以輕松地做出OLTP難以做出的分析。

      但是,隨著互聯網時代的到來,數據倉庫的數據來源只在業務系統功能中,提供一些匯聚的業務信息,無法提供個性化的信息以及一些非傳統業務數據源的信息。另外,一些非傳統業務數據源的信息一般存儲在服務器日志中,那么大量且無效的數據如果都存儲到數據倉庫中,其效率之低和限制是無法想象的。

      此時,數據湖和大數據平臺的出現改變了上述局面,在這個階段的數據倉庫和數據集市,則基于大數據技術取得了進化,也就是說數據倉庫不能解決的問題,我們用大數據數倉(基于大數據技術實現的數據倉庫)來解決,大數據數倉解決不了的,我們用大數據平臺來解決,大數據平臺解決不了的問題,就需要數據中臺來解決。

      應該說數據中臺是建立在數據倉庫和數據平臺之上的,讓業務部門可以更好,更有效率的使用數據的運營管理層,并強調從工具和機制上支持對數據能力的抽象、共享和復用。

      數據中臺與大數據平臺1.0、2.0的關系

      很多人會疑惑大數據平臺1.0與數據中臺的差別在哪里呢?其實,兩者的建設目的都是發掘數據價值,高效實現數字化運營,區別則在于數據中臺是具備業務屬性的,輸入的是原始數據,輸出的是業務部門可以直接使用的數據能力。如果必須要將數據中臺和大數據平臺1.0區分開來,可以說數據中臺是建立在大數據平臺1.0的基礎層之上,強調提供相應的工具和機制來實現數據能力的全局抽象、共享和復用。

      在國內,為什么很多企業面臨著數據孤島與應用孤島的困局?而在硅谷,大多數企業并沒有數據孤島、應用孤島的煩惱?因為硅谷每個公司在建設大數據平臺的時候,大數據平臺的運營效率和使用效率,都是必須要考慮的關鍵問題。在起始架構設計與后續迭代的時候,如何最大化投入產出比,并讓業務部門真正發揮數據的作用都是關鍵所在。在這個過程中,也有很多的嘗試和迭代,但是最終的結果是,絕大部分的大數據平臺自然的就會提供所謂的“數據中臺”的功能,成為公司內部的一個核心價值驅動引擎。

      大數據平臺1.0與2.0關系圖

      數據平臺、大數據平臺、數據中臺……還分的清不?

      而大數據平臺2.0作為新一代大數據平臺,則是在大數據平臺1.0基礎上,增加了數據中臺的功能,以及數據運營的功能。對于“各個部門數據重復開發,浪費存儲與計算資源”、“數據標準不統一,數據使用成本高”、“業務數據孤島問題嚴重,數據利用效率低”,這些需要在大數據平臺1.0階段解決的問題,并沒有在國內企業的大數據平臺階段得到考慮和解決。因此,需要一個新的平臺來為這個大數據平臺“打補丁”,而這個新平臺,就是所謂的“數據中臺”。

      總結:本文從數字化運營不同階段對數據倉庫、數據湖、大數據平臺、數據中臺等內涵作了詳細說明,便于讀者更好的理解和掌握數據領域相關概念,并幫助大家更好地了解大數據帶給我們的能力與作用。需要強調的是,除了了解數據中臺的概念外,其方法論更為重要,數據中臺建設為我們企業數據服務和共享奠定了重要的基礎,是企業從“數據”邁向“價值”的強大助推器。

      來源:智領云科技

      智能數據 大數據

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:零代碼應用,讓技術門檻消失的創新工具
      下一篇:大數據場景下Volcano高效調度能力實踐
      相關文章
      亚洲伊人色一综合网| 亚洲成AV人片在线播放无码| 亚洲日本va午夜中文字幕久久| 亚洲日本人成中文字幕| 911精品国产亚洲日本美国韩国| 亚洲国产成人VA在线观看| 亚洲精品天堂在线观看| 亚洲av乱码一区二区三区香蕉| 4444亚洲国产成人精品| 亚洲成年人电影在线观看| 亚洲精品偷拍无码不卡av| 666精品国产精品亚洲| 亚洲精彩视频在线观看| 亚洲沟沟美女亚洲沟沟| 亚洲无限乱码一二三四区| 亚洲精品中文字幕无码AV| 内射干少妇亚洲69XXX| 亚洲最新视频在线观看| 亚洲精品美女视频| 亚洲成a人片在线观看中文app| 亚洲人妖女同在线播放| 国产成人精品日本亚洲11| 亚洲综合国产成人丁香五月激情| 色老板亚洲视频免在线观| 中文字幕亚洲综合小综合在线| 国产91在线|亚洲| 亚洲精品精华液一区二区 | 亚洲一区二区三区国产精华液| 亚洲 日韩经典 中文字幕| 亚洲欧美日韩综合俺去了| 日韩欧美亚洲中文乱码| 亚洲精品成人区在线观看| 国产成人综合亚洲AV第一页| 亚洲成AV人在线播放无码| 亚洲国产综合专区电影在线| 亚洲激情校园春色| 亚洲日韩AV无码一区二区三区人| 国产精品亚洲一区二区在线观看| 亚洲高清成人一区二区三区| 亚洲无码在线播放| 精品日韩亚洲AV无码 |