<ul id="8u002"></ul>

大數據——Hadoop 2.x 生態系統及技術架構圖

網友投稿 818 2025-04-04

一、負責收集數據的工具：

Sqoop（關系型數據導入Hadoop）

Flume（日志數據導入Hadoop，支持數據源廣泛）

Kafka（支持數據源有限，但吞吐大）

二、負責存儲數據的工具：

HBase

MongoDB

Cassandra

Accumulo

MySql

Oracle

DB2

HDFS（Hadoop Distribut File System）2.0

三、底層組件

Apache Common（通用模塊）、

Avro（序列化成二進制）、

OS（Linux、windows。。。）

四、通用工具

Zookeeper分布式協作服務

Oozie工作流流調度系統

Ambari圖形化部署、非xml，跟蹤集群狀態

五、分布式計算框架

MapReduce（通過磁盤離線計算）

Spark（通過內存實時計算）

Storm（實現流式數據計算）

Tez（GAG計算，對MR拆分）

Impala（實現實時交互式計算）

Flink、Slider、Open MPI

HCatalog

YARN（跨集群資源調度管理）以上各種計算框架架構在YAEN上，H2.0引入

六、數據分析處理

Hive數據倉庫

sql語句生成MR作業

Pig工作流引擎

類似sql比MR語法簡單

Mahout數據挖掘庫

提供了諸多機器學習算法

Java、.net

R、Scala、Solr

大數據——Hadoop 2.x 生態系統及技術架構圖

Impapla、Ohter ISV

七、結果輸出

經過數據分析處理，輸出到BI工具、展示系統

ETL Tools

BI Reporting

RDBMS

OLAP

Hadoop 大數據

標簽：數據倉庫

大數據“復活”記

818 2025-04-04

【云小課】EI第29課大數據時代的隱私利器-GaussDB(DWS)數據脫敏

818 2025-04-04

Hive概述

818 2025-04-04

大數據——Hadoop 2.x 生態系統及技術架構圖

大數據“復活”記

【云小課】EI第29課大數據時代的隱私利器-GaussDB(DWS)數據脫敏

Hive概述

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統：重新定義家庭生活方式

友情鏈接