spark 解決了 hadoop 的哪些問題(spark VS MR)?

      網(wǎng)友投稿 929 2025-04-01

      Spark 解決了 Hadoop 的哪些問題(Spark VS MR)?


      MR:抽象層次低,需要使用手工代碼來完成程序編寫,使用上難以上手;

      Spark:Spark 采用 RDD 計算模型,簡單容易上手。

      MR:只提供 map 和 reduce 兩個操作,表達能力欠缺;

      Spark:Spark 采用更加豐富的算子模型,包括 map、flatmap、groupbykey、reducebykey 等;

      MR:一個 job 只能包含 map 和 reduce 兩個階段,復雜的任務需要包含很多個 job,這些 job 之間的管理以來需要開發(fā)者自己進行管理;

      Spark:Spark 中一個 job 可以包含多個轉(zhuǎn)換操作,在調(diào)度時可以生成多個 stage,而且如果多個 map 操作的分區(qū)不變,是可以放在同一個 task 里面去執(zhí)行;

      MR:中間結(jié)果存放在 hdfs 中;

      Spark:Spark 的中間結(jié)果一般存在內(nèi)存中,只有當內(nèi)存不夠了,才會存入本地磁盤,而不是 hdfs;

      spark 解決了 hadoop 的哪些問題(spark VS MR)?

      MR:只有等到所有的 map task 執(zhí)行完畢后才能執(zhí)行 reduce task;

      Spark:Spark 中分區(qū)相同的轉(zhuǎn)換構(gòu)成流水線在一個 task 中執(zhí)行,分區(qū)不同的需要進行 shuffle 操作,被劃分成不同的 stage 需要等待前面的 stage 執(zhí)行完才能執(zhí)行。

      MR:只適合 batch 批處理,時延高,對于交互式處理和實時處理支持不夠;

      Spark:Spark streaming 可以將流拆成時間間隔的 batch 進行處理,實時計算。

      spark

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:Excel技巧,全給我“拖”出來!
      下一篇:阿里云張建鋒:數(shù)字技術要服務好實體經(jīng)濟,低代碼是重要趨勢
      相關文章
      亚洲精品V欧洲精品V日韩精品| 亚洲精品国产自在久久| ZZIJZZIJ亚洲日本少妇JIZJIZ| 亚洲AV性色在线观看| 亚洲小说图区综合在线| 亚洲不卡1卡2卡三卡2021麻豆| 亚洲免费在线观看视频| 亚洲乱码无限2021芒果| 亚洲人成在线精品| 91亚洲国产成人久久精品| 亚洲理论片在线中文字幕| 亚洲视频一区在线播放| 亚洲精品自在线拍| 亚洲精品在线免费观看视频| 亚洲福利视频网站| 亚洲一卡二卡三卡四卡无卡麻豆| 久久精品国产99国产精品亚洲| 涩涩色中文综合亚洲| 亚洲区日韩精品中文字幕| 亚洲国产精品成人AV在线| 色天使亚洲综合一区二区| 国产精品亚洲精品日韩电影| 国产精品亚洲综合天堂夜夜| 亚洲性久久久影院| 在线A亚洲老鸭窝天堂| 亚洲成色在线综合网站| 亚洲福利在线观看| 亚洲香蕉免费有线视频| 亚洲av无码片区一区二区三区| 亚洲高清一区二区三区| 亚洲1区2区3区精华液| 亚洲成a人无码av波多野按摩| 亚洲熟伦熟女新五十路熟妇| 亚洲日韩精品无码一区二区三区| 亚洲AV成人一区二区三区AV| 亚洲男人电影天堂| 亚洲一本到无码av中文字幕| 国产精品成人亚洲| 亚洲精品国产精品乱码视色| 亚洲午夜视频在线观看| 亚洲AV无码一区二区三区人|