<fieldset id="iqwge"></fieldset>

<del id="iqwge"><tfoot id="iqwge"></tfoot></del><center id="iqwge"></center>

<fieldset id="iqwge"><input id="iqwge"></input></fieldset>

首頁技術(shù)文章正文

Spark是怎么做內(nèi)存計算的？Spark為什么比MapReduce 快？

更新時間:2023-06-23 來源:黑馬程序員瀏覽量:

IT培訓(xùn)班

Spark會產(chǎn)生DAG圖，DAG圖會基于分區(qū)和寬窄依賴關(guān)系劃分階段。一個階段的內(nèi)部都是窄依賴，窄依賴內(nèi)，如果形成前后1：1的分區(qū)對應(yīng)關(guān)系，就可以產(chǎn)生許多內(nèi)存迭代計算的管道。

這些內(nèi)存迭代計算的管道，就是一個個具體的執(zhí)行Task，一個Task是一個具體的線程，任務(wù)跑在一個線程內(nèi)，就是走內(nèi)存計算了。

Spark的算子豐富，MapReduce算子圓乏(Map和Reduce)，MapReduce這個編程模型，很難在一套MR中處理復(fù)雜的任務(wù)。很多的復(fù)雜任務(wù)，是需要寫多個MapReduce進行串聯(lián).多個MR串聯(lián)通過磁盤交互數(shù)據(jù)。

Spark可以執(zhí)行內(nèi)存迭代，算子之間形成DAG基于依賴劃分階段后，在階段內(nèi)形成內(nèi)存迭代管道.但是MapReduce的Map和Reduce之間的交互依舊是通過硬盤來交互的.

上一篇：參數(shù)如何通過值或引用傳遞? 下一篇：SortShuffleManager的bypass機制觸發(fā)條件是什么？

最新資訊

有哪些頁面置換算法?
2024-05-22
如何解決Redis的并發(fā)競爭Key問題?
2024-05-22
varchar和char的使用場景?
2024-05-22
協(xié)程為何比線程還快?
2024-05-17
TIME_WAIT過多是因為什么?
2024-05-17
range和xrange的區(qū)別是什么?
2024-05-17

相關(guān)閱讀

分享到：

javaee

python大數(shù)據(jù)

web

ui

cloud

test

c

netmarket

pm

Linux

movies

robot

uids

AI

jdbc

選擇校區(qū)

北京校區(qū)

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

熱門課程推薦

更多>>

首頁|校區(qū)分布|師資力量|關(guān)于我們|報名流程

常見問題|技術(shù)資訊

江蘇傳智播客教育科技股份有限公司版權(quán)所有
Copyright 2006-2023, All Rights Reserved

在線咨詢我要報名

和我們在線交談！

<dfn id="6gwyc"></dfn>

<button id="6gwyc"><noscript id="6gwyc"></noscript></button>

<strike id="6gwyc"></strike>

<fieldset id="6gwyc"></fieldset>

<tfoot id="6gwyc"></tfoot>