gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区

站長資訊網
最全最豐富的資訊網站

“玩轉”華為云DLI 揭秘其背后的核心計算引擎

  本文主要給大家介紹隱藏在華為云EI(企業智能)數據湖探索服務(以下簡稱DLI)背后的核心計算引擎——Spark。華為云EI數據湖探索服務團隊在Spark之上做了大量的性能優化與服務化改造,但其本質還是脫離不了Spark的核心概念與思想,本文從以下幾點闡述,讓讀者快速對Spark有一個直觀的認識,玩轉DLI。

   Spark的誕生及優勢

  2009年,Spark誕生于伯克利大學AMPLab,誕生之初是屬于伯克利大學的研究性項目。于2010年開源,2013年成為Apache開源項目,經過幾年的發展逐漸取代了Hadoop,成為了開源社區炙手可熱的大數據處理平臺。

  Spark官方的解釋:“Spark是用于大規模數據處理的統一分析引擎“,把關鍵詞拆開來看,“大規模數據”指的是Spark的使用場景是大數據場景;“統一”主要體現在將大數據的編程模型進行了歸一化,同時滿足多種類型的大數據處理場景(批處理、流處理、機器學習等),降低學習和維護不同大數據引擎的成本;“分析引擎”表明Spark聚焦在計算分析,對標的是Hadoop中的MapReduce,對其模型進行優化與擴展。

  Spark為了解決MapReduce模型的優化和擴展,我們先探討一下MapReduce存在的問題,然后分析Spark在MapReduce之上的改進。

  (1)MapReduce中間結果落盤,計算效率低下

  隨著業務數據不斷增多,業務邏輯不斷多樣化,很多ETL和數據預處理的工作需要多個MapReduce作業才能完成,但是MapReduce作業之間的數據交換需要通過寫入外部存儲才能完成,這樣會導致頻繁地磁盤讀寫,降低作業執行效率。

  Spark設計之初,就想要解決頻繁落盤問題。Spark只在需要交換數據的Shuffle階段(Shuffle中文翻譯為“洗牌”,需要Shuffle的關鍵性原因是某種具有共同特征的數據需要最終匯聚到一個計算節點上進行計算)才會寫磁盤,其它階段,數據都是按流式的方式進行并行處理。

  (2)編程模型單一,場景表達能力有限

  MapReduce模型只有Map和Reduce兩個算子,計算場景的表達能力有限,這會導致用戶在編寫復雜的邏輯(例如join)時,需要自己寫關聯的邏輯,如果邏輯寫得不夠高效,還會影響性能。

  與MapReduce不同,Spark將所有的邏輯業務流程都抽象成是對數據集合的操作,并提供了豐富的操作算子,如:join、sortBy、groupByKey等,用戶只需要像編寫單機程序一樣去編寫分布式程序,而不用關心底層Spark是如何將對數據集合的操作轉換成分布式并行計算任務,極大的簡化了編程模型

   Spark的核心概念

  Spark中最核心的概念是RDD(Resilient Distributed Dataset) – 彈性分布式數據集,顧名思義,它是一個邏輯上統一、物理上分布的數據集合,Spark通過對RDD的一系列轉換操作來表達業務邏輯流程,就像數學中對一個向量的一系列函數轉換。Spark通過RDD的轉換依賴關系生成對任務的調度執行的有向無環圖,并通過任務調度器將任務提交到計算節點上執行,任務的劃分與調度是對業務邏輯透明的,極大的簡化了分布式編程模型,RDD也豐富了分布式并行計算的表達能力。

  RDD上的操作分為Transformation算子和Action算子。Transformation算子用于編寫數據的變換過程,是指邏輯上組成變換過程。Action算子放在程序的最后一步,用于對結果進行操作,例如:將結果匯總到Driver端(collect)、將結果輸出到HDFS(saveAsTextFile)等,這一步會真正地觸發執行。

  常見的Transformation算子包括:map、filter、groupByKey、join等,這里面又可以分為Shuffle算子和非Shuffle算子,Shuffle算子是指處理過程需要對數據進行重新分布的算子,如:groupByKey、join、sortBy等。常見的Action算子如:count、collect、saveAsTextFile等

  如下是使用Spark編程模型編寫經典的WordCount程序:

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  Spark程序中涉及到幾個概念,Application、Job、Stage、Task。每一個用戶寫的程序對應于一個Application,每一個Action生成一個Job(默認包含一個Stage),每一個Shuffle算子生成一個新的Stage,每一個Stage中會有N個Task(N取決于數據量或用戶指定值)。

   Spark的架構設計

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  前面講述了Spark 核心邏輯概念,那么Spark的任務是如何運行在分布式計算環境的呢?接下來我們來看看開源框架Spark的架構設計。

  Spark是典型的主從(Master- Worker)架構,Master 節點上常駐 Master守護進程,負責管理全部的 Worker 節點。Worker 節點上常駐 Worker 守護進程,負責與 Master 節點通信并管理 Executor。

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  Spark程序在客戶端提交時,會在Application的進程中啟動一個Driver??匆幌鹿俜綄river的解釋“The process running the main() function of the application and creating the SparkContext”。

  我們可以把Master和Worker看成是生產部總部老大(負責全局統一調度資源、協調生產任務)和生產部分部部長(負責分配、上報分部的資源,接收總部的命令,協調員工執行任務),把Driver和Executor看成是項目經理(負責分配任務和管理任務進度)和普通員工(負責執行任務、向項目經理匯報任務執行進度)。

  項目經理D to 總部老大M:Hi,老大,我剛接了一個大項目,需要你通知下面的分部部長W安排一些員工組成聯合工作小組。

  總部老大M to 分部部長W:最近項目經理D接了一個大項目,你們幾個部長都安排幾個員工,跟項目經理D一起組成一個聯合工作小組。

  分部部長W to 員工E:今天把大家叫到一起,是有個大項目需要各位配合項目經理D去一起完成,稍后會成立聯合工作小組,任務的分配和進度都直接匯報給項目經理D。

  項目經理D to 員工E:從今天開始,我們會一起在這個聯合工作小組工作一段時間,希望我們好好配合,把項目做好。好,現在開始分配任務…

  員工E to 項目經理D:你分配的xxx任務已完成,請分配其它任務。

  項目所有任務都完成后,項目經理D to 總部老大M:Hi,老大,項目所有的任務都已經完成了,聯合工作小組可以解散了,感謝老大的支持。

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

贊(0)
分享到: 更多 (0)
?
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区
天堂中文视频在线| 在线免费观看视频黄| 国产在线观看欧美| 午夜免费一级片| 中日韩av在线播放| 性欧美1819| 成人性生交免费看| 三上悠亚av一区二区三区| 欧美三级午夜理伦三级| 免费日韩视频在线观看| 日本三级免费观看| 日韩中文字幕免费在线| 日av中文字幕| 欧美第一页浮力影院| 99热这里只有精品在线播放| 九九热精品在线播放| 亚洲美女性囗交| 五月天色婷婷综合| 国产一区二区三区在线免费| 国产在线无码精品| 欧美成人精品免费| 国产亚洲精品网站| 污污网站免费看| 五月天六月丁香| 日韩精品免费一区| 男女激情无遮挡| 99视频在线免费| 在线看免费毛片| 国产成人生活片| 91精品国产91久久久久麻豆 主演| 精品国产一区二区三区无码| 国产h视频在线播放| mm1313亚洲国产精品无码试看| 亚洲综合av在线播放| 久久久久亚洲av无码专区喷水| 久久久99精品视频| 精品99在线视频| 中文字幕资源在线观看| 奇米777四色影视在线看| 青青青青草视频| 高清一区二区视频| 神马午夜伦理影院| 黄色片视频在线免费观看| 亚洲精品午夜在线观看| 国产免费裸体视频| 性生交免费视频| 欧美a级免费视频| 成人黄色一区二区| 青青在线免费视频| 男人女人黄一级| 国产91在线亚洲| 精品久久久久久中文字幕2017| 天天爱天天做天天操| 能在线观看的av| 免费观看中文字幕| 97视频在线免费播放| 天天干天天曰天天操| 自慰无码一区二区三区| 91性高潮久久久久久久| 久久国产亚洲精品无码| 亚洲自拍偷拍一区二区三区| 无码aⅴ精品一区二区三区浪潮| 97人人模人人爽人人澡| 免费高清在线观看免费| 欧美少妇一区二区三区| 91插插插插插插插插| 男女视频网站在线观看| 在线观看日本www| 国产成人无码一二三区视频| 欧美做暖暖视频| 亚洲黄色片免费| 苍井空浴缸大战猛男120分钟| 91网址在线观看精品| mm131亚洲精品| 久久成人免费观看| 一本色道久久88亚洲精品综合| 91激情视频在线| 欧美日韩在线一| 伊人网在线免费| 日本黄色福利视频| 日韩毛片在线免费看| 男女私大尺度视频| 精品国产无码在线| 蜜臀一区二区三区精品免费视频| 2022亚洲天堂| 男人的天堂狠狠干| 男人草女人视频| 少妇熟女一区二区| 中文字幕55页| 91香蕉国产线在线观看| 97人人爽人人| 午夜久久福利视频| 少妇一级淫免费播放| 欧美日韩亚洲自拍| 十八禁视频网站在线观看| 久久久久久久久久久99| 真人抽搐一进一出视频| 成人在线国产视频| 日韩精品在线视频免费观看| www.国产亚洲| 国产欧美精品aaaaaa片| 999一区二区三区| 欧美午夜性视频| 可以在线看的av网站| 玩弄中年熟妇正在播放| 国产a级片网站| 男女视频网站在线观看| 亚洲 高清 成人 动漫| 伊人成色综合网| 久久久999视频| 日本wwww视频| 色七七在线观看| www.cao超碰| 超碰在线资源站| 日本一本草久p| 成人免费看片'免费看| 被灌满精子的波多野结衣| 老太脱裤子让老头玩xxxxx| 国产精品沙发午睡系列| 激情综合网俺也去| 最新中文字幕2018| 亚洲第一精品区| 97超碰国产精品| 亚洲熟妇av一区二区三区| 9l视频白拍9色9l视频| 日本特黄在线观看| 99色这里只有精品| 国产在线青青草| 亚洲一区二区在线视频观看| gogogo高清免费观看在线视频| 特级黄色片视频| 给我免费播放片在线观看| 美女福利视频在线| 天天干天天色天天干| av一区二区三区免费观看| 香港三级韩国三级日本三级| 一区二区三区 欧美| 日本一二三区在线| av日韩一区二区三区| 久久精品网站视频| aaa一级黄色片| 日韩国产小视频| 国产 porn| 永久免费看av| 黄色一级大片在线观看| 26uuu成人| 欧美极品欧美精品欧美图片| 午夜影院免费观看视频| 九九爱精品视频| 看看黄色一级片| www一区二区www免费| 国产毛片久久久久久| 99精品人妻少妇一区二区| 日韩精品视频网址| 日韩av资源在线| 五月天在线免费视频| 日韩在线第三页| 久久亚洲国产成人精品无码区| 丁香婷婷激情网| 日韩欧美精品免费| 在线黄色免费看| 欧美污视频网站| 成人小视频在线观看免费| gogogo高清免费观看在线视频| 九一国产精品视频| www.午夜色| 孩娇小videos精品| 国产精品免费入口| 99re6这里有精品热视频| 国产三级三级看三级| 日本网站免费在线观看| 400部精品国偷自产在线观看| 国产精品拍拍拍| 国产免费黄色av| 青青草综合在线| 日韩视频在线观看视频| 欧美美女一级片| av免费网站观看| 国产女大学生av| 奇米777四色影视在线看| 午夜福利123| 韩国视频一区二区三区| 欧洲av无码放荡人妇网站| 精品少妇人欧美激情在线观看| 国产精品亚洲天堂| 久久久久久久久久久久久久久国产 | 18岁网站在线观看| 国产在线观看欧美| 精品日韩在线播放| 黄色一级片免费的| 久久久精品麻豆| 黄色av免费在线播放| 亚洲午夜无码av毛片久久| 国产玉足脚交久久欧美| 国风产精品一区二区| 熟妇熟女乱妇乱女网站| 婷婷激情5月天| 亚洲视频在线不卡| 午夜啪啪免费视频| 国产奶头好大揉着好爽视频|