簡單的介紹一下大數據中最重要的MapReduce

2021-02-06    分類: 網站建設

簡單的介紹一下大數據中最重要的MapReduce
MapReduce執行流程圖

概述

MapReduce是一種分布式計算模型,由Google提出,主要用于搜索領域,解決海量數據的計算問題。

MapReduce是分布式運行的,由兩個階段組成:Map和Reduce,Map階段是一個獨立的程序,有很多個節點同時運行,每個節點處理一部分數據。

Reduce階段是一個獨立的程序,有很多個節點同時運行,每個節點處理一部分數據。

使用

MapReduce框架都有默認實現,用戶只需要覆蓋map()和reduce()兩個函數,即可實現分布式計算,非常簡單。

這兩個函數的形參和返回值都是,使用的時候一定要注意構造。

簡單的介紹一下大數據中最重要的MapReduce

執行流程(此處舉例說明)

  1. 一個文本(在HDFS上面保存,兩個block)中每一個單詞的出現的次數: 
  2.     hello you hello marry 
  3.     hello me really 
  4.             ----->block-1 
  5.              
  6.     hello kate ready 
  7.     xiao wang hello tomcat 
  8.             ----->block-2 

1.獲取每一個block塊中的文本,遍歷所有,回去其中的一行str

因為要統計的是每一個單詞i的次數,所以還需要直到文本中有哪些單詞,可以根據字符串的特點,使用split()進行切割。

  1. String[] words=str.split(""); 

根據要求,需將每一個單詞i轉換為的形式,k為單詞本身,v為單詞出現的次數。

2.因為mr的計算是分布式的 ,每一個map(稱之為一個mapper task)計算其中的一個block塊數據。

  1. map階段: 
  2.     輸入 
  3.         k1,偏移量,v1,當前行文本內容 
  4.         map()函數操作 
  5.     輸出 
  6.         k2,具體單詞,v2,單詞對應的統計項,比如次數 
  7.     輸出 
  1. shuffle階段 
  2. 研究后發現,如果按照這種方式向reduce輸出數據的時候,會有 
  3. 大量的冗余數據。 
  4. 比如map階段之后有5個hello,則輸出,,
  5. ,5次,實際上會對網絡造成一定的壓力,能不能對 
  6. 這5個進行一個進入reduce之前的本地組合?比如成為 
  7. 或者
  8. 這個過程成為shuffle,洗牌重組階段,達到上述的結果,稱之為規約。 
  9. >>>shuffle階段,也就是對map的輸出進行重新洗牌: 
  10. 分區、分組、排序 
  11. ...===> 
  1. reduce階段 
  2. 接收map的輸出結果 
  3. 對這個結果進行匯總統計,針對values,進行簡單的累加,計算得出key 
  4. 對應的次數 
  5. reduce針對一個key調用一次reduce()函數 
  6. =====>reduce 階段 
  7. 輸入 
  8.     K2,就是map的輸出的K2,V2s是map經過shuffle之后的結果集 
  9.     reduce()函數操作 
  10. 轉化為   

經過上述操作之后,系統會將計算結果輸出給用戶,一般會先存儲(落地)到hdfs,然后反饋給用戶。

到此為止,MapReduce執行完畢,接下來就可以進行大數據的其他一系列操作了。

當前題目:簡單的介紹一下大數據中最重要的MapReduce
鏈接URL:http://m.kartarina.com/news/99489.html

成都網站建設公司_創新互聯,為您提供網站維護標簽優化App開發域名注冊手機網站建設網站制作

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都網頁設計公司
主站蜘蛛池模板: 亚洲av无码国产精品色午夜字幕 | 精品无码国产污污污免费网站| 暴力强奷在线播放无码| 日韩人妻无码一区二区三区| 日韩人妻精品无码一区二区三区 | 伊人蕉久中文字幕无码专区 | 亚洲av无码精品网站| 久久久精品天堂无码中文字幕| 本道天堂成在人线av无码免费| 中文无码字幕中文有码字幕| 最新高清无码专区| 深夜a级毛片免费无码| 精品人妻大屁股白浆无码| 一本加勒比hezyo无码专区| 影音先锋无码a∨男人资源站| 久久精品中文字幕无码绿巨人| 国产成人综合日韩精品无码不卡 | 狠狠躁狠狠躁东京热无码专区| 亚洲AV无码一区二区三区在线| 亚洲AV无码不卡在线播放| 惠民福利中文字幕人妻无码乱精品 | 无码熟妇人妻AV在线影院| 亚洲AV永久无码区成人网站| 久久精品无码一区二区app| 好了av第四综合无码久久 | 免费无码又爽又刺激聊天APP| 日韩精品真人荷官无码| 西西午夜无码大胆啪啪国模| 国产成年无码AV片在线韩国| 一本久道中文无码字幕av| 国产精品爽爽V在线观看无码| 亚洲GV天堂无码男同在线观看| 无码国产精品一区二区免费3p| 亚洲AV永久无码精品水牛影视 | 精品无码久久久久久尤物| 国产成人无码一区二区在线播放| 少妇性饥渴无码A区免费| 亚洲日韩激情无码一区| 国产AV无码专区亚洲A∨毛片| 亚洲精品无码成人片久久 | 久久老子午夜精品无码|