<del id="d4fwx"><form id="d4fwx"></form></del>
      <del id="d4fwx"><form id="d4fwx"></form></del><del id="d4fwx"><form id="d4fwx"></form></del>

            <code id="d4fwx"><abbr id="d4fwx"></abbr></code>
          • 簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce

            2021-02-06    分類: 網(wǎng)站建設(shè)

            簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce
            MapReduce執(zhí)行流程圖

            概述

            MapReduce是一種分布式計(jì)算模型,由Google提出,主要用于搜索領(lǐng)域,解決海量數(shù)據(jù)的計(jì)算問題。

            MapReduce是分布式運(yùn)行的,由兩個(gè)階段組成:Map和Reduce,Map階段是一個(gè)獨(dú)立的程序,有很多個(gè)節(jié)點(diǎn)同時(shí)運(yùn)行,每個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)。

            Reduce階段是一個(gè)獨(dú)立的程序,有很多個(gè)節(jié)點(diǎn)同時(shí)運(yùn)行,每個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)。

            使用

            MapReduce框架都有默認(rèn)實(shí)現(xiàn),用戶只需要覆蓋map()和reduce()兩個(gè)函數(shù),即可實(shí)現(xiàn)分布式計(jì)算,非常簡單。

            這兩個(gè)函數(shù)的形參和返回值都是,使用的時(shí)候一定要注意構(gòu)造。

            簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce

            執(zhí)行流程(此處舉例說明)

            1. 一個(gè)文本(在HDFS上面保存,兩個(gè)block)中每一個(gè)單詞的出現(xiàn)的次數(shù): 
            2.     hello you hello marry 
            3.     hello me really 
            4.             ----->block-1 
            5.              
            6.     hello kate ready 
            7.     xiao wang hello tomcat 
            8.             ----->block-2 

            1.獲取每一個(gè)block塊中的文本,遍歷所有,回去其中的一行str

            因?yàn)橐y(tǒng)計(jì)的是每一個(gè)單詞i的次數(shù),所以還需要直到文本中有哪些單詞,可以根據(jù)字符串的特點(diǎn),使用split()進(jìn)行切割。

            1. String[] words=str.split(""); 

            根據(jù)要求,需將每一個(gè)單詞i轉(zhuǎn)換為的形式,k為單詞本身,v為單詞出現(xiàn)的次數(shù)。

            2.因?yàn)閙r的計(jì)算是分布式的 ,每一個(gè)map(稱之為一個(gè)mapper task)計(jì)算其中的一個(gè)block塊數(shù)據(jù)。

            1. map階段: 
            2.     輸入<K1,V1> 
            3.         k1,偏移量,v1,當(dāng)前行文本內(nèi)容 
            4.         map()函數(shù)操作 
            5.     輸出<K2,V2> 
            6.         k2,具體單詞,v2,單詞對應(yīng)的統(tǒng)計(jì)項(xiàng),比如次數(shù) 
            7.     輸出<K2,V2> 
            1. shuffle階段 
            2. 研究后發(fā)現(xiàn),如果按照<key,1>這種方式向reduce輸出數(shù)據(jù)的時(shí)候,會(huì)有 
            3. 大量的冗余數(shù)據(jù)。 
            4. 比如map階段之后有5個(gè)hello,則輸出<hello,1>,<hello,1>,<hello,1>, 
            5. <hello,1>,<hello,1>5次,實(shí)際上會(huì)對網(wǎng)絡(luò)造成一定的壓力,能不能對 
            6. 這5個(gè)<hello,1>進(jìn)行一個(gè)進(jìn)入reduce之前的本地組合?比如成為 
            7. <hello,5>或者<hello,[1,1,1,1,1]>. 
            8. 這個(gè)過程成為shuffle,洗牌重組階段,達(dá)到上述的結(jié)果,稱之為規(guī)約。 
            9. >>>shuffle階段,也就是對map的輸出進(jìn)行重新洗牌: 
            10. 分區(qū)、分組、排序 
            11. <K2,V2>...===><K2,V2s> 
            1. reduce階段 
            2. 接收map的輸出結(jié)果<key,values> 
            3. 對這個(gè)結(jié)果進(jìn)行匯總統(tǒng)計(jì),針對values,進(jìn)行簡單的累加,計(jì)算得出key 
            4. 對應(yīng)的次數(shù) 
            5. reduce針對一個(gè)key調(diào)用一次reduce()函數(shù) 
            6. =====>reduce 階段 
            7. 輸入<K2,V2> 
            8.     K2,就是map的輸出的K2,V2s是map經(jīng)過shuffle之后的結(jié)果集 
            9.     reduce()函數(shù)操作 
            10. 轉(zhuǎn)化為<K3,V3>   

            經(jīng)過上述操作之后,系統(tǒng)會(huì)將計(jì)算結(jié)果輸出給用戶,一般會(huì)先存儲(chǔ)(落地)到hdfs,然后反饋給用戶。

            到此為止,MapReduce執(zhí)行完畢,接下來就可以進(jìn)行大數(shù)據(jù)的其他一系列操作了。

            網(wǎng)頁名稱:簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce
            標(biāo)題網(wǎng)址:http://www.jbt999.com/news39/99489.html

            成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App設(shè)計(jì)、靜態(tài)網(wǎng)站電子商務(wù)、網(wǎng)站導(dǎo)航移動(dòng)網(wǎng)站建設(shè)、企業(yè)網(wǎng)站制作

            廣告

            聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:[email protected]。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

            微信小程序開發(fā)

              <del id="d4fwx"><form id="d4fwx"></form></del>
              <del id="d4fwx"><form id="d4fwx"></form></del><del id="d4fwx"><form id="d4fwx"></form></del>

                    <code id="d4fwx"><abbr id="d4fwx"></abbr></code>
                  • 国产又色又爽无遮挡免费 | 欧美精品A | 俺去俺来也www色官网cms | 在线观看女人爽网 | 先锋资源成人 |