基于hadoop與加權模型的FP-growth算法的優(yōu)化研究
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2-1頻繁模式樹FP-tree第三步,從FP-tree的底端自下而上進行挖掘,為項頭表中每個節(jié)點生成條
第二章相關理論及技術研究11第一步,對事務數(shù)據(jù)庫D進行掃描,計算各項的支持度,將小于最小支持度的項剔除,剩余項按支持度降序排列,若支持度相同時按字母順序排列,得到頻繁1項集L={A:8,E:7,C:5,G:4,B:2,D:2,F:2}。有序事務集如表2-4第3列所示。第二步,創(chuàng)建....
圖2-2Hadoop結構框架圖
天津工業(yè)大學碩士學位論文14同的機器,然后Reduce函數(shù)將拆分并處理后的數(shù)據(jù)進行整合統(tǒng)計,輸出最終結果。(3)Yarn。Yarn是Hadoop2.x中被引入的核心部件,它是Hadoop的資源管理系統(tǒng)。它可以理解為是一個“管理平臺”,使Hadoop不僅可以支持MapReduce計....
圖2-3MapReduce執(zhí)行流程圖
第二章相關理論及技術研究152.3.2并行計算框架MapReduceMapReduce是我們在進行大數(shù)據(jù)處理的時候經(jīng)常要使用的計算模型,通過MapReduce很容易在Hadoop平臺上進行分布式的計算編程。MapReduce由兩個關鍵性操作構成,即Map(映射)與Reduce(歸....
圖2-4WordCount案例MapReduce流程
天津工業(yè)大學碩士學位論文16(4)ShuffleShuffle是介于Map和Reduce過程中間的操作,它需要從所有Map任務輸出的結果中篩選鍵值對,將具有相同key的<key,value>對組合在一起發(fā)送到同一個Reduce任務中作為輸入。(5)化簡ReduceReduce負責....
本文編號:3913929
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3913929.html