基于Storm的微博實(shí)時(shí)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
文內(nèi)圖片:
圖片說明: 2.1.1邐Hadoop生態(tài)系統(tǒng)筒介逡逑現(xiàn)今Hadoop己經(jīng)成長為一個(gè)龐大的體系,滲透到大數(shù)據(jù)處理的各個(gè)領(lǐng)域。逡逑圖2-1是一個(gè)Hadoop家族的生態(tài)圖譜。Hadoop作為一個(gè)生態(tài)系統(tǒng),其生態(tài)圈內(nèi)逡逑的每個(gè)子系統(tǒng)的都專注于解決某一特定領(lǐng)域的問題,這也是Hadoop的一個(gè)吸引逡逑人的魅力所在:由許多小而精的子系統(tǒng)構(gòu)成[19]。在表2-1中列舉出了邋Hadoop生逡逑態(tài)系統(tǒng)中的各個(gè)組件及其功能。逡逑6逡逑
文內(nèi)圖片:
圖片說明: MapReduce的名字來源于其模型中的兩項(xiàng)核心操作:Map階段和Reduce階逡逑段。Map階段主要是對(duì)輸入進(jìn)行整合,將讀取的內(nèi)容以鍵值對(duì)的形式輸出。Reduce逡逑階段負(fù)責(zé)對(duì)Map階段輸出的數(shù)據(jù)進(jìn)行后續(xù)處理。圖2-2是MapReduce數(shù)據(jù)處理逡逑的流程圖。逡逑在數(shù)據(jù)進(jìn)行MapReduce處理階段,首先Hadoop會(huì)對(duì)數(shù)據(jù)進(jìn)行分塊處理,,之逡逑后將數(shù)據(jù)信息交給Map任務(wù)去讀取處理,產(chǎn)生相應(yīng)的鍵值對(duì)數(shù)據(jù)。之后進(jìn)入逡逑Reduce階段,執(zhí)行預(yù)先定義的Reduce函數(shù),即將具有相同key的數(shù)據(jù)集中在一逡逑起進(jìn)行處理,最后將結(jié)果輸出到HDFS上。逡逑Hadoop集群由普通PC構(gòu)成,是無共享式架構(gòu),在數(shù)據(jù)處理之前,將數(shù)據(jù)逡逑分塊后儲(chǔ)存到各個(gè)節(jié)點(diǎn)上。在需要處理數(shù)據(jù)時(shí),Map函數(shù)就近的讀取本地儲(chǔ)存的逡逑數(shù)據(jù),將數(shù)據(jù)處理完再進(jìn)行合并、排序操作后分發(fā)給Reduce函數(shù)處理。逡逑Splitl邐邐?{邐Map()邐Reduce()邋)邐?part。逡逑Split2邐邐MapQ邐ReduceQ邋)邐?parti逡逑Sp?3邐邐^邋MapQ邐^逡逑Spl(t4邐邐Map(}逡逑圖2-2MapReduce數(shù)據(jù)處理流程圖[1逡逑2.1.3邋HDFS邋簡介逡逑HDFS邋是邋Hadoop邋Distributed邋Hie邋System邋的縮寫
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 高鳳麗;孫連山;;個(gè)性化推薦系統(tǒng)概述[J];技術(shù)與市場;2015年02期
2 宋亞奇;劉樹仁;朱永利;王德文;李莉;;電力設(shè)備狀態(tài)高速采樣數(shù)據(jù)的云存儲(chǔ)技術(shù)研究[J];電力自動(dòng)化設(shè)備;2013年10期
3 許小媛;程宏兵;;基于云計(jì)算的海量數(shù)據(jù)存儲(chǔ)[J];制造業(yè)自動(dòng)化;2013年13期
4 賀玲;吳玲達(dá);蔡益朝;;數(shù)據(jù)挖掘中的聚類算法綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年01期
相關(guān)碩士學(xué)位論文 前9條
1 劉暉;基于Hadoop的微博推薦系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2014年
2 任青;基于Hadoop云平臺(tái)的社交網(wǎng)絡(luò)服務(wù)推薦算法的研究[D];吉林大學(xué);2013年
3 耿玉嬌;MapReduce中基于抽樣技術(shù)的傾斜問題研究[D];大連海事大學(xué);2013年
4 郝向濤;基于Hadoop的分布式文件系統(tǒng)技術(shù)分析及應(yīng)用[D];武漢理工大學(xué);2013年
5 汪曄;基于用戶關(guān)系鏈的微博收聽推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2013年
6 周姚;基于云計(jì)算的文本挖掘技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
7 晏金;分布式文件系統(tǒng)在G/S模式中的應(yīng)用研究[D];成都理工大學(xué);2010年
8 莊永龍;基于項(xiàng)目特征模型的協(xié)同過濾推薦算法研究[D];南京理工大學(xué);2008年
9 吳昕方;基于特征的個(gè)性化電子商務(wù)網(wǎng)站推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2006年
本文編號(hào):2514236
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2514236.html