Hadoop上的PageRank算法優(yōu)化
【圖文】:
MapReduce 任務(wù)中有兩種主要的進(jìn)程:JobTracker 和 TaskTracker。JobTracker運(yùn)行在 Namenode 上,TaskTracker 運(yùn)行在 Datanode 上:客戶端會(huì)向JobTracker提交計(jì)算任務(wù)JobTracker從NameNode上得到需要的數(shù)據(jù)在HDFS上存儲(chǔ)的具體節(jié)點(diǎn)和位置。JobTracker找到有空閑或離所需數(shù)據(jù)最近的TaskTracker,用來執(zhí)行相應(yīng)的計(jì)算任務(wù)。執(zhí)行中的TaskTracker會(huì)被監(jiān)控,如果其沒有及時(shí)向JobTracker發(fā)送心跳信息,就會(huì)被JobTracker認(rèn)為該節(jié)點(diǎn)巖機(jī),JobTracker會(huì)在其他的TaskTracker上重啟任務(wù)。當(dāng)執(zhí)行失敗時(shí),TaskTracker會(huì)通知JobTracker,,JobTracker會(huì)決定如何應(yīng)對(duì):JobTracker可能會(huì)在其他TaskTracker上重啟任務(wù),甚至可能將此TaskTracker列入黑名單。當(dāng)計(jì)算任務(wù)完成后,JobTracker會(huì)更新狀態(tài),客戶端從JobTracker得到返回
對(duì)比兩種方法在不同階段產(chǎn)生的數(shù)據(jù)量圖18的橫坐標(biāo)代表每輪PageRank迭代中的3個(gè)階段,1代表Map開始時(shí),
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期
2 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期
3 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進(jìn)算法[J];情報(bào)雜志;2006年11期
4 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期
5 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
6 姜鑫維;趙岳松;;Topic PageRank——一種基于主題的搜索引擎[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年05期
7 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[J];中文信息學(xué)報(bào);2007年05期
8 田甜;倪林;;基于PageRank算法的權(quán)威值不均衡分配問題[J];計(jì)算機(jī)工程;2007年18期
9 劉彤彤;伍小芹;;融入權(quán)威性與相關(guān)性的PageRank算法[J];信息技術(shù);2008年11期
10 李吉平;吳陳;曾慶軍;;基于轉(zhuǎn)移概率的PageRank算法研究[J];科學(xué)技術(shù)與工程;2008年08期
相關(guān)會(huì)議論文 前10條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國(guó)控制與決策會(huì)議論文集(3)[C];2009年
2 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 藺繼國(guó);徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個(gè)性化PageRank算法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
4 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語言信息處理、第二屆全國(guó)多語言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁(yè)質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁(yè)排序研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年
7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評(píng)分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國(guó)復(fù)雜系統(tǒng)研究論壇論文集(一)[C];2005年
相關(guān)碩士學(xué)位論文 前10條
1 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學(xué);2008年
2 邵晶晶;基于PageRank排序算法改進(jìn)的若干研究[D];華中師范大學(xué);2009年
3 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年
4 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
5 姜sバ
本文編號(hào):2544141
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2544141.html