基于Hadoop的學(xué)術(shù)文獻(xiàn)排名及作者影響力評(píng)價(jià)算法
發(fā)布時(shí)間:2022-01-18 22:03
隨著科學(xué)技術(shù)的飛速發(fā)展,研究成果的產(chǎn)出量逐步提高,文獻(xiàn)檢索系統(tǒng)等電子媒介逐漸成為了學(xué)術(shù)成果的主要存儲(chǔ)方式之一。面對(duì)海量電子文獻(xiàn)數(shù)據(jù),如何從中快速找到研究者們所需要的文獻(xiàn)、作者信息,成為當(dāng)前的一個(gè)亟待解決的問(wèn)題。更準(zhǔn)確的對(duì)文獻(xiàn)進(jìn)行排名、對(duì)學(xué)者的學(xué)術(shù)水平進(jìn)行評(píng)價(jià),可以減少普通研究者在進(jìn)行文獻(xiàn)、作者檢索時(shí)所花費(fèi)的代價(jià),節(jié)省研究者的時(shí)間,使研究者快速了解某一領(lǐng)域內(nèi)的研究重點(diǎn)、研究熱點(diǎn)。傳統(tǒng)的文獻(xiàn)排名及作者影響力評(píng)價(jià)方法計(jì)算復(fù)雜度較高,難以處理海量文獻(xiàn)數(shù)據(jù)。為了更合理的對(duì)海量學(xué)術(shù)數(shù)據(jù)中的文獻(xiàn)進(jìn)行排名、作者影響力進(jìn)行評(píng)價(jià),本文利用Hadoop云計(jì)算平臺(tái)的數(shù)據(jù)處理能力,基于MapReduce計(jì)算框架對(duì)這兩個(gè)問(wèn)題進(jìn)行了深入研究,主要工作包含以下兩個(gè)方面:(1)提出了一種文獻(xiàn)排名NTMP(Notave-Timefactor-Mapeduce-Pagerank)算法。改進(jìn)了傳統(tǒng)PageRank算法在進(jìn)行文獻(xiàn)排名計(jì)算時(shí)忽略文獻(xiàn)發(fā)表時(shí)間對(duì)價(jià)值的影響以及迭代次數(shù)過(guò)多的問(wèn)題。該算法基于MapReduce計(jì)算框架構(gòu)建,加入了時(shí)間因素對(duì)于文獻(xiàn)價(jià)值排名的影響,優(yōu)化了迭代過(guò)程中NTMP值的分配過(guò)程。實(shí)驗(yàn)表明NTMP算法,...
【文章來(lái)源】:河北地質(zhì)大學(xué)河北省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文獻(xiàn)發(fā)表年限與被引數(shù)量關(guān)系圖
文獻(xiàn)影響力衰退圖
圖 3.6 單次迭代運(yùn)行時(shí)間對(duì)比圖代次數(shù)方面,因?yàn)楦倪M(jìn)了迭代過(guò)程中 NTMP 值的傳輸過(guò)程,使得 NT的流向質(zhì)量高的文獻(xiàn),所以 NTMP 算法收斂速度更快。傳統(tǒng) PageRan6 次才能完成迭代,而 NTMP 算法只需要 75 次。如圖 3.6 所示,在時(shí)間
【參考文獻(xiàn)】:
期刊論文
[1]云環(huán)境下分布式文件系統(tǒng)負(fù)載均衡研究[J]. 吳瑤瑤,楊庚. 計(jì)算機(jī)工程與應(yīng)用. 2019(10)
[2]一種基于PageRank和時(shí)間衰退因子的作者影響力評(píng)價(jià)方法[J]. 崔景洋. 廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2018(02)
[3]基于PageRank的用戶影響力評(píng)價(jià)改進(jìn)算法[J]. 王頂,徐軍,段存玉,吳玥瑤,孫靜. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2018(05)
[4]云計(jì)算數(shù)據(jù)中心HDFS差異性存儲(chǔ)節(jié)能優(yōu)化算法[J]. 楊挺,王萌,張亞健,趙英杰,盆海波. 計(jì)算機(jī)學(xué)報(bào). 2019(04)
[5]一種類h指數(shù)實(shí)證分析及實(shí)踐應(yīng)用[J]. 宋振世. 現(xiàn)代情報(bào). 2017(05)
[6]基于PageRank的微博用戶影響力算法研究[J]. 孫紅,左騰. 計(jì)算機(jī)應(yīng)用研究. 2018(04)
[7]基于灰色關(guān)聯(lián)分析的作者影響力綜合評(píng)價(jià)方法[J]. 王雨,郭進(jìn)利. 情報(bào)雜志. 2017(03)
[8]基于文獻(xiàn)引文網(wǎng)絡(luò)的學(xué)者學(xué)術(shù)影響力測(cè)度研究[J]. 劉萍,楊宇,鄒德安. 情報(bào)理論與實(shí)踐. 2017(03)
[9]科技期刊中“近年來(lái)”后引用參考文獻(xiàn)的老化規(guī)律——以化學(xué)學(xué)科為例[J]. 陳麗萍,周英智. 中國(guó)科技期刊研究. 2016(12)
[10]三種權(quán)重賦權(quán)法的比較分析[J]. 吳希. 中國(guó)集體經(jīng)濟(jì). 2016(34)
碩士論文
[1]基于灰色關(guān)聯(lián)分析的多因子選股模型研究[D]. 王赟.北京交通大學(xué) 2017
[2]基于主題模型的社交媒體主題挖掘和文獻(xiàn)影響力預(yù)測(cè)分析[D]. 邱潔.西南大學(xué) 2017
[3]基于引文網(wǎng)絡(luò)的文獻(xiàn)在線推薦系統(tǒng)研究和實(shí)現(xiàn)[D]. 馬丙超.大連理工大學(xué) 2016
[4]文獻(xiàn)排名預(yù)測(cè)算法及作者影響力評(píng)估算法研究[D]. 曾瑋.西南大學(xué) 2014
[5]基于HDFS的云存儲(chǔ)系統(tǒng)數(shù)據(jù)安全性研究[D]. 石磊慶.北京郵電大學(xué) 2013
[6]基于引用網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)排名算法研究[D]. 杜文杰.哈爾濱工程大學(xué) 2013
本文編號(hào):3595670
【文章來(lái)源】:河北地質(zhì)大學(xué)河北省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文獻(xiàn)發(fā)表年限與被引數(shù)量關(guān)系圖
文獻(xiàn)影響力衰退圖
圖 3.6 單次迭代運(yùn)行時(shí)間對(duì)比圖代次數(shù)方面,因?yàn)楦倪M(jìn)了迭代過(guò)程中 NTMP 值的傳輸過(guò)程,使得 NT的流向質(zhì)量高的文獻(xiàn),所以 NTMP 算法收斂速度更快。傳統(tǒng) PageRan6 次才能完成迭代,而 NTMP 算法只需要 75 次。如圖 3.6 所示,在時(shí)間
【參考文獻(xiàn)】:
期刊論文
[1]云環(huán)境下分布式文件系統(tǒng)負(fù)載均衡研究[J]. 吳瑤瑤,楊庚. 計(jì)算機(jī)工程與應(yīng)用. 2019(10)
[2]一種基于PageRank和時(shí)間衰退因子的作者影響力評(píng)價(jià)方法[J]. 崔景洋. 廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2018(02)
[3]基于PageRank的用戶影響力評(píng)價(jià)改進(jìn)算法[J]. 王頂,徐軍,段存玉,吳玥瑤,孫靜. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2018(05)
[4]云計(jì)算數(shù)據(jù)中心HDFS差異性存儲(chǔ)節(jié)能優(yōu)化算法[J]. 楊挺,王萌,張亞健,趙英杰,盆海波. 計(jì)算機(jī)學(xué)報(bào). 2019(04)
[5]一種類h指數(shù)實(shí)證分析及實(shí)踐應(yīng)用[J]. 宋振世. 現(xiàn)代情報(bào). 2017(05)
[6]基于PageRank的微博用戶影響力算法研究[J]. 孫紅,左騰. 計(jì)算機(jī)應(yīng)用研究. 2018(04)
[7]基于灰色關(guān)聯(lián)分析的作者影響力綜合評(píng)價(jià)方法[J]. 王雨,郭進(jìn)利. 情報(bào)雜志. 2017(03)
[8]基于文獻(xiàn)引文網(wǎng)絡(luò)的學(xué)者學(xué)術(shù)影響力測(cè)度研究[J]. 劉萍,楊宇,鄒德安. 情報(bào)理論與實(shí)踐. 2017(03)
[9]科技期刊中“近年來(lái)”后引用參考文獻(xiàn)的老化規(guī)律——以化學(xué)學(xué)科為例[J]. 陳麗萍,周英智. 中國(guó)科技期刊研究. 2016(12)
[10]三種權(quán)重賦權(quán)法的比較分析[J]. 吳希. 中國(guó)集體經(jīng)濟(jì). 2016(34)
碩士論文
[1]基于灰色關(guān)聯(lián)分析的多因子選股模型研究[D]. 王赟.北京交通大學(xué) 2017
[2]基于主題模型的社交媒體主題挖掘和文獻(xiàn)影響力預(yù)測(cè)分析[D]. 邱潔.西南大學(xué) 2017
[3]基于引文網(wǎng)絡(luò)的文獻(xiàn)在線推薦系統(tǒng)研究和實(shí)現(xiàn)[D]. 馬丙超.大連理工大學(xué) 2016
[4]文獻(xiàn)排名預(yù)測(cè)算法及作者影響力評(píng)估算法研究[D]. 曾瑋.西南大學(xué) 2014
[5]基于HDFS的云存儲(chǔ)系統(tǒng)數(shù)據(jù)安全性研究[D]. 石磊慶.北京郵電大學(xué) 2013
[6]基于引用網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)排名算法研究[D]. 杜文杰.哈爾濱工程大學(xué) 2013
本文編號(hào):3595670
本文鏈接:http://sikaile.net/tushudanganlunwen/3595670.html
最近更新
教材專著