學(xué)術(shù)論文排序預(yù)測算法研究
發(fā)布時間:2017-09-18 17:21
本文關(guān)鍵詞:學(xué)術(shù)論文排序預(yù)測算法研究
更多相關(guān)文章: 文獻(xiàn)排名預(yù)測 引文網(wǎng)絡(luò) 合著網(wǎng)絡(luò) PageRank
【摘要】:論文排名預(yù)測是通過一定的算法預(yù)測論文的價值,并按預(yù)測結(jié)果對論文排名。在學(xué)術(shù)社會網(wǎng)絡(luò)中,排名預(yù)測算法能夠給出在未來也會持續(xù)得到關(guān)注的論文,這對于科技工作者把握當(dāng)前及未來的研究方向起著積極的指導(dǎo)作用。目前常用的學(xué)術(shù)論文排名標(biāo)準(zhǔn)包括PageRank、HITS等。這些傳統(tǒng)的文獻(xiàn)評價方法,主要通過文獻(xiàn)的引用進(jìn)行重要性傳遞對論文進(jìn)行評價。然而,在引文網(wǎng)絡(luò)中引用關(guān)系暗含著知識的傳遞,即引文與被引文獻(xiàn)之間文本的關(guān)聯(lián)程度,這種關(guān)聯(lián)程度影響著引文對被引文的重要性傳遞,且對于傳統(tǒng)的評價方法來說,引文網(wǎng)絡(luò)只是當(dāng)前時間的一個快照,存在新節(jié)點排擠問題。同時,典型的論文排名預(yù)測算法CiteRank只考慮了論文的發(fā)表時間,FutureRank算法僅涉及論文的發(fā)表時間、作者權(quán)威度和論文已有的PageRank值。此外,學(xué)術(shù)關(guān)系發(fā)展呈現(xiàn)多樣性,學(xué)者在檢索論文時,會考慮多種因素,如引文次數(shù)、相似度、期刊/會議的影響力、作者權(quán)威度等,這些因素也隱含對文獻(xiàn)的價值的評估。因此,我們在對文獻(xiàn)排序預(yù)測時應(yīng)綜合考慮各種可能對論文價值評估產(chǎn)生影響的特征。針對以上方法存在的問題,我們提出了通過預(yù)測文獻(xiàn)相對引用次數(shù)實現(xiàn)對文獻(xiàn)未來排序的算法FRP(Future Ranking Prediction)。FRP算法包括以下四步:(1)基于引文與被引文的文本間的關(guān)聯(lián)強(qiáng)度、引用的新舊對論文重要性傳遞的影響,通過引文網(wǎng)絡(luò)分別計算論文的PageRank值、波納西茨權(quán)力指數(shù);(2)通過引文網(wǎng)絡(luò)和合著網(wǎng)絡(luò)獲得作者的文獻(xiàn)發(fā)表量、權(quán)威度、平均被引次數(shù)以及合著特征;(3)結(jié)合引文網(wǎng)絡(luò)與論文發(fā)表時間抽取文獻(xiàn)的引用率;(4)利用(1)(2)(3)抽取的特征,通過BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)來預(yù)測文獻(xiàn)未來排序。實驗結(jié)果表明FRP方法提高了預(yù)測準(zhǔn)確率。
【關(guān)鍵詞】:文獻(xiàn)排名預(yù)測 引文網(wǎng)絡(luò) 合著網(wǎng)絡(luò) PageRank
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 緒論11-16
- 1.1 選題背景及意義11-12
- 1.2 研究現(xiàn)狀12-14
- 1.3 主要研究內(nèi)14
- 1.4 本文的組織機(jī)構(gòu)14-16
- 第二章 相關(guān)理論和技術(shù)16-24
- 2.1 LDA模型16-18
- 2.2 引文網(wǎng)絡(luò)18
- 2.3 文獻(xiàn)排名算法18-21
- 2.3.1 基于PageRank文獻(xiàn)排名算法18-19
- 2.3.2 基于波納西茨權(quán)力指數(shù)的文獻(xiàn)排名算法19-20
- 2.3.3 基于HITS文獻(xiàn)排名算法20-21
- 2.4 作者特征21-23
- 2.4.1 H-index21-22
- 2.4.2 合著特征22-23
- 2.5 引用特征23-24
- 第三章 學(xué)術(shù)論文排序預(yù)測算法研究24-34
- 3.1 總體框架24-25
- 3.2 特征提取25-31
- 3.2.1 基于文本特征的PageRank值25-27
- 3.2.2 基于時間的波納西茨權(quán)力指數(shù)特征27-28
- 3.2.3 作者特征28-31
- 3.2.3.1 學(xué)者合著關(guān)系29-30
- 3.2.3.2 作者重要性30
- 3.2.3.3 文獻(xiàn)發(fā)表量30-31
- 3.2.3.4 平均被引次數(shù)31
- 3.2.4 引用率31
- 3.3 學(xué)習(xí)模型31-33
- 3.4 本章小結(jié)33-34
- 第四章 實驗與分析34-43
- 4.1 實驗數(shù)據(jù)及預(yù)處理34-35
- 4.2 評價標(biāo)準(zhǔn)35
- 4.3 實驗結(jié)果35-43
- 第五章 總結(jié)和展望43-45
- 5.1 工作總結(jié)43
- 5.2 工作展望43-45
- 參考文獻(xiàn)45-49
- 致謝49
【參考文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 薛銳青;基于作者權(quán)威值的論文排名預(yù)測算法研究[D];吉林大學(xué);2012年
2 劉樂;基于學(xué)術(shù)社會網(wǎng)絡(luò)特征的專家搜索算法[D];內(nèi)蒙古大學(xué);2014年
,本文編號:876833
本文鏈接:http://sikaile.net/wenshubaike/lwzy/876833.html
最近更新
教材專著