天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法研究

發(fā)布時(shí)間:2017-04-07 15:22

  本文關(guān)鍵詞:基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:近年來(lái),隨著科學(xué)技術(shù)的迅速發(fā)展,科研文獻(xiàn)的數(shù)量呈爆炸式增長(zhǎng)。科研文獻(xiàn)的傳播能夠促進(jìn)學(xué)術(shù)成果的交流,從而使科學(xué)技術(shù)得到不斷發(fā)展。對(duì)于科研工作者來(lái)說(shuō),難以快速地從海量文獻(xiàn)中發(fā)現(xiàn)真正需要的文獻(xiàn)。引文推薦目的在于根據(jù)用戶的查詢輸入準(zhǔn)確而快速地為用戶推薦可能需要引用的文獻(xiàn),提高用戶獲取參考文獻(xiàn)的效率。本文主要研究引文推薦,即根據(jù)論文的標(biāo)題和摘要推薦出論文可能需要引用的文獻(xiàn)。為此,本文設(shè)計(jì)和實(shí)現(xiàn)了一種基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法,將引文推薦看作一個(gè)分類問(wèn)題。本文的兩個(gè)關(guān)鍵點(diǎn)是評(píng)估候選引文的影響力和查詢輸入與候選引文的相關(guān)度。本文利用論文未來(lái)的引用次數(shù)來(lái)評(píng)估其影響力,將論文引用次數(shù)預(yù)測(cè)看作一個(gè)回歸問(wèn)題。針對(duì)論文引用次數(shù)預(yù)測(cè),本文提出了基于主題分布的內(nèi)容類特征提取方法、基于作者合作矩陣的作者類特征提取方法、以及基于Stacking方法的論文引用次數(shù)預(yù)測(cè)方法。針對(duì)引文推薦,本文提出了基于向量空間模型和KL距離的查詢輸入與候選引文的相關(guān)度特征提取方法、以及基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法。分類特征包括用于論文引用次數(shù)預(yù)測(cè)的內(nèi)容類特征和作者類特征、查詢輸入與候選引文的相關(guān)度特征。KDD CUP數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,基于Stacking方法的論文引用次數(shù)預(yù)測(cè)結(jié)果優(yōu)于基于單個(gè)回歸模型的引用次數(shù)預(yù)測(cè)結(jié)果,基于梯度漸進(jìn)回歸樹(shù)的引文推薦結(jié)果優(yōu)于基于Lucene的引文檢索結(jié)果。因此,實(shí)驗(yàn)結(jié)果表明了本文方法的有效性。
【關(guān)鍵詞】:引用次數(shù)預(yù)測(cè) 引文推薦 Stacking方法 梯度漸進(jìn)回歸樹(shù)
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第1章 緒論9-17
  • 1.1. 研究背景和意義9-11
  • 1.2. 國(guó)內(nèi)外研究現(xiàn)狀11-14
  • 1.3. 本文的研究?jī)?nèi)容和目的14-16
  • 1.4. 論文的組織結(jié)構(gòu)16-17
  • 第2章 論文引用次數(shù)預(yù)測(cè)17-40
  • 2.1. 論文引用次數(shù)預(yù)測(cè)算法概述17-19
  • 2.2. 論文主題分布生成19-20
  • 2.3. 主題關(guān)聯(lián)概率計(jì)算20-22
  • 2.4. 作者合作矩陣構(gòu)造22-24
  • 2.5. 特征提取24-30
  • 2.5.1. 內(nèi)容類特征24-27
  • 2.5.2. 作者類特征27-30
  • 2.6. 回歸模型30-35
  • 2.6.1. 線性回歸31-32
  • 2.6.2. 支持向量機(jī)32-33
  • 2.6.3. 隨機(jī)森林33
  • 2.6.4. 梯度漸進(jìn)回歸樹(shù)33-34
  • 2.6.5. 初始化的梯度漸進(jìn)回歸樹(shù)34-35
  • 2.7. 基于Stacking方法的論文引用次數(shù)預(yù)測(cè)35-38
  • 2.8. 本章小結(jié)38-40
  • 第3章 引文推薦40-50
  • 3.1. 基于梯度漸進(jìn)回歸樹(shù)的引文推薦40-43
  • 3.2. 候選引文選取43-48
  • 3.2.1. 倒排索引構(gòu)建43-45
  • 3.2.2. 基于倒排索引的檢索45-48
  • 3.3. 相關(guān)度特征提取48-49
  • 3.4. 本章小結(jié)49-50
  • 第4章 系統(tǒng)實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果分析50-66
  • 4.1. 引文推薦系統(tǒng)50-53
  • 4.1.1. 系統(tǒng)主要功能50
  • 4.1.2. 系統(tǒng)體系結(jié)構(gòu)50-53
  • 4.2. 實(shí)驗(yàn)數(shù)據(jù)53-55
  • 4.3. 評(píng)估指標(biāo)55-56
  • 4.4. 論文引用次數(shù)預(yù)測(cè)實(shí)驗(yàn)結(jié)果56-64
  • 4.4.1. 不同特征集合的實(shí)驗(yàn)結(jié)果56-57
  • 4.4.2. 單個(gè)特征對(duì)結(jié)果的影響57-60
  • 4.4.3. 基于Stacking方法的實(shí)驗(yàn)結(jié)果60-64
  • 4.5. 引文推薦實(shí)驗(yàn)結(jié)果64-65
  • 4.6. 本章小結(jié)65-66
  • 結(jié)論66-68
  • 參考文獻(xiàn)68-71
  • 攻讀學(xué)位期間發(fā)表論文與研究成果清單71-72
  • 致謝72

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 ;關(guān)于發(fā)布本刊論文被引次數(shù)的通知[J];動(dòng)物營(yíng)養(yǎng)學(xué)報(bào);2014年04期

2 ;本刊被SCI-EXPANDED引用論文[J];中國(guó)生物化學(xué)與分子生物學(xué)報(bào);2000年04期

3 ;2005年12月6日科技部中國(guó)科技信息研究所公布的2004年度中國(guó)科技期刊的引用次數(shù)總排名[J];地質(zhì)學(xué)報(bào);2006年01期

4 ;中國(guó)近十年論文總引用次數(shù)超過(guò)五百萬(wàn)[J];科技傳播;2012年03期

5 flyingphoenix;IT十大名言[J];電腦愛(ài)好者;2003年06期

6 蔣悟生;20種國(guó)際著名科學(xué)期刊介紹[J];世界科學(xué);2000年09期

7 張荔子;國(guó)科技論文產(chǎn)出世界第五 醫(yī)藥衛(wèi)生期刊競(jìng)爭(zhēng)力強(qiáng)勁[J];世界華人消化雜志;2004年04期

8 ;2001年度中國(guó)科技論文統(tǒng)計(jì)結(jié)果[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期

9 ;影響與名氣[J];開(kāi)放教育研究;2012年04期

10 Christopher King;莫京;馬建華;;2011熱點(diǎn)研究論文和作者[J];科學(xué)觀察;2012年04期

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條

1 本報(bào)記者 李大慶;中國(guó)國(guó)際科技論文被引用次數(shù)躋身世界前五[N];科技日?qǐng)?bào);2013年

2 記者 桂運(yùn)安;科大論文平均被引用次數(shù)高居榜首[N];安徽日?qǐng)?bào);2013年

3 記者 柯進(jìn);八成表現(xiàn)不俗論文出自高校[N];中國(guó)教育報(bào);2012年

4 新訊;中科院地質(zhì)論文引用次數(shù)排第五[N];地質(zhì)勘查導(dǎo)報(bào);2007年

5 記者 張蕾 袁于飛;我國(guó)發(fā)表科技論文數(shù)世界第二[N];光明日?qǐng)?bào);2011年

6 記者 桂運(yùn)安;中科大論文被引用次數(shù)全國(guó)第一[N];安徽日?qǐng)?bào);2010年

7 記者 趙亞輝;我國(guó)科技論文數(shù)量躍居世界第四[N];人民日?qǐng)?bào);2006年

8 解讀人 中國(guó)科學(xué)技術(shù)信息研究所研究員 武夷山;SCI論文數(shù)量世界第二[N];人民日?qǐng)?bào);2012年

9 本報(bào)記者 袁志勇;論文質(zhì)量評(píng)價(jià)要看具體引用次數(shù)[N];科技日?qǐng)?bào);2008年

10 記者 翟帆;“表現(xiàn)不俗”論文八成出自高校[N];中國(guó)教育報(bào);2011年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 陳俊鵬;基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法研究[D];北京理工大學(xué);2016年


  本文關(guān)鍵詞:基于梯度漸進(jìn)回歸樹(shù)的引文推薦方法研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):290759

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/290759.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶18b85***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com