基于社群發(fā)現(xiàn)的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:基于社群發(fā)現(xiàn)的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:近年來(lái),學(xué)術(shù)搜索引擎在科學(xué)研究活動(dòng)中扮演著越來(lái)越重要的角色。學(xué)術(shù)搜索的一個(gè)重要問(wèn)題是文獻(xiàn)推薦。其主要任務(wù)是向用戶(hù)推薦研究領(lǐng)域中最有價(jià)值的文獻(xiàn)。在本文中,我們利用文獻(xiàn)作者之間的合作關(guān)系以及文獻(xiàn)之間的引用關(guān)系,通過(guò)結(jié)構(gòu)分析來(lái)發(fā)現(xiàn)隱藏的相關(guān)文獻(xiàn),并推薦給用戶(hù)。基于對(duì)引用-合作網(wǎng)絡(luò)進(jìn)行社群劃分,我們提出了兩種排序算法,分別是自適應(yīng)算法和隨機(jī)游走算法,這兩種算法綜合考慮了文本相似度、作者相似度、鄰近度、影響力等多種因素來(lái)進(jìn)行文獻(xiàn)推薦。同時(shí),基于微軟學(xué)術(shù)的公開(kāi)論文引用數(shù)據(jù)集,實(shí)現(xiàn)了一個(gè)文獻(xiàn)推薦系統(tǒng)。我們招募了20名志愿者來(lái)對(duì)我們的算法進(jìn)行性能評(píng)估。實(shí)驗(yàn)結(jié)果表明,我們提出的論文推薦算法優(yōu)于PageRank等傳統(tǒng)的搜索引擎算法。最后,我們通過(guò)實(shí)驗(yàn)驗(yàn)證了算法的效率,適用于大型的學(xué)術(shù)搜索引擎。
【關(guān)鍵詞】:學(xué)術(shù)搜索 文獻(xiàn)推薦 社交網(wǎng)絡(luò) 引用-合作網(wǎng)絡(luò) 社群發(fā)現(xiàn)
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-11
- 第一章 緒論11-17
- 1.1 引言11-12
- 1.2 研究背景12-14
- 1.2.1 學(xué)術(shù)搜索引擎12
- 1.2.2 社群分析12-13
- 1.2.3 復(fù)雜圖13-14
- 1.3 研究動(dòng)機(jī)14-15
- 1.4 本文主要工作15-16
- 1.5 本文組織結(jié)構(gòu)16-17
- 第二章 相關(guān)工作17-26
- 2.1 搜索引擎17-18
- 2.2 社群分析18-21
- 2.2.1 GN算法18-19
- 2.2.2 層次聚類(lèi)算法19-20
- 2.2.3 模塊化度20
- 2.2.4 標(biāo)記傳播算法20-21
- 2.2.5 機(jī)器學(xué)習(xí)算法21
- 2.3 復(fù)雜網(wǎng)絡(luò)21-24
- 2.3.1 復(fù)雜網(wǎng)絡(luò)的定義21-23
- 2.3.2 復(fù)雜網(wǎng)絡(luò)中的社群發(fā)現(xiàn)23-24
- 2.4 全文檢索24-26
- 第三章 基于引用-合作網(wǎng)絡(luò)社群分析的文獻(xiàn)推薦算法26-38
- 3.1 引用-合作網(wǎng)絡(luò)26-27
- 3.2 問(wèn)題描述27-29
- 3.3 算法思想29
- 3.4 社群發(fā)現(xiàn)29-33
- 3.4.1 圖的轉(zhuǎn)化30-31
- 3.4.2 帶權(quán)重的標(biāo)記傳播算法31-33
- 3.5 在線檢索排序33-38
- 3.5.1 自適應(yīng)的排序算法34-35
- 3.5.2 隨機(jī)游走算法35-38
- 第四章 學(xué)術(shù)論文推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)38-51
- 4.1 數(shù)據(jù)集38
- 4.2 文本相似度38-39
- 4.3 實(shí)驗(yàn)設(shè)計(jì)與實(shí)現(xiàn)39-40
- 4.4 數(shù)據(jù)持久化模塊40-42
- 4.5 索引構(gòu)建模塊42-46
- 4.5.1 提供源文件42
- 4.5.2 分詞器處理42-43
- 4.5.3 語(yǔ)言處理組件處理43
- 4.5.4 索引組件處理43-45
- 4.5.5 對(duì)索引的查詢(xún)45-46
- 4.6 圖的構(gòu)建模塊46-47
- 4.7 社群發(fā)現(xiàn)模塊47-48
- 4.8 排序策略模塊48
- 4.9 個(gè)性化信息顯示模塊48
- 4.10 圖形界面48-50
- 4.11 本章小結(jié)50-51
- 第五章 性能分析與評(píng)估51-57
- 5.1 PageRank算法51
- 5.2 對(duì)比試驗(yàn)51-52
- 5.3 系統(tǒng)參數(shù)52
- 5.4 性能分析52-57
- 第六章 總結(jié)與展望57-58
- Bibliography58-61
- 簡(jiǎn)歷與科研成果61-62
- 致謝62-63
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;萬(wàn)方學(xué)術(shù)搜索系統(tǒng)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2011年03期
2 揭平毅;;谷歌高級(jí)學(xué)術(shù)搜索的應(yīng)用探究[J];價(jià)值工程;2012年05期
3 顏世偉;;搜索引擎的學(xué)術(shù)搜索服務(wù)及其影響分析[J];大學(xué)圖書(shū)情報(bào)學(xué)刊;2007年01期
4 陳家翠;谷玉榮;;Google學(xué)術(shù)搜索檢索性能的分析及評(píng)價(jià)[J];情報(bào)理論與實(shí)踐;2007年05期
5 饒安平;;Google學(xué)術(shù)搜索及其在課題檢索中的應(yīng)用[J];圖書(shū)館工作與研究;2010年08期
6 馬彩峰;;Google學(xué)術(shù)搜索的信息組織探究[J];情報(bào)雜志;2010年S1期
7 董文鴛;;我國(guó)谷歌學(xué)術(shù)搜索研究綜述[J];新世紀(jì)圖書(shū)館;2011年09期
8 于愛(ài)華;;高校數(shù)據(jù)庫(kù)利用實(shí)例:讀秀學(xué)術(shù)搜索的探討[J];黑龍江科技信息;2012年14期
9 許劍穎;;微軟學(xué)術(shù)搜索初探[J];情報(bào)探索;2012年12期
10 孟曉青;;高職院校超星移動(dòng)圖書(shū)館“讀秀”學(xué)術(shù)搜索的應(yīng)用與推廣研究[J];中國(guó)科教創(chuàng)新導(dǎo)刊;2014年13期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 本報(bào)記者 薛海濱 賈鵬雷;學(xué)術(shù)搜索“不學(xué)有術(shù)”[N];計(jì)算機(jī)世界;2006年
2 本報(bào)記者 陳靜;搜索巨頭瞄準(zhǔn)細(xì)分市場(chǎng)[N];經(jīng)濟(jì)日?qǐng)?bào);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 王琦森;基于社群發(fā)現(xiàn)的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2016年
本文關(guān)鍵詞:基于社群發(fā)現(xiàn)的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):267108
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/267108.html