天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于引文網(wǎng)絡(luò)圖模型的論文推薦系統(tǒng)研究與應(yīng)用

發(fā)布時(shí)間:2020-11-06 06:14
   由于當(dāng)前科研的不斷發(fā)展,大量論文的出現(xiàn)使得科研工作者在進(jìn)行論文研讀時(shí)會(huì)產(chǎn)生一定的困擾,論文推薦系統(tǒng)可以很好的解決此類問(wèn)題。因此本文提出了基于三層引文網(wǎng)絡(luò)的圖模型以及相應(yīng)推薦算法。在三層引文網(wǎng)絡(luò)圖模型中結(jié)合了論文內(nèi)容特征信息、論文引用關(guān)系、作者的合著關(guān)系以及論文的研究領(lǐng)域信息多種論文特征。本文主要研究工作如下:(1)對(duì)論文推薦系統(tǒng)以及相應(yīng)算法進(jìn)行一定的研究,了解相關(guān)領(lǐng)域的研究現(xiàn)狀并進(jìn)行綜述?偨Y(jié)論文推薦系統(tǒng)以及引文網(wǎng)絡(luò)中的理論信息,為后續(xù)的模型構(gòu)建、算法應(yīng)用以及推薦系統(tǒng)的實(shí)現(xiàn)做好理論基礎(chǔ)。(2)構(gòu)建了三層引文網(wǎng)絡(luò)圖模型。目前,大多數(shù)引文網(wǎng)絡(luò)模型僅采用單一特征模型且未涉及到論文的研究領(lǐng)域信息。因此,本文將論文引用關(guān)系、論文內(nèi)容特征信息、作者合著關(guān)系以及論文研究領(lǐng)域信息融入到該模型中。利用AMiner上的DBLP-Citation-network數(shù)據(jù)集,首先提取數(shù)據(jù)集中論文、作者以及研究領(lǐng)域信息;其次根據(jù)論文之間的引用關(guān)系建立論文引用網(wǎng)絡(luò),根據(jù)作者之間的合著關(guān)系建立作者合著網(wǎng)絡(luò);最終根據(jù)三者的關(guān)聯(lián)關(guān)系建立三層引文網(wǎng)絡(luò)圖模型。生成的三層引文網(wǎng)絡(luò)圖模型將作為后續(xù)算法和推薦系統(tǒng)原型實(shí)現(xiàn)的數(shù)據(jù)模型基礎(chǔ)。(3)提出了基于三層引文網(wǎng)絡(luò)模型的論文推薦算法。將上述提出的三層引文網(wǎng)絡(luò)圖模型與重啟隨機(jī)游走算法相融合,形成本文的論文推薦算法(PAFRWR)。本文通過(guò)recall@N與NDCG@N的值作為評(píng)價(jià)指標(biāo)值,首先對(duì)比不同重啟概率下的評(píng)價(jià)指標(biāo)值,確定了PAFRWR的重啟概率參數(shù)=0.3。再通過(guò)對(duì)不同搜索向量的實(shí)驗(yàn)對(duì)比,確定當(dāng)搜索向量包含論文、作者和研究領(lǐng)域三重信息時(shí),評(píng)價(jià)指標(biāo)更高。最后,將PAFRWR算法與PageRank、LDA和Link-PLSA-LDA進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,PAFRWR算法的評(píng)價(jià)指標(biāo)值優(yōu)于其他三種方法。(4)設(shè)計(jì)并實(shí)現(xiàn)了基于三層引文網(wǎng)絡(luò)模型的論文推薦原型系統(tǒng)。結(jié)合本文提出的模型和算法,介紹系統(tǒng)整體框架以及主要模塊設(shè)計(jì),本系統(tǒng)采用Python語(yǔ)言進(jìn)行系統(tǒng)開發(fā),借助XmlRPC模型,將推薦模型轉(zhuǎn)化為RPC服務(wù),最終通過(guò)以上技術(shù)實(shí)現(xiàn)該系統(tǒng)。
【學(xué)位單位】:云南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2020
【中圖分類】:TP391.3
【部分圖文】:

網(wǎng)絡(luò)圖,會(huì)期,作者,物理學(xué)


第2章相關(guān)理論與技術(shù)13“小世界網(wǎng)絡(luò)”等。圖2.2美國(guó)物理學(xué)會(huì)期刊APS上作者發(fā)表論文的作者引用網(wǎng)絡(luò)[49]復(fù)雜網(wǎng)絡(luò)的度量標(biāo)準(zhǔn)主要根據(jù)圖論中的相關(guān)理論,下面將介紹復(fù)雜網(wǎng)絡(luò)中涉及到的部分內(nèi)容:圖中節(jié)點(diǎn)的度、常見的復(fù)雜網(wǎng)絡(luò)模型以及復(fù)雜網(wǎng)絡(luò)在現(xiàn)實(shí)生活中的應(yīng)用。1.復(fù)雜網(wǎng)絡(luò)的表示形式復(fù)雜網(wǎng)絡(luò)的數(shù)學(xué)框架是以圖論為基礎(chǔ)的,復(fù)雜網(wǎng)絡(luò)理論中的網(wǎng)絡(luò)就是圖,圖的頂點(diǎn)在復(fù)雜網(wǎng)絡(luò)理論中稱為節(jié)點(diǎn),圖的邊在復(fù)雜網(wǎng)絡(luò)中稱為連結(jié)。在復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)中,復(fù)雜網(wǎng)絡(luò)可以由節(jié)點(diǎn)與連結(jié)所組成的圖來(lái)表示[50]。通?梢圆捎脭(shù)組、鄰接矩陣、關(guān)聯(lián)矩陣、多重鏈表等方式來(lái)表示。若一個(gè)圖中節(jié)點(diǎn)與節(jié)點(diǎn)之間有邊連接,且邊沒有方向即無(wú)序?qū)?,)和(,)表示的是同一條邊,則該網(wǎng)絡(luò)圖就是無(wú)向網(wǎng)絡(luò)圖,否則該網(wǎng)絡(luò)圖為有向網(wǎng)絡(luò)圖。對(duì)于任意圖通常采用關(guān)聯(lián)矩陣來(lái)表示節(jié)點(diǎn)與邊之間的關(guān)系,用鄰接矩陣來(lái)表示節(jié)點(diǎn)之間的關(guān)系。設(shè)1,2,3,…,與1,2,3,…,分別來(lái)表示圖的頂點(diǎn)與邊,則()=[]為圖的關(guān)聯(lián)矩陣,其中是和相關(guān)聯(lián)的次數(shù)。()=[]為圖的鄰接矩陣,其中是與之間連接邊的個(gè)數(shù)[47]。在網(wǎng)絡(luò)圖中,根據(jù)節(jié)點(diǎn)之間是否存在連接關(guān)系,可以分為有權(quán)網(wǎng)絡(luò)和無(wú)權(quán)網(wǎng)絡(luò)。也可通過(guò)矩陣來(lái)表示兩節(jié)點(diǎn)之間存在的連接關(guān)系,如公式2.1,其中用來(lái)

過(guò)程圖,網(wǎng)絡(luò)模型,形式,過(guò)程


第2章相關(guān)理論與技術(shù)16如圖2.3,通過(guò)調(diào)節(jié)一個(gè)參數(shù)使得模型從規(guī)則網(wǎng)絡(luò)模型向隨機(jī)網(wǎng)絡(luò)模型進(jìn)行轉(zhuǎn)變。P=0時(shí)為規(guī)則網(wǎng)絡(luò);=1為隨機(jī)網(wǎng)絡(luò);在0<<1時(shí),該網(wǎng)絡(luò)就是小世界網(wǎng)絡(luò),其具有較短的平均路徑長(zhǎng)度且有較大的簇系數(shù)的特點(diǎn),存在一定的聚集性[52]。圖2.3三種網(wǎng)絡(luò)模型形式及轉(zhuǎn)變過(guò)程[51]WS小世界模型的構(gòu)造過(guò)程如下:首先根據(jù)規(guī)則性的特點(diǎn),從一個(gè)環(huán)狀的具有個(gè)節(jié)點(diǎn)的規(guī)則網(wǎng)絡(luò)開始,網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)與它最近鄰的m個(gè)節(jié)點(diǎn)相連接,其中m為偶數(shù)。再根據(jù)隨機(jī)性的特點(diǎn),以概率隨機(jī)地將網(wǎng)絡(luò)中的每條邊進(jìn)行重連,保證網(wǎng)絡(luò)中任意兩個(gè)不同節(jié)點(diǎn)之間至多只能有一條邊相連,且每個(gè)節(jié)點(diǎn)不能自連產(chǎn)生環(huán)。5.復(fù)雜網(wǎng)絡(luò)的應(yīng)用在現(xiàn)實(shí)生活中,網(wǎng)絡(luò)關(guān)系在不斷的生成擴(kuò)展中,例如互聯(lián)網(wǎng)絡(luò)、人際網(wǎng)絡(luò)、論文引用網(wǎng)絡(luò)、交通網(wǎng)絡(luò)等等。目前復(fù)雜網(wǎng)絡(luò)多用于網(wǎng)絡(luò)傳播分析,例如網(wǎng)絡(luò)病毒傳播、互聯(lián)網(wǎng)信息傳播等方。通過(guò)對(duì)復(fù)雜網(wǎng)絡(luò)模型的研究,改進(jìn)已有模型結(jié)構(gòu),解決已有問(wèn)題;并利用復(fù)雜網(wǎng)絡(luò)結(jié)合多個(gè)領(lǐng)域,例如信息技術(shù)領(lǐng)域、生物領(lǐng)域、工程技術(shù)領(lǐng)域等,實(shí)現(xiàn)各領(lǐng)域的交叉研究。在本文中,將復(fù)雜網(wǎng)絡(luò)應(yīng)用于個(gè)性化推薦場(chǎng)景中,利用論文引用網(wǎng)絡(luò)為用戶推薦其感興趣的論文結(jié)果。2.4基于引文網(wǎng)絡(luò)推薦的相關(guān)算法2.4.1基于引文網(wǎng)絡(luò)的推薦方法本小節(jié)將介紹基于引文網(wǎng)絡(luò)推薦的5種常用的模型方法。

網(wǎng)絡(luò)圖,數(shù)據(jù),例子,論文


第3章三層引文網(wǎng)絡(luò)圖模型構(gòu)建25機(jī)器解析來(lái)說(shuō)也更加容易。JSON包含兩種數(shù)據(jù)結(jié)構(gòu)類型:對(duì)象和數(shù)組。對(duì)象是中間部分由零個(gè)或多個(gè)無(wú)序的關(guān)鍵字(key)和值(value)構(gòu)成的,例如{"id":"013ea675-bb58-42f8-a423-f5534546b2b1","year":2017}表示一個(gè)對(duì)象。而數(shù)組是由了零個(gè)或多個(gè)值列表組成,例如{"authors":["LeonA.Sakkal","KyleZ.Rajkowski","RogerS.Armen"]}表示一個(gè)數(shù)組。相對(duì)于XML而言,JSON具有以下的優(yōu)點(diǎn):其一JSON的編碼難度相對(duì)簡(jiǎn)單,可以不借助其他工具進(jìn)行編碼,且JSON的解析難度也很低,更適合于數(shù)據(jù)交換處理;其二JSON數(shù)據(jù)體積較小,傳輸?shù)乃俣容^快。下面是DBLP-Citation-network數(shù)據(jù)集中一條JSON格式的論文數(shù)據(jù)舉例:圖3.1一條JSON數(shù)據(jù)例子這條數(shù)據(jù)是在JournalofComputationalChemistry上2017年發(fā)表的文章,其中id為論文id作為每條數(shù)據(jù)的唯一標(biāo)識(shí)符;authors為論文的共同作者;reference為該論文的參考文獻(xiàn),以論文id存儲(chǔ);n_citation為該論文的被引次數(shù);title為論文的標(biāo)題。3.2.3數(shù)據(jù)集預(yù)處理1.數(shù)據(jù)清洗
【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 陳海華;孟睿;陸偉;;學(xué)術(shù)文獻(xiàn)引文推薦研究進(jìn)展[J];圖書情報(bào)工作;2015年15期

2 吳海峰;孫一鳴;;引文網(wǎng)絡(luò)的研究現(xiàn)狀及其發(fā)展綜述[J];計(jì)算機(jī)應(yīng)用與軟件;2012年02期

3 李稚楹;楊武;謝治軍;;PageRank算法研究綜述[J];計(jì)算機(jī)科學(xué);2011年S1期

4 石杰;申德榮;聶鐵錚;寇月;于戈;;一種基于多因素的引文推薦方法[J];計(jì)算機(jī)研究與發(fā)展;2011年S3期

5 李冰;;圖論的起源和發(fā)展[J];大眾文藝;2010年09期

6 黨亞茹;引文網(wǎng)絡(luò)系統(tǒng)的結(jié)構(gòu)模型化[J];圖書情報(bào)工作;1996年04期


相關(guān)博士學(xué)位論文 前1條

1 孫見山;科研社交網(wǎng)絡(luò)中的論文推薦[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年


相關(guān)碩士學(xué)位論文 前10條

1 孟偉龍;基于圖模型的論文推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西北農(nóng)林科技大學(xué);2019年

2 趙桓幜;基于異構(gòu)信息網(wǎng)絡(luò)的引文推薦方法研究[D];安徽大學(xué);2019年

3 陳浩;基于協(xié)同過(guò)濾算法的論文推薦系統(tǒng)研究與設(shè)計(jì)[D];武漢科技大學(xué);2018年

4 李飛;基于文本向量表示學(xué)習(xí)的引文推薦方法研究[D];西北農(nóng)林科技大學(xué);2018年

5 陳志濤;基于深度學(xué)習(xí)的個(gè)性化引文搜索推薦算法研究[D];西北農(nóng)林科技大學(xué);2018年

6 陳金鵬;基于多興趣的學(xué)術(shù)論文推薦研究[D];內(nèi)蒙古大學(xué);2017年

7 王冬暉;基于內(nèi)容的計(jì)算機(jī)科學(xué)論文推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2017年

8 馬丙超;基于引文網(wǎng)絡(luò)的文獻(xiàn)在線推薦系統(tǒng)研究和實(shí)現(xiàn)[D];大連理工大學(xué);2016年

9 單曉菲;基于二部圖的推薦算法研究[D];南京航空航天大學(xué);2015年

10 倪衛(wèi)杰;基于用戶興趣模型的個(gè)性化論文推薦系統(tǒng)研究[D];天津大學(xué);2010年



本文編號(hào):2872761

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2872761.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0b317***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com