基于表示學習的學術影響力預測算法研究
發(fā)布時間:2020-03-22 02:11
【摘要】:學術影響力預測是學術數(shù)據(jù)應用的重要研究內(nèi)容,其中,論文影響力的預測可以幫助研究人員找到有價值的論文,以便了解最新的研究方向。作者影響力預測可以為決策人員在基金資助,資源分配等方面提供參考,F(xiàn)有最先進的學術影響力預測方法是基于圖的方法,但大部分基于圖的方法著重于評估論文和作者的當前影響力,這對新發(fā)表的文章和年輕研究人員不公平。另一個局限是它們主要依賴于學術網(wǎng)絡的全局結構特征,不能充分利用網(wǎng)絡的局部結構信息以及文本和時間等信息,這制約了影響力預測的準確性。針對以上問題,本文提出一種基于表示學習的學術影響力預測算法。論文主要包括以下內(nèi)容:構建包含論文、作者、主題、詞等類型節(jié)點以及節(jié)點之間多種關系的異構學術網(wǎng)絡,并依據(jù)與論文及作者影響力相關的特征設置邊的權重。通過主題和詞來保留論文之間的內(nèi)容相關性,充分挖掘缺少引用的新論文的潛在影響力。針對異構學術網(wǎng)絡設計一種表示學習模型,構造合適的目標函數(shù),將異構學術網(wǎng)絡映射到一個低維向量空間中,學習不同類型節(jié)點的向量表示,通過表示學習過程更有效地保留網(wǎng)絡的局部結構信息、論文的文本信息。利用節(jié)點間的向量相似度構造出與論文引用網(wǎng)絡、論文-作者網(wǎng)絡以及作者合作網(wǎng)絡對應的鄰接矩陣,然后利用一個基于圖的多變量隨機游走排序模型,基于論文與作者之間的互增強關系,在同一個模型中實現(xiàn)對論文和作者的未來影響力預測排序。在AMiner數(shù)據(jù)集和AAN數(shù)據(jù)集上的實驗結果表明,提出的模型在Normalized Discounted Cumulative Gain(NDCG)及Recommendation Intensity(RI)兩個評估指標上明顯優(yōu)于其他5種對比方法。
【圖文】:
圖 1-1 文獻數(shù)量隨時間的變化趨勢圖示,發(fā)表于 2010 年的文獻數(shù)量是發(fā)表于 2000 年的文獻數(shù)量的術信息收集了數(shù)百萬論文,作者,引文,,數(shù)字,圖表,以及大大的學術信息知識庫,學術大數(shù)據(jù)的產(chǎn)生為科研人員的研究工及實驗依據(jù),但是也為信息提取、數(shù)據(jù)分析、影響力預測等工挖掘、探索學術數(shù)據(jù)的知識,可以為各方面利益相關者帶來極
息網(wǎng)絡是指將信息或者數(shù)據(jù)通過某種方式鏈接起來而組成的網(wǎng)絡[47],它可述如下:義 2.1 信息網(wǎng)絡[48]可以表示為一個有向圖 G = (ν , ε),它帶有對象類型映 Α 以及鏈接類型映射函數(shù) φ : ε → R,任意對象ν∈ν 都屬于一個特定的對A,任意鏈接e ∈ ε都屬于一個特定的關系 φ (ε ) ∈ R。屬于相同關系類型的始對象和結束對象類型相同。果信息網(wǎng)絡中對象類型的數(shù)量 A > 1或者鏈接類型的數(shù)量 R > 1,則該為異構信息網(wǎng)絡,也可簡稱為異構網(wǎng)絡。學術數(shù)據(jù)衍生出來的學術網(wǎng)絡即為典型的異構網(wǎng)絡,論文、作者等不同類之間的關系構成了復雜的異構學術網(wǎng)絡。圖 2-1 所示的學術網(wǎng)絡為一個異它包含論文、作者、機構和期刊/會議等四種對象類型,以及論文到論文作者到機構和論文到期刊/會議等四種類型的鏈接關系。
【學位授予單位】:中國民航大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP18
本文編號:2594302
【圖文】:
圖 1-1 文獻數(shù)量隨時間的變化趨勢圖示,發(fā)表于 2010 年的文獻數(shù)量是發(fā)表于 2000 年的文獻數(shù)量的術信息收集了數(shù)百萬論文,作者,引文,,數(shù)字,圖表,以及大大的學術信息知識庫,學術大數(shù)據(jù)的產(chǎn)生為科研人員的研究工及實驗依據(jù),但是也為信息提取、數(shù)據(jù)分析、影響力預測等工挖掘、探索學術數(shù)據(jù)的知識,可以為各方面利益相關者帶來極
息網(wǎng)絡是指將信息或者數(shù)據(jù)通過某種方式鏈接起來而組成的網(wǎng)絡[47],它可述如下:義 2.1 信息網(wǎng)絡[48]可以表示為一個有向圖 G = (ν , ε),它帶有對象類型映 Α 以及鏈接類型映射函數(shù) φ : ε → R,任意對象ν∈ν 都屬于一個特定的對A,任意鏈接e ∈ ε都屬于一個特定的關系 φ (ε ) ∈ R。屬于相同關系類型的始對象和結束對象類型相同。果信息網(wǎng)絡中對象類型的數(shù)量 A > 1或者鏈接類型的數(shù)量 R > 1,則該為異構信息網(wǎng)絡,也可簡稱為異構網(wǎng)絡。學術數(shù)據(jù)衍生出來的學術網(wǎng)絡即為典型的異構網(wǎng)絡,論文、作者等不同類之間的關系構成了復雜的異構學術網(wǎng)絡。圖 2-1 所示的學術網(wǎng)絡為一個異它包含論文、作者、機構和期刊/會議等四種對象類型,以及論文到論文作者到機構和論文到期刊/會議等四種類型的鏈接關系。
【學位授予單位】:中國民航大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP18
【相似文獻】
相關碩士學位論文 前1條
1 韓佳寧;基于表示學習的學術影響力預測算法研究[D];中國民航大學;2019年
本文編號:2594302
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2594302.html
最近更新
教材專著