面向文獻數(shù)據(jù)的網(wǎng)絡(luò)表示學(xué)習(xí)方法研究
發(fā)布時間:2020-12-20 14:10
文獻信息的獲取是開展科研工作的重要環(huán)節(jié),如何高效地從海量的文獻數(shù)據(jù)中挖掘出有用信息,是科研工作者需要解決的共性問題。文獻數(shù)據(jù)可建模為網(wǎng)絡(luò)形式進行分析,復(fù)雜而龐大的文獻網(wǎng)絡(luò)增加了計算機處理難度。如何將文獻網(wǎng)絡(luò)表示成合理的形式,并高效地運用于作者分類、文章相似性搜索和合著關(guān)系預(yù)測等文獻網(wǎng)絡(luò)應(yīng)用任務(wù),對解決現(xiàn)實應(yīng)用問題具有重要意義。為克服傳統(tǒng)網(wǎng)絡(luò)表示方法計算復(fù)雜度高、難以有效融合網(wǎng)絡(luò)異質(zhì)信息等問題,研究學(xué)者提出網(wǎng)絡(luò)表示學(xué)習(xí)(Network Representation Learning),又稱網(wǎng)絡(luò)嵌入(Network Embedding),旨在將網(wǎng)絡(luò)中的節(jié)點表示成低維稠密的向量,以將其作為機器學(xué)習(xí)模型的輸入運用于后續(xù)的網(wǎng)絡(luò)應(yīng)用任務(wù)之中。隨著科學(xué)技術(shù)的飛速發(fā)展,文獻數(shù)據(jù)呈指數(shù)型增長,現(xiàn)有網(wǎng)絡(luò)表示學(xué)習(xí)方法在處理文獻數(shù)據(jù)時主要存在以下挑戰(zhàn):1)文獻數(shù)據(jù)包含作者、論文、會議等多種實體,實體間的復(fù)雜交互包含了豐富的語義信息。現(xiàn)有異質(zhì)網(wǎng)絡(luò)表示學(xué)習(xí)方法在處理由文獻數(shù)據(jù)構(gòu)成的文獻信息網(wǎng)絡(luò)時,難以有效結(jié)合用戶導(dǎo)向?qū)W(wǎng)絡(luò)語義信息進行保留;2)文獻數(shù)據(jù)隨時間不斷變化,其構(gòu)成的文獻信息網(wǎng)絡(luò)呈現(xiàn)出明顯的動態(tài)特性,而現(xiàn)...
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
參數(shù)敏感性分析
第 36 頁(a) Deepwalk (b)STWalk (c)HTNE (d)MHDNE圖 3.2 DBLP 數(shù)據(jù)集的可視化實驗中,使用不同顏色的點來表示不同研究領(lǐng)域的作者的二維可視化結(jié)果:橙色的點
(c)Metapath2vec++算法 (d)DHNE 算法圖 4.4 四個研究領(lǐng)域的作者可視化結(jié)果4 參數(shù)敏感性分析本節(jié)對時間步長 的參數(shù)敏感性進行分析。時間步長決定了在構(gòu)造網(wǎng)絡(luò)增廣圖時的歷史信息。時間步長值越大,網(wǎng)絡(luò)增廣圖中包含的歷史信息越多。本節(jié)通過改
【參考文獻】:
期刊論文
[1]大規(guī)模復(fù)雜信息網(wǎng)絡(luò)表示學(xué)習(xí):概念、方法與挑戰(zhàn)[J]. 齊金山,梁循,李志宇,陳燕方,許媛. 計算機學(xué)報. 2018(10)
[2]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學(xué):信息科學(xué). 2017(08)
[3]基于復(fù)雜網(wǎng)絡(luò)理論的大型電力系統(tǒng)脆弱線路辨識[J]. 曹一家,陳曉剛,孫可. 電力自動化設(shè)備. 2006(12)
[4]復(fù)雜網(wǎng)絡(luò)理論與城市交通系統(tǒng)復(fù)雜性問題的相關(guān)研究[J]. 高自友,趙小梅,黃海軍,毛保華. 交通運輸系統(tǒng)工程與信息. 2006(03)
本文編號:2928004
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
參數(shù)敏感性分析
第 36 頁(a) Deepwalk (b)STWalk (c)HTNE (d)MHDNE圖 3.2 DBLP 數(shù)據(jù)集的可視化實驗中,使用不同顏色的點來表示不同研究領(lǐng)域的作者的二維可視化結(jié)果:橙色的點
(c)Metapath2vec++算法 (d)DHNE 算法圖 4.4 四個研究領(lǐng)域的作者可視化結(jié)果4 參數(shù)敏感性分析本節(jié)對時間步長 的參數(shù)敏感性進行分析。時間步長決定了在構(gòu)造網(wǎng)絡(luò)增廣圖時的歷史信息。時間步長值越大,網(wǎng)絡(luò)增廣圖中包含的歷史信息越多。本節(jié)通過改
【參考文獻】:
期刊論文
[1]大規(guī)模復(fù)雜信息網(wǎng)絡(luò)表示學(xué)習(xí):概念、方法與挑戰(zhàn)[J]. 齊金山,梁循,李志宇,陳燕方,許媛. 計算機學(xué)報. 2018(10)
[2]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學(xué):信息科學(xué). 2017(08)
[3]基于復(fù)雜網(wǎng)絡(luò)理論的大型電力系統(tǒng)脆弱線路辨識[J]. 曹一家,陳曉剛,孫可. 電力自動化設(shè)備. 2006(12)
[4]復(fù)雜網(wǎng)絡(luò)理論與城市交通系統(tǒng)復(fù)雜性問題的相關(guān)研究[J]. 高自友,趙小梅,黃海軍,毛保華. 交通運輸系統(tǒng)工程與信息. 2006(03)
本文編號:2928004
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2928004.html
最近更新
教材專著