采用Node2Vec模型對網(wǎng)絡(luò)特征表示方法研究
發(fā)布時間:2022-07-16 17:46
通過復(fù)雜網(wǎng)絡(luò)對現(xiàn)實生活中復(fù)雜系統(tǒng)的抽象,將繁復(fù)多樣的專業(yè)問題歸納為網(wǎng)絡(luò)中點與點,邊與邊之間關(guān)系的研究已經(jīng)成為了適用于廣泛領(lǐng)域研究中的一種十分成熟的做法。隨著近年來對復(fù)雜網(wǎng)絡(luò)的研討與鉆研不斷深入,近年來以自然語言處理領(lǐng)域中涌現(xiàn)的Word2vec模型為代表的研究方法與復(fù)雜網(wǎng)絡(luò)產(chǎn)生了巧妙的結(jié)合,該方法通過對網(wǎng)絡(luò)數(shù)據(jù)的處理與簡化,結(jié)合神經(jīng)網(wǎng)絡(luò)模型與深度學(xué)習(xí)背景方法,采用低維空間向量的形式將網(wǎng)絡(luò)節(jié)點重新表示,使得空間向量在保留網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系的同時又將網(wǎng)絡(luò)節(jié)點位置關(guān)系進行有效表達,對網(wǎng)絡(luò)中的弱鏈接具有良好的體現(xiàn),保留了網(wǎng)絡(luò)中邊緣節(jié)點的長尾效應(yīng)的體現(xiàn),在面對海量大數(shù)據(jù)的復(fù)雜網(wǎng)絡(luò)時具有高效、快速、普適的特征,同時該研究方法也被廣泛應(yīng)用于網(wǎng)絡(luò)節(jié)點聚類、鏈路預(yù)測、可視化等研究領(lǐng)域中,并且取得了優(yōu)異的成果。如今,以Node2Vec為代表的特征表示方法在生物學(xué)、社會學(xué)、經(jīng)濟學(xué)等方面都有著廣泛的應(yīng)用,它使我們對復(fù)雜網(wǎng)絡(luò)背后的結(jié)構(gòu)與規(guī)律的挖掘有了新的視角,使我們更容易發(fā)現(xiàn)傳統(tǒng)研究方法中難以發(fā)現(xiàn)的盲點,從而更好的根據(jù)特征表示結(jié)果來揭示事實產(chǎn)生的背景與原理。在此基礎(chǔ)上,筆者采用傳統(tǒng)文獻計量中合著網(wǎng)絡(luò)這一復(fù)雜網(wǎng)絡(luò)進行實證...
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究的目的和意義
1.2 課題的國內(nèi)外研究現(xiàn)狀
1.3 可行性分析
1.3.1 研究基礎(chǔ)
1.3.2 已具備的條件
1.4 論文擬采用的技術(shù)路線
1.5 論文擬進行的主要工作和預(yù)期成果
1.5.1 工作安排
1.5.2 預(yù)期成果
1.6 論文組織結(jié)構(gòu)
第二章 研究設(shè)計與研究方法
2.1 復(fù)雜網(wǎng)絡(luò)及其特征
2.2 信息網(wǎng)絡(luò)模型與元路徑
2.3 信息網(wǎng)絡(luò)表示學(xué)習(xí)
2.3.1 概念
2.3.2 分類
2.4 相關(guān)模型簡介
2.4.1 詞的表示
2.4.2 語言模型
2.4.3 Word2Vec與Skip-Gram模型
2.4.4 DeepWalk算法
2.4.5 Node2Vec模型
2.5 模型化
2.6 建立圖
第三章 研究過程與數(shù)據(jù)分析
3.1 數(shù)據(jù)采集方案
3.2 數(shù)據(jù)預(yù)處理
3.3 算法設(shè)計
3.3.1 工具概述
3.3.2 圖識別
3.3.3 表示訓(xùn)練
3.4 降維計算
3.4.1 定義
3.4.2 分類
3.4.3 主成分分析算法(PCA)
3.4.4 主成分分析算法實現(xiàn)
3.5 數(shù)據(jù)分析
第四章 實驗結(jié)果分析
4.1 合著網(wǎng)絡(luò)相似度分析
4.1.1 向量相似度
4.1.2 作者相似度分析
4.1.3 基于相似度的鄰居結(jié)構(gòu)分析
4.2 合著網(wǎng)絡(luò)聚類分析
4.2.1 聚類分析定義
4.2.2 聚類分析分類
4.2.3 聚類分析效果評價
4.2.4 K均值算法
4.2.5 作者聚類分析
4.2.6 出版物聚類分析
4.2.7 論文聚類分析
4.2.8 聚類分析總結(jié)
4.3 合著網(wǎng)絡(luò)鏈接預(yù)測
4.3.1 鏈接預(yù)測的定義
4.3.2 鏈接預(yù)測方法
4.3.3 鏈接預(yù)測方法評價
4.3.4 作者合著預(yù)測
4.3.5 作者與出版物合作預(yù)測
第五章 總結(jié)與展望
5.1 主要結(jié)論
5.2 研究不足討論與改進探討
5.3 后續(xù)研究展望
5.4 總結(jié)
參考文獻
致謝
附錄
【參考文獻】:
期刊論文
[1]基于node2vec的社交網(wǎng)絡(luò)用戶屬性補全攻擊[J]. 裴楊,瞿學(xué)鑫,郭曉博,段丁陽. 信息網(wǎng)絡(luò)安全. 2017(12)
[2]基于加權(quán)word2vec的微博情感分析[J]. 李銳,張謙,劉嘉勇. 通信技術(shù). 2017(03)
[3]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計算機科學(xué). 2016(06)
[4]社交網(wǎng)絡(luò)鏈路預(yù)測研究綜述[J]. 楊星,魯天琦,陳美靈,劉超,張樹華. 信息與電腦(理論版). 2015(21)
[5]社會網(wǎng)絡(luò)中的鏈接預(yù)測任務(wù)[J]. 劉峰,劉秉權(quán),王曉龍. 智能計算機與應(yīng)用. 2015(05)
[6]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報開發(fā)與經(jīng)濟. 2015(02)
[7]國外社會網(wǎng)絡(luò)分析在文獻計量領(lǐng)域的應(yīng)用研究[J]. 滕廣青,牟冬梅,任晶. 情報資料工作. 2014(01)
[8]微博用戶的相似性度量及其應(yīng)用[J]. 徐志明,李棟,劉挺,李生,王剛,袁樹侖. 計算機學(xué)報. 2014(01)
[9]基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J]. 竇炳琳,李澍淞,張世永. 計算機學(xué)報. 2012(04)
[10]一種基于稀疏嵌入分析的降維方法[J]. 閆德勤,劉勝藍,李燕燕. 自動化學(xué)報. 2011(11)
博士論文
[1]帶權(quán)信息網(wǎng)絡(luò)之計量測度研究[D]. 趙星.浙江大學(xué) 2014
碩士論文
[1]基于鏈路預(yù)測的社交網(wǎng)絡(luò)推薦系統(tǒng)研究[D]. 楊星.杭州電子科技大學(xué) 2016
[2]復(fù)雜網(wǎng)絡(luò)中基于相似性的鏈接預(yù)測算法研究[D]. 王小平.蘭州大學(xué) 2015
[3]社會網(wǎng)絡(luò)的鏈接預(yù)測[D]. 殷涵.吉林大學(xué) 2012
[4]中文分詞算法的研究與實現(xiàn)[D]. 朱世猛.電子科技大學(xué) 2011
[5]中文文本分類技術(shù)研究[D]. 李保秀.南昌大學(xué) 2010
本文編號:3662977
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究的目的和意義
1.2 課題的國內(nèi)外研究現(xiàn)狀
1.3 可行性分析
1.3.1 研究基礎(chǔ)
1.3.2 已具備的條件
1.4 論文擬采用的技術(shù)路線
1.5 論文擬進行的主要工作和預(yù)期成果
1.5.1 工作安排
1.5.2 預(yù)期成果
1.6 論文組織結(jié)構(gòu)
第二章 研究設(shè)計與研究方法
2.1 復(fù)雜網(wǎng)絡(luò)及其特征
2.2 信息網(wǎng)絡(luò)模型與元路徑
2.3 信息網(wǎng)絡(luò)表示學(xué)習(xí)
2.3.1 概念
2.3.2 分類
2.4 相關(guān)模型簡介
2.4.1 詞的表示
2.4.2 語言模型
2.4.3 Word2Vec與Skip-Gram模型
2.4.4 DeepWalk算法
2.4.5 Node2Vec模型
2.5 模型化
2.6 建立圖
第三章 研究過程與數(shù)據(jù)分析
3.1 數(shù)據(jù)采集方案
3.2 數(shù)據(jù)預(yù)處理
3.3 算法設(shè)計
3.3.1 工具概述
3.3.2 圖識別
3.3.3 表示訓(xùn)練
3.4 降維計算
3.4.1 定義
3.4.2 分類
3.4.3 主成分分析算法(PCA)
3.4.4 主成分分析算法實現(xiàn)
3.5 數(shù)據(jù)分析
第四章 實驗結(jié)果分析
4.1 合著網(wǎng)絡(luò)相似度分析
4.1.1 向量相似度
4.1.2 作者相似度分析
4.1.3 基于相似度的鄰居結(jié)構(gòu)分析
4.2 合著網(wǎng)絡(luò)聚類分析
4.2.1 聚類分析定義
4.2.2 聚類分析分類
4.2.3 聚類分析效果評價
4.2.4 K均值算法
4.2.5 作者聚類分析
4.2.6 出版物聚類分析
4.2.7 論文聚類分析
4.2.8 聚類分析總結(jié)
4.3 合著網(wǎng)絡(luò)鏈接預(yù)測
4.3.1 鏈接預(yù)測的定義
4.3.2 鏈接預(yù)測方法
4.3.3 鏈接預(yù)測方法評價
4.3.4 作者合著預(yù)測
4.3.5 作者與出版物合作預(yù)測
第五章 總結(jié)與展望
5.1 主要結(jié)論
5.2 研究不足討論與改進探討
5.3 后續(xù)研究展望
5.4 總結(jié)
參考文獻
致謝
附錄
【參考文獻】:
期刊論文
[1]基于node2vec的社交網(wǎng)絡(luò)用戶屬性補全攻擊[J]. 裴楊,瞿學(xué)鑫,郭曉博,段丁陽. 信息網(wǎng)絡(luò)安全. 2017(12)
[2]基于加權(quán)word2vec的微博情感分析[J]. 李銳,張謙,劉嘉勇. 通信技術(shù). 2017(03)
[3]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計算機科學(xué). 2016(06)
[4]社交網(wǎng)絡(luò)鏈路預(yù)測研究綜述[J]. 楊星,魯天琦,陳美靈,劉超,張樹華. 信息與電腦(理論版). 2015(21)
[5]社會網(wǎng)絡(luò)中的鏈接預(yù)測任務(wù)[J]. 劉峰,劉秉權(quán),王曉龍. 智能計算機與應(yīng)用. 2015(05)
[6]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報開發(fā)與經(jīng)濟. 2015(02)
[7]國外社會網(wǎng)絡(luò)分析在文獻計量領(lǐng)域的應(yīng)用研究[J]. 滕廣青,牟冬梅,任晶. 情報資料工作. 2014(01)
[8]微博用戶的相似性度量及其應(yīng)用[J]. 徐志明,李棟,劉挺,李生,王剛,袁樹侖. 計算機學(xué)報. 2014(01)
[9]基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J]. 竇炳琳,李澍淞,張世永. 計算機學(xué)報. 2012(04)
[10]一種基于稀疏嵌入分析的降維方法[J]. 閆德勤,劉勝藍,李燕燕. 自動化學(xué)報. 2011(11)
博士論文
[1]帶權(quán)信息網(wǎng)絡(luò)之計量測度研究[D]. 趙星.浙江大學(xué) 2014
碩士論文
[1]基于鏈路預(yù)測的社交網(wǎng)絡(luò)推薦系統(tǒng)研究[D]. 楊星.杭州電子科技大學(xué) 2016
[2]復(fù)雜網(wǎng)絡(luò)中基于相似性的鏈接預(yù)測算法研究[D]. 王小平.蘭州大學(xué) 2015
[3]社會網(wǎng)絡(luò)的鏈接預(yù)測[D]. 殷涵.吉林大學(xué) 2012
[4]中文分詞算法的研究與實現(xiàn)[D]. 朱世猛.電子科技大學(xué) 2011
[5]中文文本分類技術(shù)研究[D]. 李保秀.南昌大學(xué) 2010
本文編號:3662977
本文鏈接:http://sikaile.net/tushudanganlunwen/3662977.html