基于PageRank和Node2vec的研究熱點與集群發(fā)現(xiàn)——以國際深度學(xué)習(xí)研究領(lǐng)域為例
發(fā)布時間:2022-07-20 14:51
[目的/意義]為有效挖掘領(lǐng)域研究熱點與集群,規(guī)避單純基于頻次統(tǒng)計的熱點排序方法所存在的弊端,以及基于高頻關(guān)鍵詞共詞網(wǎng)絡(luò)集群發(fā)現(xiàn)方法所帶來的偏差。[方法/過程]提出利用無向加權(quán)PagaRank算法進行研究熱點排序,綜合考量關(guān)鍵詞之間共現(xiàn)的數(shù)量和質(zhì)量,同時強調(diào)全部關(guān)鍵詞共詞網(wǎng)絡(luò)的重要性,綜合Node2vec表示學(xué)習(xí)和t-SNE聚類算法對全部關(guān)鍵詞進行集群發(fā)現(xiàn),以國際深度學(xué)習(xí)領(lǐng)域研究文獻(xiàn)為例,分別進行熱點排序和集群發(fā)現(xiàn)。[結(jié)果/結(jié)論]研究表明PageRank算法不僅能夠區(qū)分頻次統(tǒng)計算法無法區(qū)分的排名,而且從整體網(wǎng)絡(luò)結(jié)構(gòu)衡量研究熱點,綜合考量共現(xiàn)的數(shù)量和質(zhì)量,使排序結(jié)果更為準(zhǔn)確;整合Node2vec和t-SNE算法進行研究集群發(fā)現(xiàn),可有效改善單純利用高頻關(guān)鍵詞進行集群發(fā)現(xiàn)的不足,避免在有限的關(guān)聯(lián)密切的高頻關(guān)鍵詞之間強制分門別類;綜合熱點和集群發(fā)現(xiàn)方法,可在凸顯熱點的基礎(chǔ)上描述集群細(xì)節(jié),有效揭示集群脈絡(luò)。
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 研究方法
1.1 PageRank算法
1.2 Node2vec算法
1.3 T-SNE降維聚類算法
2 數(shù)據(jù)采集與處理
3 研究熱點發(fā)現(xiàn)
3.1 PageRank結(jié)果與頻次統(tǒng)計結(jié)果一致性檢驗
3.2 PageRank結(jié)果與頻次統(tǒng)計結(jié)果差異性分析
4 研究集群發(fā)現(xiàn)
4.1 基于全部關(guān)鍵詞共詞網(wǎng)絡(luò)的集群聚類
4.2 熱點集群展示
5 結(jié) 語
【參考文獻(xiàn)】:
期刊論文
[1]基于PageRank的論文引用網(wǎng)絡(luò)關(guān)系挖掘[J]. 金潔,徐岳皓,劉振宇. 中國電子科學(xué)研究院學(xué)報. 2019(09)
[2]基于改進PageRank算法的作者影響力評價研究[J]. 臧思思,李秀霞,孔月. 情報理論與實踐. 2019(11)
[3]基于PageRank的熱點發(fā)現(xiàn)混合算法研究[J]. 應(yīng)毅,黃慧,劉定一. 計算機技術(shù)與發(fā)展. 2019(09)
[4]基于t-SNE降維的科學(xué)基金資助項目可視化方法研究[J]. 陳挺,李國鵬,王小梅. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(08)
[5]混合關(guān)鍵詞選擇策略對共詞分析效果的影響研究[J]. 李綱,李昱瑤,謝子霖,巴志超. 情報理論與實踐. 2017(11)
[6]共詞分析過程中的若干問題研究[J]. 李綱,巴志超. 中國圖書館學(xué)報. 2017(04)
[7]國內(nèi)知識網(wǎng)絡(luò)發(fā)展述評及演化分析[J]. 邱均平,劉寧. 圖書館學(xué)研究. 2016(10)
[8]國際信息可視化知識族群:演化、聚類及遷徙研究[J]. 張敏,霍朝光,霍帆帆,吳郁松. 情報科學(xué). 2016(04)
[9]科技論文關(guān)鍵詞特征及其對共詞分析的影響[J]. 胡昌平,陳果. 情報學(xué)報. 2014 (01)
[10]基于詞頻g指數(shù)的共詞聚類關(guān)鍵詞選取研究——以教育技術(shù)學(xué)碩士學(xué)位論文為例[J]. 張松,劉成新,萇雨. 現(xiàn)代教育技術(shù). 2013(10)
本文編號:3664196
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 研究方法
1.1 PageRank算法
1.2 Node2vec算法
1.3 T-SNE降維聚類算法
2 數(shù)據(jù)采集與處理
3 研究熱點發(fā)現(xiàn)
3.1 PageRank結(jié)果與頻次統(tǒng)計結(jié)果一致性檢驗
3.2 PageRank結(jié)果與頻次統(tǒng)計結(jié)果差異性分析
4 研究集群發(fā)現(xiàn)
4.1 基于全部關(guān)鍵詞共詞網(wǎng)絡(luò)的集群聚類
4.2 熱點集群展示
5 結(jié) 語
【參考文獻(xiàn)】:
期刊論文
[1]基于PageRank的論文引用網(wǎng)絡(luò)關(guān)系挖掘[J]. 金潔,徐岳皓,劉振宇. 中國電子科學(xué)研究院學(xué)報. 2019(09)
[2]基于改進PageRank算法的作者影響力評價研究[J]. 臧思思,李秀霞,孔月. 情報理論與實踐. 2019(11)
[3]基于PageRank的熱點發(fā)現(xiàn)混合算法研究[J]. 應(yīng)毅,黃慧,劉定一. 計算機技術(shù)與發(fā)展. 2019(09)
[4]基于t-SNE降維的科學(xué)基金資助項目可視化方法研究[J]. 陳挺,李國鵬,王小梅. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(08)
[5]混合關(guān)鍵詞選擇策略對共詞分析效果的影響研究[J]. 李綱,李昱瑤,謝子霖,巴志超. 情報理論與實踐. 2017(11)
[6]共詞分析過程中的若干問題研究[J]. 李綱,巴志超. 中國圖書館學(xué)報. 2017(04)
[7]國內(nèi)知識網(wǎng)絡(luò)發(fā)展述評及演化分析[J]. 邱均平,劉寧. 圖書館學(xué)研究. 2016(10)
[8]國際信息可視化知識族群:演化、聚類及遷徙研究[J]. 張敏,霍朝光,霍帆帆,吳郁松. 情報科學(xué). 2016(04)
[9]科技論文關(guān)鍵詞特征及其對共詞分析的影響[J]. 胡昌平,陳果. 情報學(xué)報. 2014 (01)
[10]基于詞頻g指數(shù)的共詞聚類關(guān)鍵詞選取研究——以教育技術(shù)學(xué)碩士學(xué)位論文為例[J]. 張松,劉成新,萇雨. 現(xiàn)代教育技術(shù). 2013(10)
本文編號:3664196
本文鏈接:http://sikaile.net/tushudanganlunwen/3664196.html