基于PageRank的新聞關(guān)鍵詞提取算法
[Abstract]:The existing keyword extraction algorithms based on complex networks do not take into account the natural language characteristics of text in constructing weighted text networks and seldom involve classical algorithms in complex network domain. In this paper, the word frequency sharing weight is introduced, and the word frequency property is used to weight the connected edges between nodes. On this basis, based on the Page Rank algorithm and the definition of position weight coefficient based on the human language habits, a new news keyword extraction algorithm, LTWPR algorithm, is proposed, which considers the local and global features of the text network. A large number of experiments are carried out with Sina News corpus. The results show that the algorithm can cover the keywords labeled by news authors quickly and effectively, and the extraction effect is better.
【作者單位】: 南京郵電大學(xué)自動(dòng)化學(xué)院;
【基金】:教育部人文社會(huì)科學(xué)研究規(guī)劃基金(15YJZH016)
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李村合;呂克強(qiáng);;一種改進(jìn)PageRank的新方法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年03期
2 LIU Gui-mei;;An adaptive improvement on PageRank algorithm[J];Applied Mathematics:A Journal of Chinese Universities(Series B);2013年01期
3 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期
4 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
5 姜鑫維;趙岳松;;Topic PageRank——一種基于主題的搜索引擎[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年05期
6 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[J];中文信息學(xué)報(bào);2007年05期
7 田甜;倪林;;基于PageRank算法的權(quán)威值不均衡分配問題[J];計(jì)算機(jī)工程;2007年18期
8 潘昊;譚龍遠(yuǎn);;領(lǐng)域相關(guān)自適應(yīng)的PageRank算法搜索策略[J];計(jì)算機(jī)應(yīng)用;2008年09期
9 黃嬋;劉發(fā)升;;PageRank外推插值法[J];計(jì)算機(jī)時(shí)代;2009年01期
10 林泓;劉朋;李晶晶;龍振海;;基于概率的PageRank改進(jìn)算法[J];武漢理工大學(xué)學(xué)報(bào);2009年03期
相關(guān)會(huì)議論文 前6條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國(guó)控制與決策會(huì)議論文集(3)[C];2009年
2 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 藺繼國(guó);徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個(gè)性化PageRank算法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
4 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁(yè)排序研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
5 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評(píng)分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
6 劉建毅;王菁華;王樅;;基于語(yǔ)言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)碩士學(xué)位論文 前10條
1 李金圻;基于Hadoop的微博輿情分析[D];北京郵電大學(xué);2015年
2 孫樂天;基于PageRank和對(duì)象關(guān)系的聚類算法研究[D];蘭州大學(xué);2016年
3 劉卓然;基于改進(jìn)PageRank算法的輿情引導(dǎo)技術(shù)研究[D];昆明理工大學(xué);2016年
4 王文文;深度重啟的Arnoldi加速的PageRank方法[D];上海大學(xué);2016年
5 孟德鑫;基于MapReduce計(jì)算模型的PageRank算法的優(yōu)化與實(shí)現(xiàn)[D];南京郵電大學(xué);2016年
6 吳恒超;基于PageRank算法的二分網(wǎng)絡(luò)社區(qū)劃分[D];沈陽(yáng)航空航天大學(xué);2016年
7 鄭普亨;基于PageRank算法的Web數(shù)據(jù)挖掘的研究[D];天津理工大學(xué);2017年
8 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年
9 姜sバ,
本文編號(hào):2417712
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2417712.html