天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于復(fù)雜網(wǎng)絡(luò)的文本關(guān)鍵詞提取算法研究

發(fā)布時間:2018-05-04 13:42

  本文選題:復(fù)雜網(wǎng)絡(luò) + 關(guān)鍵詞提取; 參考:《計算機應(yīng)用研究》2016年02期


【摘要】:將復(fù)雜網(wǎng)絡(luò)理論應(yīng)用于文本挖掘技術(shù),構(gòu)造基于詞匯共現(xiàn)性關(guān)系的詞匯概念復(fù)雜網(wǎng)絡(luò),對文本詞匯的重要性指標(biāo)進行計算分析,挖掘文本中主題的關(guān)鍵詞。在計算詞匯重要性指標(biāo)時,綜合考慮目標(biāo)詞匯的頻率以及其相鄰節(jié)點的貢獻度。通過實驗對比,證實了該網(wǎng)絡(luò)節(jié)點評價指標(biāo)與基于加權(quán)度和加權(quán)集聚系數(shù)的綜合指標(biāo)相比具有優(yōu)越性。此外,通過復(fù)雜網(wǎng)絡(luò)社區(qū)合并的手段,發(fā)現(xiàn)了關(guān)鍵節(jié)點之間的網(wǎng)絡(luò)拓撲關(guān)系,即核心網(wǎng)絡(luò)。通過分析核心網(wǎng)絡(luò),可以獲得關(guān)鍵詞和文本主題的對應(yīng)關(guān)系,為進一步的文本分析提供有效的理論基礎(chǔ)。
[Abstract]:This paper applies the theory of complex network to text mining, constructs a complex network of lexical concepts based on lexical co-occurrence relationship, calculates and analyzes the importance index of text vocabulary, and excavates the keywords of topic in the text. When calculating the lexical importance index, the frequency of the target vocabulary and the contribution of its adjacent nodes are taken into account. The experimental results show that the evaluation index of the network node is superior to the comprehensive index based on the weighting degree and the weighted agglomeration coefficient. In addition, the network topology relationship between the key nodes is found by the method of complex network community merging, that is, the core network. By analyzing the core network, the corresponding relationship between keywords and text topics can be obtained, which provides an effective theoretical basis for further text analysis.
【作者單位】: 上海交通大學(xué)安泰經(jīng)濟與管理學(xué)院;
【分類號】:TP391.1

【參考文獻】

相關(guān)期刊論文 前1條

1 謝鳳宏;張大為;黃丹;謝福鼎;;基于加權(quán)復(fù)雜網(wǎng)絡(luò)的文本關(guān)鍵詞提取[J];系統(tǒng)科學(xué)與數(shù)學(xué);2010年11期

【共引文獻】

相關(guān)期刊論文 前7條

1 郎利影;李思騫;張永強;王勇;;漢語詞網(wǎng)絡(luò)的抗毀性研究[J];科學(xué)技術(shù)與工程;2015年05期

2 翟周偉;劉剛;呂玉琴;;基于圖模型的關(guān)鍵詞挖掘方法[J];軟件;2012年08期

3 王雅琳;陸向艷;鐘誠;;基于鏈接和螢火蟲算法聚類博文發(fā)現(xiàn)熱點話題[J];計算機工程與設(shè)計;2015年06期

4 蘇祥坤;吾守爾·斯拉木;買買提依明·哈斯木;;基于詞序統(tǒng)計組合的中文文本關(guān)鍵詞提取技術(shù)[J];計算機工程與設(shè)計;2015年06期

5 趙輝;劉懷亮;范云杰;;復(fù)雜網(wǎng)絡(luò)理論在中文文本特征選擇中的應(yīng)用研究[J];現(xiàn)代圖書情報技術(shù);2012年09期

6 唐曉波;肖璐;;基于依存句法網(wǎng)絡(luò)的文本特征提取研究[J];現(xiàn)代圖書情報技術(shù);2014年11期

7 楊志墨;劉懷亮;趙輝;;一種基于復(fù)雜網(wǎng)絡(luò)的中文文本表示算法[J];現(xiàn)代圖書情報技術(shù);2014年11期

相關(guān)碩士學(xué)位論文 前6條

1 謝鳳宏;基于復(fù)雜網(wǎng)絡(luò)理論的文本聚類和關(guān)鍵詞提取方法研究[D];遼寧師范大學(xué);2011年

2 毛新武;基于組合特征的中文新聞網(wǎng)頁關(guān)鍵詞提取研究[D];北京林業(yè)大學(xué);2013年

3 左曉飛;基于復(fù)雜網(wǎng)絡(luò)的關(guān)鍵詞提取研究[D];西安電子科技大學(xué);2013年

4 周建;基于DOM結(jié)構(gòu)樹和特征詞的Web內(nèi)容提取研究[D];安徽大學(xué);2014年

5 趙輝;基于復(fù)雜網(wǎng)絡(luò)的中文文本分類研究[D];西安電子科技大學(xué);2014年

6 徐云飛;基于分詞技術(shù)的文本主題關(guān)鍵詞處理系統(tǒng)設(shè)計與實現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2014年

【二級參考文獻】

相關(guān)期刊論文 前5條

1 任克強;趙光甫;張國萍;;基于帶權(quán)語言網(wǎng)絡(luò)的網(wǎng)頁關(guān)鍵詞抽取[J];計算機工程與應(yīng)用;2008年08期

2 王曉斌;溫春;石昭祥;;基于貝葉斯信息準(zhǔn)則的文本主題數(shù)估計[J];計算機工程;2009年07期

3 王軍;詞表的自動豐富——從元數(shù)據(jù)中提取關(guān)鍵詞及其定位[J];中文信息學(xué)報;2005年06期

4 趙鵬;蔡慶生;王清毅;耿煥同;;一種基于復(fù)雜網(wǎng)絡(luò)特征的中文文檔關(guān)鍵詞抽取算法[J];模式識別與人工智能;2007年06期

5 張敏;耿煥同;王煦法;;一種利用BC方法的關(guān)鍵詞自動提取算法研究[J];小型微型計算機系統(tǒng);2007年01期

【相似文獻】

相關(guān)期刊論文 前10條

1 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2008年01期

2 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2009年01期

3 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2009年02期

4 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2009年03期

5 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2010年02期

6 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2010年03期

7 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];真空科學(xué)與技術(shù)學(xué)報;2004年01期

8 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2008年02期

9 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2008年03期

10 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[J];液晶與顯示;2008年04期

相關(guān)會議論文 前5條

1 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[A];薄膜技術(shù)學(xué)術(shù)研討會論文集[C];2003年

2 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[A];中國真空學(xué)會2006年學(xué)術(shù)年會論文集[C];2006年

3 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[A];全國薄膜技術(shù)學(xué)術(shù)研討會論文集[C];2006年

4 ;規(guī)范關(guān)鍵詞選擇的決定(試行)[A];中國真空學(xué)會第六屆全國會員大會暨學(xué)術(shù)會議論文集[C];2004年

5 李春久;;醫(yī)學(xué)論文關(guān)鍵詞和CUJA主題詞使用對比分析[A];外向型文獻庫的數(shù)據(jù)質(zhì)量控制——首屆CUJA系統(tǒng)學(xué)術(shù)討論會論文集[C];1990年

相關(guān)博士學(xué)位論文 前1條

1 丁卓冶;面向主題的關(guān)鍵詞抽取方法研究[D];復(fù)旦大學(xué);2013年

相關(guān)碩士學(xué)位論文 前9條

1 劉亞妮;搜索競價廣告關(guān)鍵詞優(yōu)化算法與實驗[D];電子科技大學(xué);2011年

2 呂晨;搜索競價廣告關(guān)鍵詞優(yōu)化問題研究[D];山東科技大學(xué);2010年

3 熱依萊木·帕爾哈提;文本關(guān)鍵詞提取技術(shù)及其應(yīng)用研究[D];新疆大學(xué);2014年

4 王惠勇;多策略關(guān)鍵詞抽取及快速文本主題分類研究[D];東北大學(xué);2012年

5 王良芳;文本挖掘關(guān)鍵詞提取算法的研究[D];浙江工業(yè)大學(xué);2013年

6 王文姝;基于模糊理論的關(guān)鍵詞識別算法研究[D];哈爾濱工程大學(xué);2010年

7 溫安國;基于詞語網(wǎng)絡(luò)的關(guān)鍵詞自動提取方法及在中文網(wǎng)頁分類中的應(yīng)用研究[D];復(fù)旦大學(xué);2009年

8 彭浩;基于領(lǐng)域關(guān)鍵詞自動擴展的變量主題Hopfield聚焦爬蟲的研究[D];中南大學(xué);2008年

9 譚志強;面向SEO的網(wǎng)絡(luò)編輯助手研究與實現(xiàn)[D];西安工程大學(xué);2011年

,

本文編號:1843181

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1843181.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d1296***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com