基于改進(jìn)的TextRank的自動(dòng)摘要提取方法
[Abstract]:The classical TextRank algorithm only considers the similarity between sentence nodes and ignores the text structure of the document and the context information of the sentence. Aiming at these problems and combining the structural characteristics of Chinese text, an improved iTextRank algorithm is proposed, which introduces the information of title, paragraph, special sentence, sentence position and length into the construction of TextRank network graph. The improved sentence similarity calculation method and the weight adjustment factor are presented and applied to the automatic summary extraction of Chinese text. The time complexity of the algorithm is also analyzed. Finally, the experimental results show that iTextRank has higher accuracy and lower recall than the classical TextRank method.
【作者單位】: 廣東藥科大學(xué)醫(yī)藥信息工程學(xué)院;華南理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;
【基金】:廣東省自然科學(xué)基金(2015A030310318) 廣東省醫(yī)學(xué)科學(xué)技術(shù)研究基金項(xiàng)目(A2015065) 國家自然科學(xué)基金資助項(xiàng)目(61103038)資助
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 沈洲,王永成,許一震,吳芳芳;一種面向新聞文獻(xiàn)的自動(dòng)摘要系統(tǒng)的研究與實(shí)踐[J];計(jì)算機(jī)工程;2000年09期
2 李愛紅;試論自動(dòng)摘要技術(shù)[J];圖書情報(bào)工作;2000年04期
3 沈洲,王永成,韓客松;一種基于主題敏感辭分析的新聞文獻(xiàn)自動(dòng)摘要系統(tǒng)的研究與實(shí)踐[J];高技術(shù)通訊;2001年09期
4 王彩霞;試論自動(dòng)摘要技術(shù)[J];晉圖學(xué)刊;2003年02期
5 張雷生,萬紹俊,許鵬文;簡單中文自動(dòng)摘要系統(tǒng)研究[J];裝備指揮技術(shù)學(xué)院學(xué)報(bào);2004年03期
6 王建會(huì);周水庚;胡運(yùn)發(fā);;基于聚類的自動(dòng)摘要[J];模式識(shí)別與人工智能;2004年03期
7 黃水清;李志燕;梁剛;;面向計(jì)算機(jī)類文獻(xiàn)的自動(dòng)摘要系統(tǒng)的研究與實(shí)現(xiàn)[J];圖書與情報(bào);2006年03期
8 陳珂;殷凡;;中文自動(dòng)摘要綜述[J];福建電腦;2007年02期
9 李念峰;;基于自動(dòng)摘要的網(wǎng)絡(luò)情報(bào)收集系統(tǒng)研究[J];現(xiàn)代情報(bào);2007年11期
10 郭琳虹;張小松;;文本自動(dòng)摘要的方法研究[J];福建電腦;2008年06期
相關(guān)會(huì)議論文 前8條
1 章彥星;張銘;鄧志鴻;;基于特征的用戶評(píng)論自動(dòng)摘要[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
2 吳中勤;黃萱菁;吳立德;;基于有監(jiān)督分類技術(shù)的文本自動(dòng)摘要研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
3 王暉;馬軍;;面向Web論壇的多文檔摘要方法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
4 張奇;黃萱菁;吳立德;;一種新的句子相似度度量及其在文本自動(dòng)摘要中的應(yīng)用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
5 李芳;何婷婷;;面向查詢的多模式自動(dòng)摘要研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
6 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動(dòng)摘要算法[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
7 王荀;李素建;宋濤;姜伯平;;服務(wù)于內(nèi)容側(cè)面發(fā)現(xiàn)的框架識(shí)別[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
8 楊瀟;馬軍;楊同峰;杜言琦;邵海敏;;基于主題模型LDA的多文檔自動(dòng)摘要[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
相關(guān)博士學(xué)位論文 前2條
1 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
2 耿煥同;范例推理與互聯(lián)網(wǎng)文本信息處理研究[D];中國科學(xué)技術(shù)大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 王馨;網(wǎng)絡(luò)新聞熱點(diǎn)發(fā)現(xiàn)研究[D];河北大學(xué);2015年
2 李子健;專題摘要自動(dòng)生成技術(shù)研究[D];浙江大學(xué);2015年
3 熊嬌;基于詞項(xiàng)—句子—文檔三層圖模型的多文檔自動(dòng)摘要[D];江西師范大學(xué);2015年
4 程園;輿情分析中維吾爾文文本自動(dòng)摘要研究[D];新疆大學(xué);2015年
5 梁入文;基于文本意見挖掘的煙臺(tái)大學(xué)教學(xué)評(píng)價(jià)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
6 楊瑞;在線網(wǎng)絡(luò)中文本自動(dòng)摘要系統(tǒng)研究和實(shí)現(xiàn)[D];南京航空航天大學(xué);2014年
7 唐亞娟;基于文本挖掘的糧食情報(bào)分析技術(shù)與系統(tǒng)實(shí)現(xiàn)[D];河南工業(yè)大學(xué);2015年
8 張占江;基于短語主題模型和多文檔自動(dòng)摘要技術(shù)的文獻(xiàn)綜述內(nèi)容推薦[D];浙江大學(xué);2016年
9 程娟;中文文檔自動(dòng)摘要技術(shù)[D];山東大學(xué);2006年
10 周凱;中文突發(fā)事件新聞自動(dòng)摘要的研究[D];上海交通大學(xué);2008年
,本文編號(hào):2345367
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2345367.html