基于布谷鳥搜索優(yōu)化算法的多文檔摘要方法
發(fā)布時(shí)間:2021-11-09 11:29
為最大化生成摘要的信息量,提出一種基于布谷鳥搜索(CS)算法與多目標(biāo)函數(shù)的多文檔摘要方法。對(duì)多文檔數(shù)據(jù)進(jìn)行預(yù)處理,通過句子分割、分詞、移除停用詞和詞干化將文檔轉(zhuǎn)化為詞語的基本處理形式,計(jì)算經(jīng)數(shù)據(jù)預(yù)處理后的句子信息量得分并將其作為CS算法的輸入,再基于多目標(biāo)函數(shù)生成包含原始文檔重要信息的句子以組成最終的摘要。實(shí)驗(yàn)結(jié)果表明,與基于粒子群優(yōu)化算法和雙層K最近鄰算法的多文檔摘要方法相比,該方法在最大化生成摘要信息量的前提下,保證了高可讀性和低冗余性,并且在DUC基準(zhǔn)數(shù)據(jù)集上的摘要平均準(zhǔn)確度高達(dá)0.99。
【文章來源】:計(jì)算機(jī)工程. 2020,46(07)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
多文檔摘要處理流程
預(yù)處理流程
在輸入表示階段,使用預(yù)處理后的數(shù)據(jù)計(jì)算每個(gè)句子的權(quán)重(術(shù)語頻率之和),即句子信息量得分,將句子信息量得分作為算法輸入,其流程如圖3所示。1.3 摘要表示
【參考文獻(xiàn)】:
期刊論文
[1]一種話題敏感的抽取式多文檔摘要方法[J]. 應(yīng)文豪,李素建,穗志方. 中文信息學(xué)報(bào). 2017(06)
[2]基于LexRank的中文單文檔摘要方法[J]. 劉海燕,張鈺. 兵器裝備工程學(xué)報(bào). 2017(06)
[3]融合句義特征的多文檔自動(dòng)摘要算法研究[J]. 羅森林,白建敏,潘麗敏,韓磊,孟強(qiáng). 北京理工大學(xué)學(xué)報(bào). 2016(10)
[4]基于增量圖聚類的動(dòng)態(tài)多文檔摘要算法[J]. 郭海蓉,張暉,趙旭劍,李波,楊春明. 計(jì)算機(jī)應(yīng)用研究. 2016(07)
[5]基于文本挖掘的漏洞信息聚類分析[J]. 高嶺,申元,高妮,雷艷婷,孫騫. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(05)
[6]基于LDA重要主題的多文檔自動(dòng)摘要算法[J]. 劉娜,路瑩,唐曉君,李明霞. 計(jì)算機(jī)科學(xué)與探索. 2015(02)
[7]動(dòng)態(tài)適應(yīng)布谷鳥搜索算法[J]. 張永韡,汪鐳,吳啟迪. 控制與決策. 2014(04)
[8]逐維改進(jìn)的布谷鳥搜索算法[J]. 王李進(jìn),尹義龍,鐘一文. 軟件學(xué)報(bào). 2013(11)
碩士論文
[1]基于word2vec的中文自動(dòng)摘要方法研究[D]. 王雪霏.哈爾濱工業(yè)大學(xué) 2017
[2]基于主題句語義融合的多文檔摘要算法研究[D]. 劉子平.重慶大學(xué) 2016
本文編號(hào):3485246
【文章來源】:計(jì)算機(jī)工程. 2020,46(07)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
多文檔摘要處理流程
預(yù)處理流程
在輸入表示階段,使用預(yù)處理后的數(shù)據(jù)計(jì)算每個(gè)句子的權(quán)重(術(shù)語頻率之和),即句子信息量得分,將句子信息量得分作為算法輸入,其流程如圖3所示。1.3 摘要表示
【參考文獻(xiàn)】:
期刊論文
[1]一種話題敏感的抽取式多文檔摘要方法[J]. 應(yīng)文豪,李素建,穗志方. 中文信息學(xué)報(bào). 2017(06)
[2]基于LexRank的中文單文檔摘要方法[J]. 劉海燕,張鈺. 兵器裝備工程學(xué)報(bào). 2017(06)
[3]融合句義特征的多文檔自動(dòng)摘要算法研究[J]. 羅森林,白建敏,潘麗敏,韓磊,孟強(qiáng). 北京理工大學(xué)學(xué)報(bào). 2016(10)
[4]基于增量圖聚類的動(dòng)態(tài)多文檔摘要算法[J]. 郭海蓉,張暉,趙旭劍,李波,楊春明. 計(jì)算機(jī)應(yīng)用研究. 2016(07)
[5]基于文本挖掘的漏洞信息聚類分析[J]. 高嶺,申元,高妮,雷艷婷,孫騫. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(05)
[6]基于LDA重要主題的多文檔自動(dòng)摘要算法[J]. 劉娜,路瑩,唐曉君,李明霞. 計(jì)算機(jī)科學(xué)與探索. 2015(02)
[7]動(dòng)態(tài)適應(yīng)布谷鳥搜索算法[J]. 張永韡,汪鐳,吳啟迪. 控制與決策. 2014(04)
[8]逐維改進(jìn)的布谷鳥搜索算法[J]. 王李進(jìn),尹義龍,鐘一文. 軟件學(xué)報(bào). 2013(11)
碩士論文
[1]基于word2vec的中文自動(dòng)摘要方法研究[D]. 王雪霏.哈爾濱工業(yè)大學(xué) 2017
[2]基于主題句語義融合的多文檔摘要算法研究[D]. 劉子平.重慶大學(xué) 2016
本文編號(hào):3485246
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3485246.html
最近更新
教材專著