基于詞向量包的自動文摘方法

發(fā)布時間：2018-04-04 03:56

本文選題：詞向量　切入點：詞包向量　出處：《現(xiàn)代情報》2017年02期

【摘要】：[目的]利用向量空間描述語義信息,研究基于詞向量包的自動文摘方法;[方法]文摘是文獻(xiàn)內(nèi)容縮短的精確表達(dá);而詞向量包可以在同一個向量空間下表示詞、短語、句子、段落和篇章,其空間距離用于反映語義相似度。提出一種基于詞向量包的自動文摘方法,用詞向量包的表示距離衡量句子與整篇文獻(xiàn)的語義相似度,將與文獻(xiàn)語義相似的句子抽取出來最終形成文摘;[結(jié)果]在DUC01數(shù)據(jù)集上,實驗結(jié)果表明,該方法能夠生成高質(zhì)量的文摘,結(jié)果明顯優(yōu)于其它方法;[結(jié)論]實驗證明該方法明顯提升了自動文摘的性能。
[Abstract]:[objective] to describe the semantic information in vector space and study the automatic abstract method based on word vector packet. [methods] Abstract is an accurate expression of shortened document content, and word vector packet can represent words, phrases and sentences in the same vector space.The spatial distance of paragraphs and texts is used to reflect semantic similarity.An automatic summarization method based on word vector packet is proposed. The representation distance of the lexical vector packet measures the semantic similarity between the sentence and the whole document, and the sentence similar to the document semantic is extracted to form the abstract. [results] on the DUC01 data set,The experimental results show that this method can produce high quality abstracts, and the results are obviously superior to those of other methods. [conclusion] experiments show that this method can improve the performance of automatic abstracts obviously.
【作者單位】：內(nèi)蒙古大學(xué)圖書館;內(nèi)蒙古大學(xué)計算機學(xué)院;
【基金】：國家自然基金項目“基于領(lǐng)域本體的蒙古文數(shù)字資源整合機制研究”(項目編號:71163029)
【分類號】：TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 金博,史彥軍,滕弘飛,艾景波;自動文摘技術(shù)及應(yīng)用[J];計算機應(yīng)用研究;2004年12期

2 陸和健;李祝啟;;網(wǎng)絡(luò)信息自動文摘研究[J];情報科學(xué);2008年10期

3 林莉;;自動文摘的生成方法與評價研究[J];圖書館學(xué)刊;2009年05期

4 王建波,王開鑄;自然語言篇章理解及基于理解的自動文摘研究[J];中文信息學(xué)報;1992年02期

5 王開鑄,李俊杰,李秀坤,吳巖,張軍;自動文摘系統(tǒng)的歷史和現(xiàn)狀[J];電腦學(xué)習(xí);1995年04期

6 王開鑄,吳巖,劉挺,張軍;自動文摘設(shè)計模型[J];電腦學(xué)習(xí);1995年05期

7 王開鑄,吳巖,劉挺;基于理解的自動文摘系統(tǒng)設(shè)計[J];電腦學(xué)習(xí);1996年02期

8 李蕾,鐘義信,郭祥昊;面向特定領(lǐng)域的理解型中文自動文摘系統(tǒng)[J];計算機研究與發(fā)展;2000年04期

9 胡舜耕,鐘義信,魏超成;基于多Agent技術(shù)的自動文摘研究[J];計算機工程與應(yīng)用;2000年09期

10 宋今,趙東巖;基于語料庫與層次詞典的自動文摘研究(英文)[J];軟件學(xué)報;2000年03期

相關(guān)會議論文前10條

1 桂卓民;何婷婷;陳勁光;李芳;;一種面向查詢的多文檔自動文摘系統(tǒng)實現(xiàn)方法[A];中國計算機語言學(xué)研究前沿進(jìn)展（2007-2009）[C];2009年

2 劉茂福;金可佳;姬東鴻;張曉龍;;統(tǒng)計與規(guī)則相結(jié)合的指代消解在事件自動文摘中的應(yīng)用[A];中國計算機語言學(xué)研究前沿進(jìn)展（2007-2009）[C];2009年

3 耿崇;宋丹;薛德軍;張燦;;基于詞位置與同現(xiàn)特征的中文自動文摘研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

4 劉海濤;老松楊;吳玲達(dá);;基于段落自適應(yīng)聚類的自動文摘系統(tǒng)研究[A];第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議（HHME2005）論文集[C];2005年

5 李成城;;基于修辭結(jié)構(gòu)理論的自動文摘研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

6 呂靜;昝紅英;;基于語義統(tǒng)計的中文自動文摘研究[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

7 王紅玲;黃超超;張明慧;周國棟;;面向冗余度控制的中文多文檔自動文摘[A];中國計算語言學(xué)研究前沿進(jìn)展（2009-2011）[C];2011年

8 盧冶;林鴻飛;趙晶;;中文自動文摘系統(tǒng)的綜合評價模式[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議（JSCL-2005）論文集[C];2005年

9 邵偉;何婷婷;胡珀;肖華松;;一種面向查詢的多文檔文摘句選擇策略[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

10 王小磊;張瑾;許洪波;;基于交互增強原理的多文檔自動文摘算法[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年

相關(guān)重要報紙文章前1條

1 教育部語言文字應(yīng)用研究所副所長靳光瑾　中國社會科學(xué)院語言文字應(yīng)用系研究生易江燕;話題發(fā)現(xiàn)技術(shù)：決策參考的“探測器”[N];中國社會科學(xué)報;2014年

相關(guān)博士學(xué)位論文前10條

1 趙林;面向查詢的多文檔自動文摘關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2008年

2 李鵬;面向主題的多文檔自動文摘關(guān)鍵技術(shù)研究[D];上海交通大學(xué);2013年

3 胡珀;融合上下文信息的自動文摘研究[D];武漢大學(xué);2013年

4 蔣昌金;基于關(guān)鍵詞提取的中文網(wǎng)頁自動文摘方法研究[D];華南理工大學(xué);2010年

5 韋福如;基于圖模型多文檔自動文摘研究[D];武漢大學(xué);2009年

6 徐永東;多文檔自動文摘關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

7 張琳;基于引用聚類的多文檔自動文摘技術(shù)研究[D];大連海事大學(xué);2013年

8 陳勁光;基于云模型的中文面向查詢多文檔自動文摘研究[D];華中師范大學(xué);2011年

9 劉德喜;基于基本要素的多文檔自動文摘研究[D];武漢大學(xué);2007年

10 鄭義;多媒體信息自動摘要及其相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2003年

相關(guān)碩士學(xué)位論文前10條

1 陳奕辰;基于句子權(quán)重和篇章結(jié)構(gòu)的自動文摘算法的研究與實現(xiàn)[D];湖南師范大學(xué);2015年

2 蘇彬;基于Word2Vec的自動文摘系統(tǒng)的設(shè)計與實現(xiàn)[D];河北科技大學(xué);2015年

3 孫佩佩;面向事件的自動文摘研究[D];安徽理工大學(xué);2016年

4 曹洋;基于TextRank算法的單文檔自動文摘研究[D];南京大學(xué);2016年

5 劉俊斐;自動文摘后處理算法的研究和實現(xiàn)[D];湖南師范大學(xué);2016年

6 李方馨;基于中文微博的自動文摘研究[D];內(nèi)蒙古師范大學(xué);2016年

7 李杰;漢語句群自動劃分方法及其在自動文摘中的應(yīng)用[D];杭州電子科技大學(xué);2015年

8 朱荷香;中文自動文摘系統(tǒng)的研究與實現(xiàn)[D];南京師范大學(xué);2008年

9 石子言;用戶驅(qū)動的特定領(lǐng)域自動文摘系統(tǒng)設(shè)計與實現(xiàn)[D];東北師范大學(xué);2009年

10 孟慶富;生物醫(yī)學(xué)多文檔自動文摘系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年

，

本文編號：1708258

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1708258.html

上一篇：基于深度神經(jīng)網(wǎng)絡(luò)的回歸模型及其應(yīng)用研究
下一篇：煙草配送中基于Android的車載GIS終端設(shè)計與實現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于詞向量包的自動文摘方法