基于詞向量包的自動文摘方法
本文選題:詞向量 切入點:詞包向量 出處:《現(xiàn)代情報》2017年02期
【摘要】:[目的]利用向量空間描述語義信息,研究基于詞向量包的自動文摘方法;[方法]文摘是文獻內(nèi)容縮短的精確表達;而詞向量包可以在同一個向量空間下表示詞、短語、句子、段落和篇章,其空間距離用于反映語義相似度。提出一種基于詞向量包的自動文摘方法,用詞向量包的表示距離衡量句子與整篇文獻的語義相似度,將與文獻語義相似的句子抽取出來最終形成文摘;[結(jié)果]在DUC01數(shù)據(jù)集上,實驗結(jié)果表明,該方法能夠生成高質(zhì)量的文摘,結(jié)果明顯優(yōu)于其它方法;[結(jié)論]實驗證明該方法明顯提升了自動文摘的性能。
[Abstract]:[objective] to describe the semantic information in vector space and study the automatic abstract method based on word vector packet. [methods] Abstract is an accurate expression of shortened document content, and word vector packet can represent words, phrases and sentences in the same vector space.The spatial distance of paragraphs and texts is used to reflect semantic similarity.An automatic summarization method based on word vector packet is proposed. The representation distance of the lexical vector packet measures the semantic similarity between the sentence and the whole document, and the sentence similar to the document semantic is extracted to form the abstract. [results] on the DUC01 data set,The experimental results show that this method can produce high quality abstracts, and the results are obviously superior to those of other methods. [conclusion] experiments show that this method can improve the performance of automatic abstracts obviously.
【作者單位】: 內(nèi)蒙古大學圖書館;內(nèi)蒙古大學計算機學院;
【基金】:國家自然基金項目“基于領(lǐng)域本體的蒙古文數(shù)字資源整合機制研究”(項目編號:71163029)
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 金博,史彥軍,滕弘飛,艾景波;自動文摘技術(shù)及應用[J];計算機應用研究;2004年12期
2 陸和健;李祝啟;;網(wǎng)絡(luò)信息自動文摘研究[J];情報科學;2008年10期
3 林莉;;自動文摘的生成方法與評價研究[J];圖書館學刊;2009年05期
4 王建波,王開鑄;自然語言篇章理解及基于理解的自動文摘研究[J];中文信息學報;1992年02期
5 王開鑄,李俊杰,李秀坤,吳巖,張軍;自動文摘系統(tǒng)的歷史和現(xiàn)狀[J];電腦學習;1995年04期
6 王開鑄,吳巖,劉挺,張軍;自動文摘設(shè)計模型[J];電腦學習;1995年05期
7 王開鑄,吳巖,劉挺;基于理解的自動文摘系統(tǒng)設(shè)計[J];電腦學習;1996年02期
8 李蕾,鐘義信,郭祥昊;面向特定領(lǐng)域的理解型中文自動文摘系統(tǒng)[J];計算機研究與發(fā)展;2000年04期
9 胡舜耕,鐘義信,魏超成;基于多Agent技術(shù)的自動文摘研究[J];計算機工程與應用;2000年09期
10 宋今,趙東巖;基于語料庫與層次詞典的自動文摘研究(英文)[J];軟件學報;2000年03期
相關(guān)會議論文 前10條
1 桂卓民;何婷婷;陳勁光;李芳;;一種面向查詢的多文檔自動文摘系統(tǒng)實現(xiàn)方法[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
2 劉茂福;金可佳;姬東鴻;張曉龍;;統(tǒng)計與規(guī)則相結(jié)合的指代消解在事件自動文摘中的應用[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
3 耿崇;宋丹;薛德軍;張燦;;基于詞位置與同現(xiàn)特征的中文自動文摘研究[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
4 劉海濤;老松楊;吳玲達;;基于段落自適應聚類的自動文摘系統(tǒng)研究[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年
5 李成城;;基于修辭結(jié)構(gòu)理論的自動文摘研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年
6 呂靜;昝紅英;;基于語義統(tǒng)計的中文自動文摘研究[A];第三屆學生計算語言學研討會論文集[C];2006年
7 王紅玲;黃超超;張明慧;周國棟;;面向冗余度控制的中文多文檔自動文摘[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
8 盧冶;林鴻飛;趙晶;;中文自動文摘系統(tǒng)的綜合評價模式[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
9 邵偉;何婷婷;胡珀;肖華松;;一種面向查詢的多文檔文摘句選擇策略[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
10 王小磊;張瑾;許洪波;;基于交互增強原理的多文檔自動文摘算法[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
相關(guān)重要報紙文章 前1條
1 教育部語言文字應用研究所副所長 靳光瑾 中國社會科學院語言文字應用系研究生 易江燕;話題發(fā)現(xiàn)技術(shù):決策參考的“探測器”[N];中國社會科學報;2014年
相關(guān)博士學位論文 前10條
1 趙林;面向查詢的多文檔自動文摘關(guān)鍵技術(shù)研究[D];復旦大學;2008年
2 李鵬;面向主題的多文檔自動文摘關(guān)鍵技術(shù)研究[D];上海交通大學;2013年
3 胡珀;融合上下文信息的自動文摘研究[D];武漢大學;2013年
4 蔣昌金;基于關(guān)鍵詞提取的中文網(wǎng)頁自動文摘方法研究[D];華南理工大學;2010年
5 韋福如;基于圖模型多文檔自動文摘研究[D];武漢大學;2009年
6 徐永東;多文檔自動文摘關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學;2007年
7 張琳;基于引用聚類的多文檔自動文摘技術(shù)研究[D];大連海事大學;2013年
8 陳勁光;基于云模型的中文面向查詢多文檔自動文摘研究[D];華中師范大學;2011年
9 劉德喜;基于基本要素的多文檔自動文摘研究[D];武漢大學;2007年
10 鄭義;多媒體信息自動摘要及其相關(guān)技術(shù)研究[D];復旦大學;2003年
相關(guān)碩士學位論文 前10條
1 陳奕辰;基于句子權(quán)重和篇章結(jié)構(gòu)的自動文摘算法的研究與實現(xiàn)[D];湖南師范大學;2015年
2 蘇彬;基于Word2Vec的自動文摘系統(tǒng)的設(shè)計與實現(xiàn)[D];河北科技大學;2015年
3 孫佩佩;面向事件的自動文摘研究[D];安徽理工大學;2016年
4 曹洋;基于TextRank算法的單文檔自動文摘研究[D];南京大學;2016年
5 劉俊斐;自動文摘后處理算法的研究和實現(xiàn)[D];湖南師范大學;2016年
6 李方馨;基于中文微博的自動文摘研究[D];內(nèi)蒙古師范大學;2016年
7 李杰;漢語句群自動劃分方法及其在自動文摘中的應用[D];杭州電子科技大學;2015年
8 朱荷香;中文自動文摘系統(tǒng)的研究與實現(xiàn)[D];南京師范大學;2008年
9 石子言;用戶驅(qū)動的特定領(lǐng)域自動文摘系統(tǒng)設(shè)計與實現(xiàn)[D];東北師范大學;2009年
10 孟慶富;生物醫(yī)學多文檔自動文摘系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學;2010年
,本文編號:1708258
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1708258.html