天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合序列到序列框架與生成對(duì)抗網(wǎng)絡(luò)的文本摘要模型研究

發(fā)布時(shí)間:2020-08-10 12:08
【摘要】:在因互聯(lián)網(wǎng)飛速發(fā)展導(dǎo)致的信息過載時(shí)代,自動(dòng)文本摘要對(duì)于人們快速檢索有效信息起著巨大的作用.文本摘要技術(shù)有抽取式摘要和生成式摘要兩種,本文主要研究難度更大、生成摘要質(zhì)量更好的生成式摘要技術(shù).現(xiàn)有的生成式摘要是基于序列到序列結(jié)合注意力機(jī)制框架進(jìn)行的,這種框架一般可以生成較短的質(zhì)量尚可的摘要,但仍然存在著一些不足.比如,在生成較長的摘要時(shí),生成的摘要容易出現(xiàn)單詞或者短語的重復(fù)、有時(shí)會(huì)出現(xiàn)語法、語義不通順等情況.針對(duì)這些問題,一方面,我們?cè)谏鲜隹蚣芟绿岢隽艘环N解碼器-指針網(wǎng)絡(luò)結(jié)構(gòu),額外訓(xùn)練一個(gè)指針網(wǎng)絡(luò),其作用是從源文本中的某個(gè)位置復(fù)制合適的單詞到當(dāng)前時(shí)間步的輸出,這種復(fù)制機(jī)制通過參數(shù)的調(diào)節(jié)與優(yōu)化可以自動(dòng)進(jìn)行訓(xùn)練學(xué)習(xí).另一方面,我們提出了一種覆蓋率檢測(cè)機(jī)制來解決摘要中單詞、短語經(jīng)常重復(fù)生成的問題,其主要的思想是引入了時(shí)間步的注意力權(quán)重分布之和作為覆蓋率向量,通過抑制某一個(gè)維度注意力分布,加入一個(gè)覆蓋率損失函數(shù)到目標(biāo)函數(shù),巧妙地解決了注意力集中在某幾個(gè)單詞的情況,緩解了生成的摘要出現(xiàn)重復(fù)的情況.由于生成對(duì)抗網(wǎng)絡(luò)的結(jié)構(gòu)可以讓生成網(wǎng)絡(luò)和對(duì)抗網(wǎng)絡(luò)在互相對(duì)抗的過程中同步演化,讓生成網(wǎng)絡(luò)的輸出非常接近真實(shí)的樣本.基于此,我們將改進(jìn)之后的序列到序列網(wǎng)絡(luò)作為生成網(wǎng)絡(luò),引入了詞向量模型加上卷積網(wǎng)絡(luò)架構(gòu)的摘要文本分類器作為鑒別網(wǎng)絡(luò),二者不斷對(duì)抗、迭代,最終生成高質(zhì)量的摘要.為了驗(yàn)證本文模型的有效性與優(yōu)越性,我們選擇了在Gigaword、DUC2003以及CNN/Daily Mail三個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行生成摘要的數(shù)值實(shí)驗(yàn),選擇了ROUGE-1,ROUGE-2,ROUGE-L三種指標(biāo)進(jìn)行摘要質(zhì)量的評(píng)估.實(shí)驗(yàn)結(jié)果表明,本文的模型在三個(gè)質(zhì)量評(píng)估指標(biāo)上均得到了不同程度的提升.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:C815

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 俞鴻飛;王坤;殷明明;段湘煜;張民;;區(qū)分冗余序列的抽象文本摘要[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2019年06期

2 明拓思宇;陳鴻昶;;文本摘要研究進(jìn)展與趨勢(shì)[J];網(wǎng)絡(luò)與信息安全學(xué)報(bào);2018年06期

3 王知津;基于句子選擇的自動(dòng)文本摘要方法及其評(píng)價(jià)[J];現(xiàn)代圖書情報(bào)技術(shù);1998年01期

4 邱秀連;鄒珞彬;王崢;;基于文本摘要的影評(píng)評(píng)分預(yù)測(cè)研究[J];計(jì)算機(jī)與數(shù)字工程;2019年01期

5 邱俊;;基于強(qiáng)化學(xué)習(xí)的混合式文本摘要模型[J];信息技術(shù)與信息化;2019年01期

6 王成全;;基于專業(yè)詞典的文本摘要系統(tǒng)的探討[J];林區(qū)教學(xué);2008年02期

7 馬漢華;邵志清;過弋;;基于認(rèn)知心理學(xué)模型的自動(dòng)文本摘要生成技術(shù)[J];華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期

8 江開忠;李子成;顧君忠;;自動(dòng)文本摘要方法[J];計(jì)算機(jī)工程;2008年01期

9 王凱祥;;面向查詢的自動(dòng)文本摘要技術(shù)研究綜述[J];計(jì)算機(jī)科學(xué);2018年S2期

10 徐濤;;基于自動(dòng)文本摘要的中文移動(dòng)簡訊系統(tǒng)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2015年30期

相關(guān)會(huì)議論文 前3條

1 王慧芳;張勇;邢春曉;張文珂;楊吉江;;文本摘要算法集成與實(shí)現(xiàn)[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年

2 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 董俊林;聶偉;楊君英;張春爐;;命名實(shí)體識(shí)別與提取分析[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

相關(guān)重要報(bào)紙文章 前3條

1 本報(bào)記者 胡珉琦;一本AI寫作的科研綜述 你讀嗎[N];中國科學(xué)報(bào);2019年

2 郭敏 浙江省交通規(guī)劃設(shè)計(jì)研究院;說一下“專車”不愿講的責(zé)任[N];中國交通報(bào);2015年

3 咕咚;Blog: 從技術(shù)出發(fā)[N];計(jì)算機(jī)世界;2003年

相關(guān)碩士學(xué)位論文 前10條

1 Linyi Liang;[D];華中師范大學(xué);2019年

2 汪貝貝;基于Seq2Seq模型的自動(dòng)文本摘要技術(shù)研究與實(shí)現(xiàn)[D];華中科技大學(xué);2019年

3 廖玉婷;基于Attention機(jī)制的文本摘要研究與實(shí)現(xiàn)[D];華中科技大學(xué);2019年

4 胡成春;融合序列到序列框架與生成對(duì)抗網(wǎng)絡(luò)的文本摘要模型研究[D];華中科技大學(xué);2019年

5 施旭濤;基于堆疊BiLSTM的中文自動(dòng)文本摘要研究[D];云南大學(xué);2019年

6 丁鵬;基于Seq2Seq模型的中文自動(dòng)文本摘要研究[D];云南大學(xué);2018年

7 王鑫同;基于生成式的自動(dòng)文本摘要方法研究[D];華南理工大學(xué);2019年

8 楊偉均;輿情監(jiān)控系統(tǒng)中的文本摘要技術(shù)的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2018年

9 宋宇佳;基于自動(dòng)文本摘要的社會(huì)新聞APP設(shè)計(jì)研究[D];哈爾濱工業(yè)大學(xué);2019年

10 徐馨韜;基于Doc2Vec和改進(jìn)的TextRank的中文單文檔摘要研究[D];中國電子科技集團(tuán)公司電子科學(xué)研究院;2019年



本文編號(hào):2788060

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2788060.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2d18f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com