基于神經(jīng)網(wǎng)絡(luò)的兩階段文本摘要模型研究
發(fā)布時(shí)間:2024-01-27 06:06
隨著互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)中的數(shù)據(jù)呈爆發(fā)式增長,如何在縮小數(shù)據(jù)規(guī)模的情況下保留數(shù)據(jù)中的信息量變得尤為重要。為了更好地提取大量文本中的信息,自然語言處理領(lǐng)域提出了自動(dòng)文本摘要生成任務(wù)。自動(dòng)文本摘要通過計(jì)算機(jī)自動(dòng)化地提取文本主要內(nèi)容并進(jìn)行壓縮,從而幫助人們快速獲取知識(shí)。的方法主要分為抽取式方法和生成式方法兩種。抽取式摘要可以較為準(zhǔn)確地提取原文中的要點(diǎn),但是摘要句子的排序以及連貫性差是其存在主要問題。生成式摘要主要通過端到端的神經(jīng)網(wǎng)絡(luò)模型直接生成摘要,大量訓(xùn)練后生成的文本流暢性較強(qiáng),但是由于這些模型都是黑盒模型,生成過程無法控制,難以準(zhǔn)確涵蓋原文要點(diǎn)。針對(duì)目前自動(dòng)文本摘要方法存在的問題,本文提出了結(jié)合抽取式方法和生成式方法的兩階段模型,并提出了利用摘要句重要性評(píng)估理論模型改進(jìn)抽取式方法與利用覆蓋機(jī)制改進(jìn)生成模型,從而提高模型效果。主要工作和貢獻(xiàn)如下:(1)提出了神經(jīng)網(wǎng)絡(luò)模型與理論模型相結(jié)合的摘要抽取器,該方法首先利用卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)了神經(jīng)網(wǎng)絡(luò)句子分類模型,然后通過對(duì)分類模型得到的關(guān)鍵句子運(yùn)用動(dòng)態(tài)規(guī)劃算法進(jìn)行打分,最后將得分最高的摘要句子集合作為最終的摘要結(jié)果。(2)通過加入覆蓋向...
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
本文編號(hào):3886446
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
圖1-1兩階段框架
圖2-21編碼-解碼框架結(jié)構(gòu)圖
圖32-2注意力機(jī)制原理圖
圖2-3放縮點(diǎn)積注意力機(jī)制原理圖
本文編號(hào):3886446
本文鏈接:http://sikaile.net/tushudanganlunwen/3886446.html
最近更新
教材專著