基于子詞單元的深度學(xué)習(xí)摘要生成方法
發(fā)布時(shí)間:2023-10-21 16:06
現(xiàn)有的生成式文本摘要方法存在一些局限,包括難以產(chǎn)生可靠的源文本表示,產(chǎn)生的摘要句與源文本的語義相似度較低,存在集外詞問題等。對此提出一種混合神經(jīng)網(wǎng)絡(luò)編碼器結(jié)構(gòu),對源文本的長距依賴和上下文信息進(jìn)行捕捉,得到高質(zhì)量的文本表示;提出一種基于關(guān)鍵短語的重排序機(jī)制,利用源文本中抽取的關(guān)鍵短語對集束搜索生成的候選序列進(jìn)行重新排序,以減小其與源文本語義上的距離;對文本進(jìn)行子詞單元提取,利用更細(xì)粒度的單元對文本進(jìn)行表示。該方法在不同長度的摘要數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),均取得了良好的效果。
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 相關(guān)工作
2 問題形式化描述
3 算法設(shè)計(jì)與實(shí)現(xiàn)
3.1 基于子詞單元的文本表示
3.2 結(jié)合注意力機(jī)制的編碼器-解碼器結(jié)構(gòu)
3.3 基于關(guān)鍵短語的重排序機(jī)制
4 實(shí) 驗(yàn)
4.1 數(shù)據(jù)集及實(shí)驗(yàn)設(shè)置
4.2 實(shí)驗(yàn)結(jié)果與分析
4.2.1 句子摘要任務(wù)
4.2.2 標(biāo)題生成任務(wù)
4.3 實(shí)例分析
5 結(jié) 語
本文編號:3856169
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 相關(guān)工作
2 問題形式化描述
3 算法設(shè)計(jì)與實(shí)現(xiàn)
3.1 基于子詞單元的文本表示
3.2 結(jié)合注意力機(jī)制的編碼器-解碼器結(jié)構(gòu)
3.3 基于關(guān)鍵短語的重排序機(jī)制
4 實(shí) 驗(yàn)
4.1 數(shù)據(jù)集及實(shí)驗(yàn)設(shè)置
4.2 實(shí)驗(yàn)結(jié)果與分析
4.2.1 句子摘要任務(wù)
4.2.2 標(biāo)題生成任務(wù)
4.3 實(shí)例分析
5 結(jié) 語
本文編號:3856169
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3856169.html
最近更新
教材專著