融合文本主題信息的中文生成式自動(dòng)摘要研究
發(fā)布時(shí)間:2025-01-20 17:27
互聯(lián)網(wǎng)上包含數(shù)十億的文本信息,并且每天都以指數(shù)級(jí)形式飛速增長(zhǎng),人們難以快速、準(zhǔn)確地從這些文本中甄別出有價(jià)值的信息。因此,有必要提供一種可以及時(shí)訪問(wèn)和快速消化各種信息的工具來(lái)緩解信息過(guò)載問(wèn)題。自動(dòng)摘要可以將一篇或多篇長(zhǎng)文本精簡(jiǎn)、提煉成一段包含最重要信息的短文本,能夠緩解人們的閱讀負(fù)擔(dān)。近年來(lái),隨著深度學(xué)習(xí)算法、大數(shù)據(jù)和硬件算力的迅猛發(fā)展,基于注意力機(jī)制的序列到序列模型在生成式自動(dòng)摘要任務(wù)中取得成功,得到學(xué)術(shù)界的廣泛研究。然而,現(xiàn)有的摘要模型生成的摘要存在著內(nèi)容不準(zhǔn)確、摘要不充分等缺點(diǎn),針對(duì)這個(gè)問(wèn)題,本文利用關(guān)鍵詞作為原文的主題信息并融合到指針生成網(wǎng)絡(luò)模型中,從而提高模型生成摘要的質(zhì)量。本文的主要研究工作如下:第一,注意力機(jī)制通常用于獲取目標(biāo)詞與原文的對(duì)齊信息,但是難以識(shí)別原文所蘊(yùn)含的主題內(nèi)容,傳遞給解碼器的上下文向量缺少對(duì)原文主題信息的歸納能力。而人在寫摘要時(shí),往往會(huì)參考文檔中的主題信息,這些主題信息通常以關(guān)鍵詞或中心句的方式呈現(xiàn)。鑒于此,本文通過(guò)抽取關(guān)鍵詞來(lái)挖掘原文的主題信息,并將其顯式地整合到注意力機(jī)制中,從而讓模型在有全局主題信息指導(dǎo)的情況下,以上下文感知的方式生成面向主題的摘要。具...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 抽取式自動(dòng)摘要
1.2.2 生成式自動(dòng)摘要
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 生成式自動(dòng)摘要研究綜述
2.1 序列到序列模型
2.2 注意力機(jī)制
2.3 摘要搜索算法
2.4 自動(dòng)摘要評(píng)價(jià)方法
第三章 基于全局主題關(guān)鍵詞的指針生成網(wǎng)絡(luò)模型
3.1 引言
3.2 文本主題關(guān)鍵詞
3.3 算法模型
3.3.1 模型整體架構(gòu)
3.3.2 主題關(guān)鍵詞抽取
3.3.3 指針生成網(wǎng)絡(luò)模型
3.3.4 融合關(guān)鍵詞信息的注意力機(jī)制
3.3.5 覆蓋機(jī)制與目標(biāo)函數(shù)
3.4 實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)設(shè)置
3.4.3 對(duì)比模型
3.4.4 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第四章 基于主題關(guān)鍵詞注意力機(jī)制的指針生成網(wǎng)絡(luò)模型
4.1 引言
4.2 算法模型
4.2.1 模型整體架構(gòu)
4.2.2 主題關(guān)鍵詞注意力機(jī)制
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 對(duì)比模型
4.3.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 研究總結(jié)
5.2 工作展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的學(xué)術(shù)成果
致謝
本文編號(hào):4029441
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 抽取式自動(dòng)摘要
1.2.2 生成式自動(dòng)摘要
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 生成式自動(dòng)摘要研究綜述
2.1 序列到序列模型
2.2 注意力機(jī)制
2.3 摘要搜索算法
2.4 自動(dòng)摘要評(píng)價(jià)方法
第三章 基于全局主題關(guān)鍵詞的指針生成網(wǎng)絡(luò)模型
3.1 引言
3.2 文本主題關(guān)鍵詞
3.3 算法模型
3.3.1 模型整體架構(gòu)
3.3.2 主題關(guān)鍵詞抽取
3.3.3 指針生成網(wǎng)絡(luò)模型
3.3.4 融合關(guān)鍵詞信息的注意力機(jī)制
3.3.5 覆蓋機(jī)制與目標(biāo)函數(shù)
3.4 實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)設(shè)置
3.4.3 對(duì)比模型
3.4.4 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第四章 基于主題關(guān)鍵詞注意力機(jī)制的指針生成網(wǎng)絡(luò)模型
4.1 引言
4.2 算法模型
4.2.1 模型整體架構(gòu)
4.2.2 主題關(guān)鍵詞注意力機(jī)制
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 對(duì)比模型
4.3.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 研究總結(jié)
5.2 工作展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的學(xué)術(shù)成果
致謝
本文編號(hào):4029441
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4029441.html
最近更新
教材專著