基于神經(jīng)網(wǎng)絡(luò)的抽取式摘要系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2023-05-31 20:51
就是一個高度概括原文重要信息的過程。摘要算法大致可以分為兩類:抽取式摘要和生成式摘要。抽取式摘要的目的是從原文中選擇一些重要的短語或句子來組成摘要。生成式摘要是利用算法生成文本的另一種表達(dá),所用到的詞匯表述并不一定來自于原文。自動文本摘要能夠幫助很多下游任務(wù)(例如新聞?wù)?社會媒體等)。近些年一些基于神經(jīng)網(wǎng)絡(luò)的工作大都將抽取式摘要任務(wù)當(dāng)成序列標(biāo)注來建模。這就存在訓(xùn)練和測試的不一致性問題:訓(xùn)練時當(dāng)成分類任務(wù),測試時當(dāng)成排序任務(wù)。我們提出一種基于神經(jīng)網(wǎng)絡(luò)的回歸模型,讓模型在訓(xùn)練的時候就直接擬合ROUGE得到其分?jǐn)?shù)用來做排序。我們的回歸模型在短文本摘要的時候效果很好,但是在生成長摘要的時候效果沒有明顯收益。這主要因為自動文本摘要系統(tǒng)經(jīng)常會生成帶有冗余的摘要?紤]摘要中的如下兩個句子:“襯衫的價格是多少”和“襯衫賣多少錢”。這兩句話雖然不同但表達(dá)了相同的含義,因此具有冗余信息。我們對文本中存在大量重復(fù)觀點的現(xiàn)象做了經(jīng)驗性分析,F(xiàn)有的大多數(shù)抽取式摘要系統(tǒng)通常獨立建模句子打分和冗余懲罰。這些模型首先根據(jù)句子的重要程度打分,然后在選擇句子的過程中考慮懲罰冗余信息。我們提出一種可以同時建模句子打分和冗...
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來源、背景及意義
1.2 國內(nèi)外研究進(jìn)展及成果
1.2.1 基于無監(jiān)督學(xué)習(xí)的抽取式摘要
1.2.2 基于有監(jiān)督學(xué)習(xí)的抽取式摘要
1.3 本文的主要研究內(nèi)容
第2章 基于分類的抽取式摘要
2.1 任務(wù)定義
2.2 現(xiàn)有分類模型調(diào)研
2.2.1 基于支持向量機(jī)的抽取式摘要模型
2.2.2 基于條件隨機(jī)場的抽取式摘要模型
2.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的抽取式摘要模型
2.3 分類模型存在的問題及分析
2.4 本章小結(jié)
第3章 基于回歸的抽取式摘要
3.1 任務(wù)定義
3.2 模型架構(gòu)
3.2.1 輸入層
3.2.2 基于Attention的句子表示層
3.2.3 基于Attention的篇章表示層
3.2.4 回歸層
3.3 實驗
3.3.1 基本設(shè)置
3.3.2 數(shù)據(jù)集
3.3.3 評價指標(biāo)
3.3.4 基線模型
3.3.5 實驗結(jié)果與分析
3.4 本章小結(jié)
第4章 基于排序的抽取式摘要
4.1 摘要中的冗余問題
4.2 解決冗余問題的相關(guān)工作
4.3 問題定義
4.4 模型架構(gòu)
4.4.1 句子表示層
4.4.2 篇章表示層
4.4.3 句子抽取層
4.5 實驗
4.5.1 數(shù)據(jù)集構(gòu)造
4.5.2 實驗設(shè)置
4.5.3 實驗結(jié)果與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3825981
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來源、背景及意義
1.2 國內(nèi)外研究進(jìn)展及成果
1.2.1 基于無監(jiān)督學(xué)習(xí)的抽取式摘要
1.2.2 基于有監(jiān)督學(xué)習(xí)的抽取式摘要
1.3 本文的主要研究內(nèi)容
第2章 基于分類的抽取式摘要
2.1 任務(wù)定義
2.2 現(xiàn)有分類模型調(diào)研
2.2.1 基于支持向量機(jī)的抽取式摘要模型
2.2.2 基于條件隨機(jī)場的抽取式摘要模型
2.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的抽取式摘要模型
2.3 分類模型存在的問題及分析
2.4 本章小結(jié)
第3章 基于回歸的抽取式摘要
3.1 任務(wù)定義
3.2 模型架構(gòu)
3.2.1 輸入層
3.2.2 基于Attention的句子表示層
3.2.3 基于Attention的篇章表示層
3.2.4 回歸層
3.3 實驗
3.3.1 基本設(shè)置
3.3.2 數(shù)據(jù)集
3.3.3 評價指標(biāo)
3.3.4 基線模型
3.3.5 實驗結(jié)果與分析
3.4 本章小結(jié)
第4章 基于排序的抽取式摘要
4.1 摘要中的冗余問題
4.2 解決冗余問題的相關(guān)工作
4.3 問題定義
4.4 模型架構(gòu)
4.4.1 句子表示層
4.4.2 篇章表示層
4.4.3 句子抽取層
4.5 實驗
4.5.1 數(shù)據(jù)集構(gòu)造
4.5.2 實驗設(shè)置
4.5.3 實驗結(jié)果與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3825981
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3825981.html
最近更新
教材專著