基于多示例注意力機(jī)制的自然問答生成模型研究與設(shè)計(jì)
發(fā)布時(shí)間:2022-02-22 08:57
知識(shí)庫(kù)問答(Knowledge Base Question Answering,簡(jiǎn)稱KBQA)即給定自然語(yǔ)言問題,首先將問題進(jìn)行語(yǔ)義解析和語(yǔ)義理解,再將問題關(guān)鍵內(nèi)容在知識(shí)庫(kù)中查詢,最后通過知識(shí)庫(kù)三元組推斷出答案,由于其應(yīng)用領(lǐng)域多樣,廣泛地服務(wù)于我們的日常生活。傳統(tǒng)的知識(shí)庫(kù)問答方案如管道式系統(tǒng),通常需要?jiǎng)澐譃閹讉(gè)連續(xù)的模塊:語(yǔ)義表示、語(yǔ)義匹配、查詢和推理等。這樣的系統(tǒng)雖然能夠解決回答的問題,然而對(duì)誤差傳遞十分敏感,普適性也較差,每當(dāng)推廣到一個(gè)全新的領(lǐng)域都需要大量人工的重構(gòu)。因此,端到端的自然問答生成模型(Natural Answer Generation,簡(jiǎn)稱NAG)應(yīng)運(yùn)而生,是現(xiàn)如今基于知識(shí)庫(kù)的問答這一議題中的熱門話題。自然答案生成模型是一種基于深度學(xué)習(xí)的端到端式生成模型,可以利用結(jié)構(gòu)化的知識(shí)庫(kù)生成自然語(yǔ)言答案。然而,目前的自然問答模型均假設(shè)一個(gè)問題只有一個(gè)答案,實(shí)際上,真實(shí)世界的社區(qū)問答中通常包含用戶問題的多個(gè)答案,而且許多答案的質(zhì)量各不相同。本文針對(duì)這一問題,提出了一種新的方法,使用多示例學(xué)習(xí)原理將問題、相關(guān)的回答及相關(guān)的知識(shí)庫(kù)組織成“數(shù)據(jù)包”,以動(dòng)態(tài)地減少噪聲實(shí)例的權(quán)重。特別的是...
【文章來(lái)源】:北京郵電大學(xué)北京市211工程院校教育部直屬院校
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究創(chuàng)新點(diǎn)總結(jié)
1.4 論文組織結(jié)構(gòu)
第二章 背景理論及相關(guān)技術(shù)介紹
2.1 端到端的序列生成模型
2.1.1 長(zhǎng)短時(shí)記憶單元(LSTM)
2.1.2 序列到序列生成模型(Seq2Seq)
2.2 基于知識(shí)庫(kù)的自然問答背景及現(xiàn)狀
2.2.1 問答系統(tǒng)
2.2.2 基于知識(shí)庫(kù)的問答
2.2.3 自然問答生成
2.3 多示例算法簡(jiǎn)介
2.4 常用注意力機(jī)制模型簡(jiǎn)介
2.4.1 自注意力機(jī)制
2.4.2 選擇注意力機(jī)制
2.5 社區(qū)問答數(shù)據(jù)的應(yīng)用簡(jiǎn)介
2.6 課程學(xué)習(xí)算法簡(jiǎn)介
2.7 本章小結(jié)
第三章 需求與關(guān)鍵問題分析
3.1 需求概述
3.2 數(shù)據(jù)特點(diǎn)與分析
3.3 基于自然答案生成模型的需求與難點(diǎn)分析
3.3.1 基線模型COREQA原理
3.3.2 自然答案生成模型的需求分析
3.3.3 基于多示例算法的難點(diǎn)分析
3.4 基于注意力機(jī)制的難點(diǎn)分析
3.5 課程學(xué)習(xí)問題轉(zhuǎn)化
3.6 本章小結(jié)
第四章 多示例方案建模自然問答
4.1 數(shù)據(jù)預(yù)處理
4.1.1 數(shù)據(jù)格式規(guī)范化
4.1.2 數(shù)據(jù)包組織
4.2 模型整體方案設(shè)計(jì)
4.3 基于多示例的損失函數(shù)的優(yōu)化與注意力機(jī)制的結(jié)合
4.3.1 基于知識(shí)庫(kù)的問答的多示例損失函數(shù)
4.4 權(quán)重賦值方案詳細(xì)設(shè)計(jì)
4.4.1 單示例選擇
4.4.2 預(yù)先賦權(quán)
4.4.3 基于選擇注意力賦權(quán)
4.4.4 基于自注意力賦權(quán)
4.5 本章小結(jié)
第五章 基于課程學(xué)習(xí)的方案優(yōu)化
5.1 單示例多示例混合數(shù)據(jù)建模方案
5.2 基于課程學(xué)習(xí)的方案優(yōu)化方法
5.2.1 基于示例難度的建模
5.2.2 基于多示例學(xué)習(xí)的建模
5.3 本章小結(jié)
第六章 模型的測(cè)試與分析
6.1 實(shí)驗(yàn)環(huán)境及必要參數(shù)
6.2 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理結(jié)果
6.2.1 文本分詞及詞典構(gòu)建結(jié)果
6.2.2 語(yǔ)料重編碼
6.2.3 詞向量的預(yù)訓(xùn)練結(jié)果
6.2.4 數(shù)據(jù)包組織及必要限制
6.3 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
6.3.1 準(zhǔn)確率
6.3.2 BLEU值
6.3.3 ROUGE值
6.4 基于多示例的方案實(shí)驗(yàn)
6.4.1 主體實(shí)驗(yàn)結(jié)果及分析
6.4.2 長(zhǎng)度正則效果對(duì)比及分析
6.4.3 答案生成實(shí)體包含情況分析
6.4.4 注意力機(jī)制效果分析
6.4.5 結(jié)果案例展示及錯(cuò)誤分析
6.5 課程學(xué)習(xí)優(yōu)化實(shí)驗(yàn)
6.6 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)圖譜的發(fā)展與構(gòu)建[J]. 李濤,王次臣,李華康. 南京理工大學(xué)學(xué)報(bào). 2017(01)
本文編號(hào):3639124
【文章來(lái)源】:北京郵電大學(xué)北京市211工程院校教育部直屬院校
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究創(chuàng)新點(diǎn)總結(jié)
1.4 論文組織結(jié)構(gòu)
第二章 背景理論及相關(guān)技術(shù)介紹
2.1 端到端的序列生成模型
2.1.1 長(zhǎng)短時(shí)記憶單元(LSTM)
2.1.2 序列到序列生成模型(Seq2Seq)
2.2 基于知識(shí)庫(kù)的自然問答背景及現(xiàn)狀
2.2.1 問答系統(tǒng)
2.2.2 基于知識(shí)庫(kù)的問答
2.2.3 自然問答生成
2.3 多示例算法簡(jiǎn)介
2.4 常用注意力機(jī)制模型簡(jiǎn)介
2.4.1 自注意力機(jī)制
2.4.2 選擇注意力機(jī)制
2.5 社區(qū)問答數(shù)據(jù)的應(yīng)用簡(jiǎn)介
2.6 課程學(xué)習(xí)算法簡(jiǎn)介
2.7 本章小結(jié)
第三章 需求與關(guān)鍵問題分析
3.1 需求概述
3.2 數(shù)據(jù)特點(diǎn)與分析
3.3 基于自然答案生成模型的需求與難點(diǎn)分析
3.3.1 基線模型COREQA原理
3.3.2 自然答案生成模型的需求分析
3.3.3 基于多示例算法的難點(diǎn)分析
3.4 基于注意力機(jī)制的難點(diǎn)分析
3.5 課程學(xué)習(xí)問題轉(zhuǎn)化
3.6 本章小結(jié)
第四章 多示例方案建模自然問答
4.1 數(shù)據(jù)預(yù)處理
4.1.1 數(shù)據(jù)格式規(guī)范化
4.1.2 數(shù)據(jù)包組織
4.2 模型整體方案設(shè)計(jì)
4.3 基于多示例的損失函數(shù)的優(yōu)化與注意力機(jī)制的結(jié)合
4.3.1 基于知識(shí)庫(kù)的問答的多示例損失函數(shù)
4.4 權(quán)重賦值方案詳細(xì)設(shè)計(jì)
4.4.1 單示例選擇
4.4.2 預(yù)先賦權(quán)
4.4.3 基于選擇注意力賦權(quán)
4.4.4 基于自注意力賦權(quán)
4.5 本章小結(jié)
第五章 基于課程學(xué)習(xí)的方案優(yōu)化
5.1 單示例多示例混合數(shù)據(jù)建模方案
5.2 基于課程學(xué)習(xí)的方案優(yōu)化方法
5.2.1 基于示例難度的建模
5.2.2 基于多示例學(xué)習(xí)的建模
5.3 本章小結(jié)
第六章 模型的測(cè)試與分析
6.1 實(shí)驗(yàn)環(huán)境及必要參數(shù)
6.2 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理結(jié)果
6.2.1 文本分詞及詞典構(gòu)建結(jié)果
6.2.2 語(yǔ)料重編碼
6.2.3 詞向量的預(yù)訓(xùn)練結(jié)果
6.2.4 數(shù)據(jù)包組織及必要限制
6.3 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
6.3.1 準(zhǔn)確率
6.3.2 BLEU值
6.3.3 ROUGE值
6.4 基于多示例的方案實(shí)驗(yàn)
6.4.1 主體實(shí)驗(yàn)結(jié)果及分析
6.4.2 長(zhǎng)度正則效果對(duì)比及分析
6.4.3 答案生成實(shí)體包含情況分析
6.4.4 注意力機(jī)制效果分析
6.4.5 結(jié)果案例展示及錯(cuò)誤分析
6.5 課程學(xué)習(xí)優(yōu)化實(shí)驗(yàn)
6.6 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)圖譜的發(fā)展與構(gòu)建[J]. 李濤,王次臣,李華康. 南京理工大學(xué)學(xué)報(bào). 2017(01)
本文編號(hào):3639124
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3639124.html
最近更新
教材專著