基于檢索和答案生成混合的問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-05-06 02:07
隨著信息技術(shù)的飛速發(fā)展和互聯(lián)網(wǎng)的普及,每個(gè)人都可以方便地從互聯(lián)網(wǎng)上獲取海量的信息。然而海量的數(shù)據(jù)也帶來了信息爆炸和信息過載的巨大挑戰(zhàn),使得人們陷入了海量數(shù)據(jù)的汪洋之中,信息的精確定位變得越來越困難。搜索引擎的出現(xiàn),一定程度上緩解了這些挑戰(zhàn)帶來的問題。然而,傳統(tǒng)的搜索引擎沒有挖掘查詢更深層次的語義信息,且用戶仍需以人工遍歷的方式定位信息,費(fèi)時(shí)且費(fèi)力。問答系統(tǒng)的出現(xiàn),為信息的精確定位提供了一種全新的解決方案。通過問答系統(tǒng),用戶能以自然語言的方式表達(dá)自己的信息需求,系統(tǒng)將直接返回精確、簡潔的答案。當(dāng)前,問答系統(tǒng)常用的模型主要為基于檢索的模型和基于答案生成的模型。基于檢索的模型有匹配模型簡單、答案在語料庫中、可解釋性強(qiáng)等優(yōu)點(diǎn);但由于語料庫大小的限制,導(dǎo)致能回答的問題具有局限性,對問題的語義信息挖掘不足。基于答案生成的模型可以通過挖掘問題的深層語義生成答案,答案可以不受語料庫的規(guī)模限制,但模型的可解釋性不強(qiáng),且傾向于生成通用的、單調(diào)的答案,無法保證答案的合理性和一致性。對于問答系統(tǒng)而言,由于語料庫數(shù)據(jù)形式的不同,需要采用的技術(shù)也不相同。而在大多數(shù)情況下,語料庫數(shù)據(jù)形式又以自由文本和問題答案對數(shù)據(jù)...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 問答系統(tǒng)的研究背景與意義
1.2 本文工作概述
1.2.1 基于檢索的問答系統(tǒng)
1.2.2 基于檢索和答案生成混合的問答系統(tǒng)
1.3 本文組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 問答系統(tǒng)相關(guān)綜述
2.1 問答系統(tǒng)的理論背景
2.1.1 問答系統(tǒng)的定義
2.1.2 問答系統(tǒng)的發(fā)展
2.1.3 問答系統(tǒng)的分類
2.2 問答系統(tǒng)的相關(guān)技術(shù)概述
2.2.1 Word2Vec
2.2.2 Paragraph2 Vector模型
2.2.3 Learn to rank模型
2.2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.5 注意力機(jī)制
2.3 問答系統(tǒng)的研究現(xiàn)狀
2.3.1 HRED
2.3.2 VHRED
2.4 本章小結(jié)
第3章 基于檢索的問答系統(tǒng)
3.1 問題描述
3.2 系統(tǒng)整體架構(gòu)
3.3 問題分析
3.3.1 問題預(yù)處理
3.3.2 關(guān)鍵詞提取和拓展
3.4 信息檢索
3.4.1 文本提取和段落分割
3.4.2 知識(shí)庫構(gòu)建
3.5 答案排序
3.5.1 語義特征提取
3.5.2 排序模型
3.6 本章小結(jié)
第4章 基于檢索和答案生成混合的問答系統(tǒng)
4.1 問題描述
4.2 系統(tǒng)結(jié)構(gòu)
4.3 信息檢索模型
4.3.1 知識(shí)庫構(gòu)建
4.3.2 相似度計(jì)算模型
4.4 答案生成模型
4.4.1 模型結(jié)構(gòu)
4.4.2 答案生成
4.5 重排序模型
4.5.1 模型結(jié)構(gòu)
4.5.2 打分函數(shù)
4.6 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 基于檢索的問答系統(tǒng)的實(shí)驗(yàn)
5.1.1 數(shù)據(jù)來源和數(shù)據(jù)預(yù)處理
5.1.2 實(shí)驗(yàn)環(huán)境
5.1.3 評價(jià)指標(biāo)
5.1.4 實(shí)驗(yàn)設(shè)置
5.1.5 實(shí)驗(yàn)結(jié)果及分析
5.2 基于檢索和答案生成混合的問答系統(tǒng)的實(shí)驗(yàn)
5.2.1 數(shù)據(jù)來源及數(shù)據(jù)預(yù)處理
5.2.2 實(shí)驗(yàn)環(huán)境
5.2.3 評價(jià)指標(biāo)
5.2.4 實(shí)驗(yàn)設(shè)置
5.2.5 實(shí)驗(yàn)參數(shù)
5.2.6 實(shí)驗(yàn)結(jié)果及分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 未來展望
6.3 本章小結(jié)
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]問答系統(tǒng)研究綜述[J]. 毛先領(lǐng),李曉明. 計(jì)算機(jī)科學(xué)與探索. 2012(03)
本文編號(hào):3171026
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 問答系統(tǒng)的研究背景與意義
1.2 本文工作概述
1.2.1 基于檢索的問答系統(tǒng)
1.2.2 基于檢索和答案生成混合的問答系統(tǒng)
1.3 本文組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 問答系統(tǒng)相關(guān)綜述
2.1 問答系統(tǒng)的理論背景
2.1.1 問答系統(tǒng)的定義
2.1.2 問答系統(tǒng)的發(fā)展
2.1.3 問答系統(tǒng)的分類
2.2 問答系統(tǒng)的相關(guān)技術(shù)概述
2.2.1 Word2Vec
2.2.2 Paragraph2 Vector模型
2.2.3 Learn to rank模型
2.2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.5 注意力機(jī)制
2.3 問答系統(tǒng)的研究現(xiàn)狀
2.3.1 HRED
2.3.2 VHRED
2.4 本章小結(jié)
第3章 基于檢索的問答系統(tǒng)
3.1 問題描述
3.2 系統(tǒng)整體架構(gòu)
3.3 問題分析
3.3.1 問題預(yù)處理
3.3.2 關(guān)鍵詞提取和拓展
3.4 信息檢索
3.4.1 文本提取和段落分割
3.4.2 知識(shí)庫構(gòu)建
3.5 答案排序
3.5.1 語義特征提取
3.5.2 排序模型
3.6 本章小結(jié)
第4章 基于檢索和答案生成混合的問答系統(tǒng)
4.1 問題描述
4.2 系統(tǒng)結(jié)構(gòu)
4.3 信息檢索模型
4.3.1 知識(shí)庫構(gòu)建
4.3.2 相似度計(jì)算模型
4.4 答案生成模型
4.4.1 模型結(jié)構(gòu)
4.4.2 答案生成
4.5 重排序模型
4.5.1 模型結(jié)構(gòu)
4.5.2 打分函數(shù)
4.6 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 基于檢索的問答系統(tǒng)的實(shí)驗(yàn)
5.1.1 數(shù)據(jù)來源和數(shù)據(jù)預(yù)處理
5.1.2 實(shí)驗(yàn)環(huán)境
5.1.3 評價(jià)指標(biāo)
5.1.4 實(shí)驗(yàn)設(shè)置
5.1.5 實(shí)驗(yàn)結(jié)果及分析
5.2 基于檢索和答案生成混合的問答系統(tǒng)的實(shí)驗(yàn)
5.2.1 數(shù)據(jù)來源及數(shù)據(jù)預(yù)處理
5.2.2 實(shí)驗(yàn)環(huán)境
5.2.3 評價(jià)指標(biāo)
5.2.4 實(shí)驗(yàn)設(shè)置
5.2.5 實(shí)驗(yàn)參數(shù)
5.2.6 實(shí)驗(yàn)結(jié)果及分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 未來展望
6.3 本章小結(jié)
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]問答系統(tǒng)研究綜述[J]. 毛先領(lǐng),李曉明. 計(jì)算機(jī)科學(xué)與探索. 2012(03)
本文編號(hào):3171026
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3171026.html
最近更新
教材專著