基于非結構化文本的自動問答系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2023-06-01 20:04
近幾年隨著移動互聯(lián)網(wǎng)和大數(shù)據(jù)時代的快速發(fā)展,非結構化的網(wǎng)頁和各垂直領域的文檔急劇積累,基于非結構化文本的自動問答作為信息檢索的高級形式,通過解析用戶的真實意圖,從檢索到的文檔中抽取簡潔準確的答案,近幾年逐漸成為研究熱點。然而,當前大多公開的研究工作還存在諸多問題:1)問答場景下問句和文檔長度嚴重失衡,信息檢索模塊中缺乏細粒度語義層面的相似度匹配,難以滿足精準化檢索需求;2)中文場景下,主流機器閱讀理解模型未得到充分驗證,性能存在提升空間,3)當前大規(guī)模非結構化文本自動問答技術不夠成熟,針對某一垂直領域的應用平臺相對較少。本文圍繞非結構化文本自動問答系統(tǒng)中的文檔信息檢索和答案抽取的關鍵技術,進行算法優(yōu)化和系統(tǒng)實現(xiàn)。主要研究工作包括:(1)提出了一種基于層疊注意力機制的語義相似度匹配模型(Deep-HAN-Matching),解決了問答場景下檢索和文檔長度嚴重失衡導致語義相似度匹配困難的問題,從詞維度和句子維度利用注意力機制逐層抽象、抽取特征,在WikiQA公開數(shù)據(jù)集上相比主流基線模型性能提升明顯;(2)提出了一種利用門限卷積神經(jīng)網(wǎng)絡和自注意力機制改進BiDAF的機器閱讀理解模型(BiDA...
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 文檔信息檢索的國內外研究現(xiàn)狀
1.2.2 基于機器閱讀理解答案抽取的國內外研究現(xiàn)狀
1.2.3 非結構化文本自動問答應用的國內外研究現(xiàn)狀
1.3 本文主要研究內容和創(chuàng)新點
1.4 碩士在讀期間主要完成工作
1.5 本文組織結構
第二章 非結構化文本自動問答系統(tǒng)的研究綜述
2.1 非結構化文本自動問答系統(tǒng)的整體架構
2.2 文檔信息檢索的關鍵技術研究
2.2.1 傳統(tǒng)文檔信息檢索算法
2.2.2 基于深度學習的文檔信息檢索算法
2.2.3 小結
2.3 答案抽取的關鍵技術研究
2.3.1 基于規(guī)則的答案抽取算法
2.3.2 基于機器閱讀理解的答案抽取算法
2.3.3 小結
2.4 問答系統(tǒng)中的常用評價指標
2.4.1 文檔信息檢索的評價指標
2.4.2 自動問答的評價指標
2.5 本章小結
第三章 融合語義相似度匹配的文檔信息檢索算法
3.1 具體研究挑戰(zhàn)
3.2 解決方案
3.3 基于層疊注意力機制的語義相似度匹配算法的研究與實現(xiàn)
3.3.1 模型整體架構
3.3.2 關鍵技術
3.4 實驗設置與結果分析
3.5 本章小結
第四章 基于BiDAF改進的機器閱讀理解答案抽取算法
4.1 具體研究挑戰(zhàn)
4.2 解決方案
4.3 基于BiDAF改進的機器閱讀理解算法的研究與實現(xiàn)
4.3.1 模型整體架構
4.3.2 關鍵技術
4.4 實驗設置與結果分析
4.5 本章小結
第五章 臨床醫(yī)學領域自動問答系統(tǒng)的研究與實現(xiàn)
5.1 研究目的和需求分析
5.1.1 研究目的
5.1.2 需求分析
5.2 臨床醫(yī)學數(shù)據(jù)集構建
5.3 系統(tǒng)整體架構和處理流程
5.4 系統(tǒng)測試和結果分析
5.4.1 語義相似度匹配實驗與結果分析
5.4.2 機器閱讀理解實驗與結果分析
5.4.3 問答系統(tǒng)運行測試和結果分析
5.4.4 臨床醫(yī)學執(zhí)業(yè)醫(yī)師考試測試與結果分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 研究展望
參考文獻
致謝
攻讀學位期間取得的研究成果
本文編號:3826957
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 文檔信息檢索的國內外研究現(xiàn)狀
1.2.2 基于機器閱讀理解答案抽取的國內外研究現(xiàn)狀
1.2.3 非結構化文本自動問答應用的國內外研究現(xiàn)狀
1.3 本文主要研究內容和創(chuàng)新點
1.4 碩士在讀期間主要完成工作
1.5 本文組織結構
第二章 非結構化文本自動問答系統(tǒng)的研究綜述
2.1 非結構化文本自動問答系統(tǒng)的整體架構
2.2 文檔信息檢索的關鍵技術研究
2.2.1 傳統(tǒng)文檔信息檢索算法
2.2.2 基于深度學習的文檔信息檢索算法
2.2.3 小結
2.3 答案抽取的關鍵技術研究
2.3.1 基于規(guī)則的答案抽取算法
2.3.2 基于機器閱讀理解的答案抽取算法
2.3.3 小結
2.4 問答系統(tǒng)中的常用評價指標
2.4.1 文檔信息檢索的評價指標
2.4.2 自動問答的評價指標
2.5 本章小結
第三章 融合語義相似度匹配的文檔信息檢索算法
3.1 具體研究挑戰(zhàn)
3.2 解決方案
3.3 基于層疊注意力機制的語義相似度匹配算法的研究與實現(xiàn)
3.3.1 模型整體架構
3.3.2 關鍵技術
3.4 實驗設置與結果分析
3.5 本章小結
第四章 基于BiDAF改進的機器閱讀理解答案抽取算法
4.1 具體研究挑戰(zhàn)
4.2 解決方案
4.3 基于BiDAF改進的機器閱讀理解算法的研究與實現(xiàn)
4.3.1 模型整體架構
4.3.2 關鍵技術
4.4 實驗設置與結果分析
4.5 本章小結
第五章 臨床醫(yī)學領域自動問答系統(tǒng)的研究與實現(xiàn)
5.1 研究目的和需求分析
5.1.1 研究目的
5.1.2 需求分析
5.2 臨床醫(yī)學數(shù)據(jù)集構建
5.3 系統(tǒng)整體架構和處理流程
5.4 系統(tǒng)測試和結果分析
5.4.1 語義相似度匹配實驗與結果分析
5.4.2 機器閱讀理解實驗與結果分析
5.4.3 問答系統(tǒng)運行測試和結果分析
5.4.4 臨床醫(yī)學執(zhí)業(yè)醫(yī)師考試測試與結果分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 研究展望
參考文獻
致謝
攻讀學位期間取得的研究成果
本文編號:3826957
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3826957.html
最近更新
教材專著