基于BERT的保險領域問答系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2022-02-10 13:20
隨著人工智能技術的深入研究,通用領域問答系統(tǒng)已經(jīng)被人們廣泛接受。但是,由于垂直領域文本數(shù)據(jù)較少,文本表征阻礙著垂直領域問答系統(tǒng)的發(fā)展。為使在垂直領域問答系統(tǒng)更加高效準確,本文面向保險領域,提出了一種基于BERT模型的智能問答方法,并對比傳統(tǒng)方法、保險語料作者的QACNN模型和改進的QALSTM模型,證明了BERT模型在保險領域中的有效性。最后,使用保險領域問答語料,完成答案選擇任務,進而采用基于深度學習模型BERT的方法和遷移學習的策略構(gòu)建垂直領域的問答系統(tǒng)。本課題的主要工作包括:(1)分析了智能問答的背景意義和現(xiàn)狀,并在此基礎上研究智能問答涉及的基本理論和技術。(2)基于BERT模型保險領域的算法研究。首先對保險領域數(shù)據(jù)進行預處理操作,包括對數(shù)據(jù)格式的轉(zhuǎn)換、數(shù)據(jù)的分詞和去除數(shù)據(jù)的停用詞等,然后實現(xiàn)傳統(tǒng)方法和BERT模型的保險領域智能問答。此外,還比較使用不同相似度計算方式對保險領域智能問答的影響。(3)實現(xiàn)保險領域的問答系統(tǒng)。通過分析傳統(tǒng)方法、BERT模型、QACNN模型和QALSTM模型各自在實驗中的效果,選擇BERT模型以及余弦距離為相似度計算方式構(gòu)建系統(tǒng)。在win10上,以Py...
【文章來源】:北方民族大學寧夏回族自治區(qū)
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
CBOW網(wǎng)絡框架圖
學 2020 屆碩士學位論文 第二章 智能問答的基礎 one-hot 編碼與輸入權重矩陣 W 相乘即可得到詞的詞向量。Skip-gram 模型gram 模型是根據(jù)當前詞推斷前后信息,與 CBOW 模型的結(jié)構(gòu)大致相同, 模型在投影層不需做求和平均操作,學習目標是最大化目標函數(shù),其示: wcL log p(Context(w)|w)義與公式(2-4)一致。絡結(jié)構(gòu)如圖 2-2 所示:
圖 2-3 未加入注意力機制的 Encoder-Decoder 框架入注意力機制后的框架見圖 2-4 所示:圖 2-4 加入注意力機制的 Encoder-Decoder 框架體地,給定句子序列(x1,x2,x3,...,xT),其生成目標 yt的模型圖形說明
【參考文獻】:
期刊論文
[1]自然語言處理發(fā)展及應用綜述[J]. 趙京勝,宋夢雪,高祥. 信息技術與信息化. 2019(07)
[2]問答系統(tǒng)研究綜述[J]. 吳靈慧. 科技傳播. 2019(05)
[3]社區(qū)問答網(wǎng)站中問題的刻面組織方法——以知乎網(wǎng)站為例[J]. 何緋娟,郭朝彤,吳蓓,繆相林,劉均. 情報雜志. 2018(03)
[4]AI機器人媒介角色的擬人化現(xiàn)象與思考——以微軟小冰為例[J]. 李楓,謝鵬飛. 現(xiàn)代視聽. 2018(02)
[5]從平臺到社區(qū)——網(wǎng)絡社區(qū)問答的演變研究[J]. 謝新洲,黃楊. 出版科學. 2018(01)
[6]問答社區(qū)用戶生成資源行為及影響因素分析——以百度知道為例[J]. 袁毅,楊莉. 圖書情報工作. 2017(22)
[7]面向限定領域問答系統(tǒng)的自然語言理解方法綜述[J]. 王東升,王衛(wèi)民,王石,符建輝,諸峰. 計算機科學. 2017(08)
[8]人工智能:概念·方法·機遇[J]. 鐘義信. 科學通報. 2017(22)
[9]基于Web的問答系統(tǒng)綜述[J]. 李舟軍,李水華. 計算機科學. 2017(06)
[10]基于詞向量的學術語義搜索研究[J]. 陳國華,湯庸,許玉贏,賀超波,肖丹陽. 華南師范大學學報(自然科學版). 2016(03)
碩士論文
[1]基于深度學習的智能問答系統(tǒng)研究[D]. 邢世樣.北京郵電大學 2017
本文編號:3618960
【文章來源】:北方民族大學寧夏回族自治區(qū)
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
CBOW網(wǎng)絡框架圖
學 2020 屆碩士學位論文 第二章 智能問答的基礎 one-hot 編碼與輸入權重矩陣 W 相乘即可得到詞的詞向量。Skip-gram 模型gram 模型是根據(jù)當前詞推斷前后信息,與 CBOW 模型的結(jié)構(gòu)大致相同, 模型在投影層不需做求和平均操作,學習目標是最大化目標函數(shù),其示: wcL log p(Context(w)|w)義與公式(2-4)一致。絡結(jié)構(gòu)如圖 2-2 所示:
圖 2-3 未加入注意力機制的 Encoder-Decoder 框架入注意力機制后的框架見圖 2-4 所示:圖 2-4 加入注意力機制的 Encoder-Decoder 框架體地,給定句子序列(x1,x2,x3,...,xT),其生成目標 yt的模型圖形說明
【參考文獻】:
期刊論文
[1]自然語言處理發(fā)展及應用綜述[J]. 趙京勝,宋夢雪,高祥. 信息技術與信息化. 2019(07)
[2]問答系統(tǒng)研究綜述[J]. 吳靈慧. 科技傳播. 2019(05)
[3]社區(qū)問答網(wǎng)站中問題的刻面組織方法——以知乎網(wǎng)站為例[J]. 何緋娟,郭朝彤,吳蓓,繆相林,劉均. 情報雜志. 2018(03)
[4]AI機器人媒介角色的擬人化現(xiàn)象與思考——以微軟小冰為例[J]. 李楓,謝鵬飛. 現(xiàn)代視聽. 2018(02)
[5]從平臺到社區(qū)——網(wǎng)絡社區(qū)問答的演變研究[J]. 謝新洲,黃楊. 出版科學. 2018(01)
[6]問答社區(qū)用戶生成資源行為及影響因素分析——以百度知道為例[J]. 袁毅,楊莉. 圖書情報工作. 2017(22)
[7]面向限定領域問答系統(tǒng)的自然語言理解方法綜述[J]. 王東升,王衛(wèi)民,王石,符建輝,諸峰. 計算機科學. 2017(08)
[8]人工智能:概念·方法·機遇[J]. 鐘義信. 科學通報. 2017(22)
[9]基于Web的問答系統(tǒng)綜述[J]. 李舟軍,李水華. 計算機科學. 2017(06)
[10]基于詞向量的學術語義搜索研究[J]. 陳國華,湯庸,許玉贏,賀超波,肖丹陽. 華南師范大學學報(自然科學版). 2016(03)
碩士論文
[1]基于深度學習的智能問答系統(tǒng)研究[D]. 邢世樣.北京郵電大學 2017
本文編號:3618960
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3618960.html
最近更新
教材專著