健康保險(xiǎn)智能問(wèn)答問(wèn)句理解和答案檢索的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-12-31 03:51
健康保險(xiǎn)作為一個(gè)專業(yè)性較強(qiáng)、知識(shí)復(fù)雜的領(lǐng)域,大部分民眾對(duì)于保險(xiǎn)領(lǐng)域相關(guān)知識(shí)了解甚少。參保人常常對(duì)保障條件、險(xiǎn)種選擇等方面的專業(yè)詞匯產(chǎn)生理解上的困難。智能問(wèn)答技術(shù)能夠準(zhǔn)確理解用戶的查詢意圖,并準(zhǔn)確定位查詢結(jié)果。成為了人工智能領(lǐng)域的重要研究方向之一。本文主要針對(duì)健康保險(xiǎn)智能問(wèn)答系統(tǒng)展開(kāi)研究,對(duì)健康保險(xiǎn)問(wèn)答系統(tǒng)存在的問(wèn)題和實(shí)現(xiàn)技術(shù)進(jìn)行了深入分析。從用戶查詢語(yǔ)句的理解出發(fā),基于結(jié)構(gòu)化的健康保險(xiǎn)知識(shí)庫(kù),設(shè)計(jì)一個(gè)健康保險(xiǎn)智能問(wèn)答系統(tǒng)。同時(shí)對(duì)深度學(xué)習(xí)技術(shù)進(jìn)行了深入研究,并將深度學(xué)習(xí)的相關(guān)算法應(yīng)用在智能問(wèn)答系統(tǒng)中,以提高系統(tǒng)的準(zhǔn)確率。本文的主要研究?jī)?nèi)容和貢獻(xiàn)如下:(1)構(gòu)建保險(xiǎn)文檔采集與質(zhì)量控制模塊在保險(xiǎn)條款的采集過(guò)程中存在的大量“異名同款”、“一款多名”等數(shù)據(jù)質(zhì)量不高的問(wèn)題。本文基于字符串相似度匹配,結(jié)合人工篩選搭建保險(xiǎn)條款采集和質(zhì)量控制模塊。一定程度上的避免了數(shù)據(jù)冗余,提高了結(jié)構(gòu)化保險(xiǎn)數(shù)據(jù)的質(zhì)量。(2)設(shè)計(jì)并實(shí)現(xiàn)了保險(xiǎn)領(lǐng)域智能問(wèn)答的問(wèn)句理解和答案檢索查找相似問(wèn)句答案的智能問(wèn)答方法無(wú)法更好的理解用戶查詢意圖,且需要大量的人力構(gòu)建FAQ庫(kù)。針對(duì)這一問(wèn)題,本文通過(guò)自然語(yǔ)言技術(shù)理解用戶問(wèn)句,基于結(jié)構(gòu)化的保...
【文章來(lái)源】:東華大學(xué)上海市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
檢索結(jié)果
健康保險(xiǎn)智能問(wèn)答問(wèn)句理解和答案檢索的研究與實(shí)根據(jù)圖 1-1 所示的搜索結(jié)果來(lái)看,檢索結(jié)果內(nèi)包含了廣告信息。且前 10索結(jié)果中有一半的結(jié)果返回的是該保險(xiǎn)的保險(xiǎn)條款,存在大量的重復(fù)信息。 1-2 的保險(xiǎn)條款所示,用戶需要閱讀大量的條款信息,再?gòu)谋kU(xiǎn)條款中找到索的答案:“投保年齡在 28 天到 65 歲之間”。這個(gè)過(guò)程需要花費(fèi)用戶的大間從保險(xiǎn)條款進(jìn)行結(jié)果篩選,對(duì)于用戶的保險(xiǎn)領(lǐng)域知識(shí)水平也有一定程度上求。其次,檢索的前 10 條查詢結(jié)果中還存在有少量無(wú)關(guān)信息,這些無(wú)關(guān)信排除也會(huì)花費(fèi)用戶一定的時(shí)間,而實(shí)際相關(guān)程度最高的搜索結(jié)果排在最后一
即第一字的標(biāo)注的概率;A 表示狀態(tài)轉(zhuǎn)移概率,即從一個(gè)標(biāo)記的概率;B 表示給定狀態(tài)下的觀察值概率矩陣,這個(gè)概HMM 還有三個(gè)假設(shè),有限歷史性假設(shè)、狀態(tài)與時(shí)間無(wú)關(guān)假設(shè)無(wú)關(guān)假設(shè)。具體公式表達(dá)如下公式(2-1)所示。p s s , s , … s = p s s P s s = p(s , s ) P o , … o s , … s = P(o |q )M 完成實(shí)體識(shí)別時(shí),需要依次解決三個(gè)問(wèn)題。首先做基于已知π),計(jì)算所有概率的乘積,求得某個(gè)觀察序列的概率值。再通過(guò)觀察序列最可能的標(biāo)記狀態(tài)。Viterbi 算法是一個(gè)動(dòng)態(tài)規(guī)劃算法 上的最短路徑,也就是概率值最大的標(biāo)記狀態(tài)序列。第三個(gè)是標(biāo)注好的語(yǔ)料下,如何通過(guò)學(xué)習(xí)這些語(yǔ)料,學(xué)習(xí) HMM 網(wǎng)絡(luò)中π),提高 HMM 模型的識(shí)別效率。北京理工大學(xué)的樂(lè)娟通過(guò)隱MM)對(duì)切分的文本進(jìn)行詞性標(biāo)注。再根據(jù)人工定制的規(guī)則模邊界,提取新詞。在京劇機(jī)構(gòu)名的識(shí)別中取得了 99%的正確率
【參考文獻(xiàn)】:
期刊論文
[1]基于RNN的網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)方法[J]. 胡昕. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(06)
[2]編輯距離算法在中文文本相似度計(jì)算中的優(yōu)化與實(shí)現(xiàn)[J]. 陳正銘,霍英. 韶關(guān)學(xué)院學(xué)報(bào). 2015(12)
[3]基于HMM的京劇機(jī)構(gòu)命名實(shí)體識(shí)別算法[J]. 樂(lè)娟,趙璽. 計(jì)算機(jī)工程. 2013(06)
[4]問(wèn)答系統(tǒng)研究綜述[J]. 毛先領(lǐng),李曉明. 計(jì)算機(jī)科學(xué)與探索. 2012(03)
[5]命名實(shí)體識(shí)別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[6]基于概率統(tǒng)計(jì)技術(shù)和規(guī)則方法的新詞發(fā)現(xiàn)[J]. 賈自艷,史忠植. 計(jì)算機(jī)工程. 2004(20)
[7]校園導(dǎo)航系統(tǒng)Easy Nav的設(shè)計(jì)與實(shí)現(xiàn)[J]. 黃寅飛,鄭方,燕鵬舉,徐明星,吳文虎. 中文信息學(xué)報(bào). 2001(04)
碩士論文
[1]健康中國(guó)視角的商業(yè)健康保險(xiǎn)發(fā)展研究[D]. 梁新雨.廣西大學(xué) 2017
[2]受限領(lǐng)域內(nèi)基于中文問(wèn)句語(yǔ)義相關(guān)度計(jì)算的智能問(wèn)答系統(tǒng)研究[D]. 王新磊.山東財(cái)經(jīng)大學(xué) 2014
[3]面向養(yǎng)老保險(xiǎn)領(lǐng)域的問(wèn)答系統(tǒng)關(guān)鍵技術(shù)研究[D]. 隗夢(mèng)夕.哈爾濱工程大學(xué) 2013
[4]基于編輯距離的近似字符串匹配及其優(yōu)化技術(shù)[D]. 王業(yè).東北大學(xué) 2012
[5]傳統(tǒng)搜索引擎與智能搜索引擎比較研究[D]. 張騫.鄭州大學(xué) 2012
[6]基于規(guī)則的命名實(shí)體識(shí)別研究[D]. 周昆.合肥工業(yè)大學(xué) 2010
[7]限定領(lǐng)域內(nèi)智能問(wèn)答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 王銀麗.內(nèi)蒙古大學(xué) 2008
[8]基于支持向量機(jī)的中文組織機(jī)構(gòu)名識(shí)別[D]. 陳霄.上海交通大學(xué) 2007
本文編號(hào):3559566
【文章來(lái)源】:東華大學(xué)上海市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
檢索結(jié)果
健康保險(xiǎn)智能問(wèn)答問(wèn)句理解和答案檢索的研究與實(shí)根據(jù)圖 1-1 所示的搜索結(jié)果來(lái)看,檢索結(jié)果內(nèi)包含了廣告信息。且前 10索結(jié)果中有一半的結(jié)果返回的是該保險(xiǎn)的保險(xiǎn)條款,存在大量的重復(fù)信息。 1-2 的保險(xiǎn)條款所示,用戶需要閱讀大量的條款信息,再?gòu)谋kU(xiǎn)條款中找到索的答案:“投保年齡在 28 天到 65 歲之間”。這個(gè)過(guò)程需要花費(fèi)用戶的大間從保險(xiǎn)條款進(jìn)行結(jié)果篩選,對(duì)于用戶的保險(xiǎn)領(lǐng)域知識(shí)水平也有一定程度上求。其次,檢索的前 10 條查詢結(jié)果中還存在有少量無(wú)關(guān)信息,這些無(wú)關(guān)信排除也會(huì)花費(fèi)用戶一定的時(shí)間,而實(shí)際相關(guān)程度最高的搜索結(jié)果排在最后一
即第一字的標(biāo)注的概率;A 表示狀態(tài)轉(zhuǎn)移概率,即從一個(gè)標(biāo)記的概率;B 表示給定狀態(tài)下的觀察值概率矩陣,這個(gè)概HMM 還有三個(gè)假設(shè),有限歷史性假設(shè)、狀態(tài)與時(shí)間無(wú)關(guān)假設(shè)無(wú)關(guān)假設(shè)。具體公式表達(dá)如下公式(2-1)所示。p s s , s , … s = p s s P s s = p(s , s ) P o , … o s , … s = P(o |q )M 完成實(shí)體識(shí)別時(shí),需要依次解決三個(gè)問(wèn)題。首先做基于已知π),計(jì)算所有概率的乘積,求得某個(gè)觀察序列的概率值。再通過(guò)觀察序列最可能的標(biāo)記狀態(tài)。Viterbi 算法是一個(gè)動(dòng)態(tài)規(guī)劃算法 上的最短路徑,也就是概率值最大的標(biāo)記狀態(tài)序列。第三個(gè)是標(biāo)注好的語(yǔ)料下,如何通過(guò)學(xué)習(xí)這些語(yǔ)料,學(xué)習(xí) HMM 網(wǎng)絡(luò)中π),提高 HMM 模型的識(shí)別效率。北京理工大學(xué)的樂(lè)娟通過(guò)隱MM)對(duì)切分的文本進(jìn)行詞性標(biāo)注。再根據(jù)人工定制的規(guī)則模邊界,提取新詞。在京劇機(jī)構(gòu)名的識(shí)別中取得了 99%的正確率
【參考文獻(xiàn)】:
期刊論文
[1]基于RNN的網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)方法[J]. 胡昕. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(06)
[2]編輯距離算法在中文文本相似度計(jì)算中的優(yōu)化與實(shí)現(xiàn)[J]. 陳正銘,霍英. 韶關(guān)學(xué)院學(xué)報(bào). 2015(12)
[3]基于HMM的京劇機(jī)構(gòu)命名實(shí)體識(shí)別算法[J]. 樂(lè)娟,趙璽. 計(jì)算機(jī)工程. 2013(06)
[4]問(wèn)答系統(tǒng)研究綜述[J]. 毛先領(lǐng),李曉明. 計(jì)算機(jī)科學(xué)與探索. 2012(03)
[5]命名實(shí)體識(shí)別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[6]基于概率統(tǒng)計(jì)技術(shù)和規(guī)則方法的新詞發(fā)現(xiàn)[J]. 賈自艷,史忠植. 計(jì)算機(jī)工程. 2004(20)
[7]校園導(dǎo)航系統(tǒng)Easy Nav的設(shè)計(jì)與實(shí)現(xiàn)[J]. 黃寅飛,鄭方,燕鵬舉,徐明星,吳文虎. 中文信息學(xué)報(bào). 2001(04)
碩士論文
[1]健康中國(guó)視角的商業(yè)健康保險(xiǎn)發(fā)展研究[D]. 梁新雨.廣西大學(xué) 2017
[2]受限領(lǐng)域內(nèi)基于中文問(wèn)句語(yǔ)義相關(guān)度計(jì)算的智能問(wèn)答系統(tǒng)研究[D]. 王新磊.山東財(cái)經(jīng)大學(xué) 2014
[3]面向養(yǎng)老保險(xiǎn)領(lǐng)域的問(wèn)答系統(tǒng)關(guān)鍵技術(shù)研究[D]. 隗夢(mèng)夕.哈爾濱工程大學(xué) 2013
[4]基于編輯距離的近似字符串匹配及其優(yōu)化技術(shù)[D]. 王業(yè).東北大學(xué) 2012
[5]傳統(tǒng)搜索引擎與智能搜索引擎比較研究[D]. 張騫.鄭州大學(xué) 2012
[6]基于規(guī)則的命名實(shí)體識(shí)別研究[D]. 周昆.合肥工業(yè)大學(xué) 2010
[7]限定領(lǐng)域內(nèi)智能問(wèn)答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 王銀麗.內(nèi)蒙古大學(xué) 2008
[8]基于支持向量機(jī)的中文組織機(jī)構(gòu)名識(shí)別[D]. 陳霄.上海交通大學(xué) 2007
本文編號(hào):3559566
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3559566.html
最近更新
教材專著