保險(xiǎn)條款文本結(jié)構(gòu)化系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2022-08-09 18:30
近年來(lái),自然語(yǔ)言處理技術(shù)的不斷發(fā)展使得文本結(jié)構(gòu)化系統(tǒng)在不同知識(shí)領(lǐng)域得到了廣泛應(yīng)用。諸如醫(yī)療、新聞等領(lǐng)域的文本結(jié)構(gòu)化研究已經(jīng)取得了較大突破,而在保險(xiǎn)領(lǐng)域尚未出現(xiàn)較成熟的文本結(jié)構(gòu)化系統(tǒng)。由于專(zhuān)業(yè)知識(shí)的不同以及文本內(nèi)容描述形式的不同,目前還不具備一個(gè)通用的文本結(jié)構(gòu)化系統(tǒng)滿足各個(gè)領(lǐng)域信息抽取的需求。保險(xiǎn)文本獨(dú)特的語(yǔ)言風(fēng)格,使得面向保險(xiǎn)領(lǐng)域的文本結(jié)構(gòu)化系統(tǒng)研究仍存在著新的挑戰(zhàn)。保險(xiǎn)條款是保險(xiǎn)購(gòu)買(mǎi)人以及保險(xiǎn)公司雙方確立的有關(guān)權(quán)利與義務(wù)的條文,其核心內(nèi)容保障責(zé)任描述了保險(xiǎn)公司承擔(dān)的責(zé)任范圍,以及被保險(xiǎn)人發(fā)生保險(xiǎn)事故時(shí)保險(xiǎn)公司應(yīng)負(fù)的賠償責(zé)任。將該非結(jié)構(gòu)化的文本進(jìn)行結(jié)構(gòu)化處理有助于實(shí)現(xiàn)用戶對(duì)保障責(zé)任內(nèi)容的快速閱讀以及有效理解。本文提出了面向保險(xiǎn)領(lǐng)域的保險(xiǎn)條款文本結(jié)構(gòu)化方法,并以此作為支撐構(gòu)建了保險(xiǎn)條款文本結(jié)構(gòu)化原型系統(tǒng),模擬提出的算法在實(shí)際的保障責(zé)任條件查詢過(guò)程中系統(tǒng)的應(yīng)用場(chǎng)景。本文主要內(nèi)容包括以下幾個(gè)部分:(1)通過(guò)網(wǎng)絡(luò)爬蟲(chóng)采集各個(gè)保險(xiǎn)公司的保險(xiǎn)條款原始PDF文件,并針對(duì)不同文本格式的PDF文件設(shè)計(jì)不同的文件解析策略以獲取保險(xiǎn)條款中保障責(zé)任文本內(nèi)容;(2)本文提出了應(yīng)用于非結(jié)構(gòu)化的保障責(zé)任文本數(shù)據(jù)的結(jié)...
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
新聞?lì)I(lǐng)域的文本結(jié)構(gòu)化系統(tǒng)
保險(xiǎn)條款PDF文件文本結(jié)構(gòu)1
保險(xiǎn)條款PDF文件文本結(jié)構(gòu)2對(duì)于兩種保險(xiǎn)條款PDF文件的文本結(jié)構(gòu),都先使用python的PDFMiner包將其轉(zhuǎn)換為XML文件
【參考文獻(xiàn)】:
期刊論文
[1]自然語(yǔ)言處理概述及應(yīng)用[J]. 王澤宇. 通訊世界. 2019(04)
[2]一種健康醫(yī)療保險(xiǎn)格式條款的結(jié)構(gòu)化處理方法[J]. 張晶晶,杜明. 智能計(jì)算機(jī)與應(yīng)用. 2018(03)
[3]計(jì)算機(jī)人工智能技術(shù)的應(yīng)用與發(fā)展[J]. 張儲(chǔ)祺. 電子世界. 2017(02)
[4]信息抽取研究綜述[J]. 郭喜躍,何婷婷. 計(jì)算機(jī)科學(xué). 2015(02)
[5]基于GATE的油田信息抽取技術(shù)研究[J]. 文必龍,李云靜,王琪超,金宗澤,高快. 計(jì)算機(jī)與數(shù)字工程. 2014(07)
博士論文
[1]基于深度置信網(wǎng)絡(luò)的中文信息抽取方法[D]. 陳宇.哈爾濱工業(yè)大學(xué) 2014
碩士論文
[1]醫(yī)學(xué)CT報(bào)告文本結(jié)構(gòu)化處理研究[D]. 劉清星.湖南大學(xué) 2018
[2]我國(guó)互聯(lián)網(wǎng)保險(xiǎn)發(fā)展研究[D]. 王寧.廣西大學(xué) 2017
[3]中文電子病歷信息抽取關(guān)鍵技術(shù)研究[D]. 于楠.北京工業(yè)大學(xué) 2017
本文編號(hào):3673062
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
新聞?lì)I(lǐng)域的文本結(jié)構(gòu)化系統(tǒng)
保險(xiǎn)條款PDF文件文本結(jié)構(gòu)1
保險(xiǎn)條款PDF文件文本結(jié)構(gòu)2對(duì)于兩種保險(xiǎn)條款PDF文件的文本結(jié)構(gòu),都先使用python的PDFMiner包將其轉(zhuǎn)換為XML文件
【參考文獻(xiàn)】:
期刊論文
[1]自然語(yǔ)言處理概述及應(yīng)用[J]. 王澤宇. 通訊世界. 2019(04)
[2]一種健康醫(yī)療保險(xiǎn)格式條款的結(jié)構(gòu)化處理方法[J]. 張晶晶,杜明. 智能計(jì)算機(jī)與應(yīng)用. 2018(03)
[3]計(jì)算機(jī)人工智能技術(shù)的應(yīng)用與發(fā)展[J]. 張儲(chǔ)祺. 電子世界. 2017(02)
[4]信息抽取研究綜述[J]. 郭喜躍,何婷婷. 計(jì)算機(jī)科學(xué). 2015(02)
[5]基于GATE的油田信息抽取技術(shù)研究[J]. 文必龍,李云靜,王琪超,金宗澤,高快. 計(jì)算機(jī)與數(shù)字工程. 2014(07)
博士論文
[1]基于深度置信網(wǎng)絡(luò)的中文信息抽取方法[D]. 陳宇.哈爾濱工業(yè)大學(xué) 2014
碩士論文
[1]醫(yī)學(xué)CT報(bào)告文本結(jié)構(gòu)化處理研究[D]. 劉清星.湖南大學(xué) 2018
[2]我國(guó)互聯(lián)網(wǎng)保險(xiǎn)發(fā)展研究[D]. 王寧.廣西大學(xué) 2017
[3]中文電子病歷信息抽取關(guān)鍵技術(shù)研究[D]. 于楠.北京工業(yè)大學(xué) 2017
本文編號(hào):3673062
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3673062.html
最近更新
教材專(zhuān)著