基于深度神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療文本實(shí)體識(shí)別
發(fā)布時(shí)間:2022-08-04 10:34
近年來(lái)我國(guó)的醫(yī)療產(chǎn)業(yè)朝著信息化方向快速發(fā)展,國(guó)家也大力推動(dòng)醫(yī)療產(chǎn)業(yè)互聯(lián)網(wǎng)化。全國(guó)各地醫(yī)院等醫(yī)療部門(mén)也大力推行醫(yī)院信息系統(tǒng),電子病歷開(kāi)始大量出現(xiàn)并迅速推廣,如何有效利用這些電子病歷并讓其更加推動(dòng)醫(yī)療信息化是當(dāng)前的首要任務(wù)。電子病歷是病人就醫(yī)過(guò)程中記錄的圖像,文字,數(shù)據(jù),影像等信息。并且電子病歷中一般包含著相當(dāng)多的醫(yī)療實(shí)體,具有很高的醫(yī)療價(jià)值。因此很多研究學(xué)者研究從電子病歷中識(shí)別醫(yī)療實(shí)體。本文通過(guò)深入研究電子病歷,電子病歷中通常包含病人的會(huì)診記錄,出院和住院記錄,醫(yī)生的醫(yī)囑等文本形式記錄,這些記錄里有很多的醫(yī)療信息比如患者身體信息,患者的病情,患者的檢查結(jié)果等。然而在醫(yī)療文本中存在一部分的非連續(xù)行醫(yī)療實(shí)體。這些非連續(xù)性醫(yī)療實(shí)體在實(shí)體命名識(shí)別中被忽略,基于此,本文在基于深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,改進(jìn)出一種新型方法CNN-GRU-LSTM,這個(gè)方法不僅在識(shí)別連續(xù)性醫(yī)療文本上效果較好,同時(shí)在處理非連續(xù)性醫(yī)療文本中效果也高于現(xiàn)有的實(shí)體命名識(shí)別方法。為了有效識(shí)別醫(yī)療文本中的非連續(xù)實(shí)體,本文在基于鏈?zhǔn)紺RF模型的基礎(chǔ)上,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和GRU-CRF,構(gòu)建一個(gè)新的深度神經(jīng)網(wǎng)絡(luò)。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)特征學(xué)習(xí)層...
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 相關(guān)工作研究現(xiàn)狀
1.2.1 中文實(shí)體命名識(shí)別研究現(xiàn)狀
1.2.2 醫(yī)療領(lǐng)域?qū)嶓w命名識(shí)別研究現(xiàn)狀
1.2.3 非連續(xù)文本實(shí)體命名識(shí)別研究現(xiàn)狀
1.3 本論文研究主要內(nèi)容
1.4 本論文的結(jié)構(gòu)安排
第二章 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的基本方法與技術(shù)
2.1 長(zhǎng)短序列記憶網(wǎng)絡(luò)
2.1.1 LSTM神經(jīng)網(wǎng)絡(luò)
2.1.2 雙向LSTM神經(jīng)網(wǎng)絡(luò)
2.2 門(mén)控循環(huán)單元
2.2.1 GRU神經(jīng)網(wǎng)絡(luò)
2.2.2 雙向GRU神經(jīng)網(wǎng)絡(luò)
2.3 條件隨機(jī)場(chǎng)
2.4 卷積神經(jīng)網(wǎng)絡(luò)
2.5 其他神經(jīng)網(wǎng)絡(luò)整體模型
2.5.1 LSTM-CRF神經(jīng)網(wǎng)絡(luò)模型
2.5.2 GRU-CRF神經(jīng)網(wǎng)絡(luò)模型
2.6 本章小結(jié)
第三章 數(shù)據(jù)處理與應(yīng)用
3.1 數(shù)據(jù)集介紹
3.1.1 DCMD數(shù)據(jù)集構(gòu)建
3.2 數(shù)據(jù)預(yù)處理過(guò)程
3.2.1 中文分詞
3.2.2 數(shù)據(jù)集的標(biāo)注方法
3.3 詞語(yǔ)向量初始化
3.4 本章小結(jié)
第四章 基于改進(jìn)的實(shí)體命名識(shí)別算法的研究
4.1 CNN-GRU-CRF整體網(wǎng)絡(luò)模型
4.1.1 網(wǎng)絡(luò)模型原理
4.1.2 模型結(jié)構(gòu)流程
4.2 實(shí)驗(yàn)與結(jié)果分析
4.2.1 評(píng)價(jià)指標(biāo)
4.2.2 實(shí)驗(yàn)配置與參數(shù)
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
縮略詞
【參考文獻(xiàn)】:
期刊論文
[1]全國(guó)知識(shí)圖譜與語(yǔ)義計(jì)算大會(huì)(CCKS 2018)在天津隆重召開(kāi)[J]. 中文信息學(xué)報(bào). 2018(11)
[2]基于GloVe與SVM的文本分類(lèi)研究[J]. 鄭亞南,田大鋼. 軟件導(dǎo)刊. 2018(06)
[3]基于深度神經(jīng)網(wǎng)絡(luò)的命名實(shí)體識(shí)別方法研究[J]. GUL Khan Safi Qamas,尹繼澤,潘麗敏,羅森林. 信息網(wǎng)絡(luò)安全. 2017(10)
[4]基于超圖的非連續(xù)法律實(shí)體識(shí)別[J]. 徐建忠,朱俊,趙瑞,張亮,李嬌嬌. 信息技術(shù)與信息化. 2017(05)
[5]基于word embedding和CNN的情感分類(lèi)模型[J]. 蔡慧蘋(píng),王麗丹,段書(shū)凱. 計(jì)算機(jī)應(yīng)用研究. 2016(10)
[6]在線(xiàn)醫(yī)療文本中的實(shí)體識(shí)別研究[J]. 蘇婭,劉杰,黃亞樓. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[7]基于CRF和規(guī)則相結(jié)合的地理命名實(shí)體識(shí)別方法[J]. 何炎祥,羅楚威,胡彬堯. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
[8]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[9]淺談中文分詞技術(shù)[J]. 夏利玲. 科技資訊. 2011(32)
[10]電子病歷中命名實(shí)體的智能識(shí)別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2011(02)
博士論文
[1]臨床醫(yī)療文本中實(shí)體時(shí)序化問(wèn)題研究[D]. 劉增健.哈爾濱工業(yè)大學(xué) 2018
碩士論文
[1]基于機(jī)器學(xué)習(xí)與鏈路預(yù)測(cè)的醫(yī)療問(wèn)答檢測(cè)與推薦系統(tǒng)[D]. 邢新國(guó).電子科技大學(xué) 2019
[2]基于改進(jìn)的LSTM的文本情感分析研究[D]. 閆勇莉.大連海事大學(xué) 2018
[3]基于深度神經(jīng)網(wǎng)絡(luò)模型的句子級(jí)文本情感分類(lèi)研究[D]. 徐瑩瑩.深圳大學(xué) 2016
本文編號(hào):3669382
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 相關(guān)工作研究現(xiàn)狀
1.2.1 中文實(shí)體命名識(shí)別研究現(xiàn)狀
1.2.2 醫(yī)療領(lǐng)域?qū)嶓w命名識(shí)別研究現(xiàn)狀
1.2.3 非連續(xù)文本實(shí)體命名識(shí)別研究現(xiàn)狀
1.3 本論文研究主要內(nèi)容
1.4 本論文的結(jié)構(gòu)安排
第二章 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的基本方法與技術(shù)
2.1 長(zhǎng)短序列記憶網(wǎng)絡(luò)
2.1.1 LSTM神經(jīng)網(wǎng)絡(luò)
2.1.2 雙向LSTM神經(jīng)網(wǎng)絡(luò)
2.2 門(mén)控循環(huán)單元
2.2.1 GRU神經(jīng)網(wǎng)絡(luò)
2.2.2 雙向GRU神經(jīng)網(wǎng)絡(luò)
2.3 條件隨機(jī)場(chǎng)
2.4 卷積神經(jīng)網(wǎng)絡(luò)
2.5 其他神經(jīng)網(wǎng)絡(luò)整體模型
2.5.1 LSTM-CRF神經(jīng)網(wǎng)絡(luò)模型
2.5.2 GRU-CRF神經(jīng)網(wǎng)絡(luò)模型
2.6 本章小結(jié)
第三章 數(shù)據(jù)處理與應(yīng)用
3.1 數(shù)據(jù)集介紹
3.1.1 DCMD數(shù)據(jù)集構(gòu)建
3.2 數(shù)據(jù)預(yù)處理過(guò)程
3.2.1 中文分詞
3.2.2 數(shù)據(jù)集的標(biāo)注方法
3.3 詞語(yǔ)向量初始化
3.4 本章小結(jié)
第四章 基于改進(jìn)的實(shí)體命名識(shí)別算法的研究
4.1 CNN-GRU-CRF整體網(wǎng)絡(luò)模型
4.1.1 網(wǎng)絡(luò)模型原理
4.1.2 模型結(jié)構(gòu)流程
4.2 實(shí)驗(yàn)與結(jié)果分析
4.2.1 評(píng)價(jià)指標(biāo)
4.2.2 實(shí)驗(yàn)配置與參數(shù)
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
縮略詞
【參考文獻(xiàn)】:
期刊論文
[1]全國(guó)知識(shí)圖譜與語(yǔ)義計(jì)算大會(huì)(CCKS 2018)在天津隆重召開(kāi)[J]. 中文信息學(xué)報(bào). 2018(11)
[2]基于GloVe與SVM的文本分類(lèi)研究[J]. 鄭亞南,田大鋼. 軟件導(dǎo)刊. 2018(06)
[3]基于深度神經(jīng)網(wǎng)絡(luò)的命名實(shí)體識(shí)別方法研究[J]. GUL Khan Safi Qamas,尹繼澤,潘麗敏,羅森林. 信息網(wǎng)絡(luò)安全. 2017(10)
[4]基于超圖的非連續(xù)法律實(shí)體識(shí)別[J]. 徐建忠,朱俊,趙瑞,張亮,李嬌嬌. 信息技術(shù)與信息化. 2017(05)
[5]基于word embedding和CNN的情感分類(lèi)模型[J]. 蔡慧蘋(píng),王麗丹,段書(shū)凱. 計(jì)算機(jī)應(yīng)用研究. 2016(10)
[6]在線(xiàn)醫(yī)療文本中的實(shí)體識(shí)別研究[J]. 蘇婭,劉杰,黃亞樓. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[7]基于CRF和規(guī)則相結(jié)合的地理命名實(shí)體識(shí)別方法[J]. 何炎祥,羅楚威,胡彬堯. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
[8]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[9]淺談中文分詞技術(shù)[J]. 夏利玲. 科技資訊. 2011(32)
[10]電子病歷中命名實(shí)體的智能識(shí)別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2011(02)
博士論文
[1]臨床醫(yī)療文本中實(shí)體時(shí)序化問(wèn)題研究[D]. 劉增健.哈爾濱工業(yè)大學(xué) 2018
碩士論文
[1]基于機(jī)器學(xué)習(xí)與鏈路預(yù)測(cè)的醫(yī)療問(wèn)答檢測(cè)與推薦系統(tǒng)[D]. 邢新國(guó).電子科技大學(xué) 2019
[2]基于改進(jìn)的LSTM的文本情感分析研究[D]. 閆勇莉.大連海事大學(xué) 2018
[3]基于深度神經(jīng)網(wǎng)絡(luò)模型的句子級(jí)文本情感分類(lèi)研究[D]. 徐瑩瑩.深圳大學(xué) 2016
本文編號(hào):3669382
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3669382.html
最近更新
教材專(zhuān)著