基于神經(jīng)網(wǎng)絡(luò)的電子病歷實(shí)體識(shí)別
發(fā)布時(shí)間:2023-03-02 19:39
電子病歷是指記錄病人從進(jìn)入醫(yī)院到結(jié)賬出院期間所接受的所有診斷和治療過程的原始信息。它除了包含大量醫(yī)學(xué)術(shù)語、醫(yī)患間的自由敘述,即醫(yī)囑、忌口、查房記錄和患者對(duì)肢體疼痛的描述外,還包含了檢驗(yàn)結(jié)果及其單位或劑量﹑頻繁出現(xiàn)的縮寫藥物名等。通過對(duì)電子病歷進(jìn)行識(shí)別獲得的醫(yī)學(xué)實(shí)體以及其他醫(yī)學(xué)領(lǐng)域相關(guān)的術(shù)語,對(duì)加快構(gòu)建計(jì)算機(jī)輔助診斷系統(tǒng)的智能化起著非常重要的作用。最近,越來越多的學(xué)者們嘗試將深度學(xué)習(xí)模型應(yīng)用于對(duì)電子病歷醫(yī)學(xué)實(shí)體識(shí)別任務(wù)中。本文采用BERT模型和在序列標(biāo)注任務(wù)上應(yīng)用最為廣泛的雙向長短時(shí)記憶網(wǎng)絡(luò)開展了醫(yī)學(xué)領(lǐng)域命名實(shí)體的識(shí)別研究,并進(jìn)行了實(shí)驗(yàn)驗(yàn)證。首先,實(shí)驗(yàn)數(shù)據(jù)使用全國知識(shí)圖譜與語義計(jì)算大會(huì)2018年的電子病歷評(píng)測數(shù)據(jù),分別在BiLSTM-CRF和BERT模型下進(jìn)行實(shí)驗(yàn),從中文電子病歷文檔中提取醫(yī)學(xué)類命名實(shí)體并采用BIO標(biāo)注策略給出其所屬的實(shí)體類別和位置信息。其次,探討增加領(lǐng)域數(shù)據(jù)集對(duì)模型識(shí)別效果的影響,采用BiLSTM-CRF和BERT模型對(duì)擴(kuò)充后的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,通過增加領(lǐng)域數(shù)據(jù)能有效提升模型的識(shí)別效果。最后,將兩組數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果與CRF基線系統(tǒng)和前人的工作進(jìn)行對(duì)比與分析...
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 通用命名實(shí)體識(shí)別研究現(xiàn)狀
1.2.2 電子病歷實(shí)體識(shí)別研究現(xiàn)狀
1.3 本文研究內(nèi)容與組織結(jié)構(gòu)
第二章 命名實(shí)體識(shí)別相關(guān)研究方法與理論介紹
2.1 基于統(tǒng)計(jì)學(xué)習(xí)的命名實(shí)體識(shí)別研究
2.1.1 基于分類模型的實(shí)體識(shí)別
2.1.2 基于概率圖模型的實(shí)體識(shí)別
2.2 基于神經(jīng)網(wǎng)絡(luò)的實(shí)體識(shí)別
2.2.1 基于簡單神經(jīng)網(wǎng)絡(luò)的方法
2.2.2 基于深度神經(jīng)網(wǎng)絡(luò)的方法
2.3 本章小結(jié)
第三章 基于神經(jīng)網(wǎng)絡(luò)的電子病歷實(shí)體識(shí)別
3.1 研究概述
3.2 基于CRF的電子病歷實(shí)體識(shí)別
3.3 基于BiLSTM-CRF的電子病歷實(shí)體識(shí)別
3.4 基于BERT的電子病歷實(shí)體識(shí)別
3.4.1 電子病歷實(shí)體識(shí)別的BERT模型輸入表示
3.4.2 BERT預(yù)訓(xùn)練
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果與分析
4.1 數(shù)據(jù)集
4.2 實(shí)體識(shí)別評(píng)價(jià)指標(biāo)
4.3 實(shí)驗(yàn)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 CRF
4.4.2 BiLSTM-CRF
4.4.3 BERT
4.4.4 實(shí)驗(yàn)對(duì)比
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文的工作總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間的科研成果
致謝
本文編號(hào):3752509
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 通用命名實(shí)體識(shí)別研究現(xiàn)狀
1.2.2 電子病歷實(shí)體識(shí)別研究現(xiàn)狀
1.3 本文研究內(nèi)容與組織結(jié)構(gòu)
第二章 命名實(shí)體識(shí)別相關(guān)研究方法與理論介紹
2.1 基于統(tǒng)計(jì)學(xué)習(xí)的命名實(shí)體識(shí)別研究
2.1.1 基于分類模型的實(shí)體識(shí)別
2.1.2 基于概率圖模型的實(shí)體識(shí)別
2.2 基于神經(jīng)網(wǎng)絡(luò)的實(shí)體識(shí)別
2.2.1 基于簡單神經(jīng)網(wǎng)絡(luò)的方法
2.2.2 基于深度神經(jīng)網(wǎng)絡(luò)的方法
2.3 本章小結(jié)
第三章 基于神經(jīng)網(wǎng)絡(luò)的電子病歷實(shí)體識(shí)別
3.1 研究概述
3.2 基于CRF的電子病歷實(shí)體識(shí)別
3.3 基于BiLSTM-CRF的電子病歷實(shí)體識(shí)別
3.4 基于BERT的電子病歷實(shí)體識(shí)別
3.4.1 電子病歷實(shí)體識(shí)別的BERT模型輸入表示
3.4.2 BERT預(yù)訓(xùn)練
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果與分析
4.1 數(shù)據(jù)集
4.2 實(shí)體識(shí)別評(píng)價(jià)指標(biāo)
4.3 實(shí)驗(yàn)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 CRF
4.4.2 BiLSTM-CRF
4.4.3 BERT
4.4.4 實(shí)驗(yàn)對(duì)比
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文的工作總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間的科研成果
致謝
本文編號(hào):3752509
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3752509.html
最近更新
教材專著