面向電子病歷的信息抽取技術(shù)研究
發(fā)布時間:2021-11-25 15:41
隨著國內(nèi)醫(yī)療信息化產(chǎn)業(yè)的發(fā)展以及醫(yī)療數(shù)據(jù)標準體系的規(guī)范化,臨床電子病歷數(shù)據(jù)的研究價值也隨之提高。面向臨床電子病歷數(shù)據(jù)的挖掘能夠進一步推動智能醫(yī)療產(chǎn)業(yè)的發(fā)展。信息抽取技術(shù)是對電子病歷文本進行知識抽取的重要手段。在臨床電子病歷領(lǐng)域,信息抽取技術(shù)的研究對個性化醫(yī)療服務(wù)、臨床決策支持和隨訪管理等工作的開展具有重要的意義。信息抽取技術(shù)能夠有效地從電子病歷文本中獲取醫(yī)療知識。在本文中,信息抽取技術(shù)主要是指命名實體識別技術(shù)和實體關(guān)系抽取技術(shù)。實體識別技術(shù)旨在識別出電子病歷文本中多種類型的醫(yī)療實體,實體關(guān)系抽取技術(shù)旨在抽取出電子病歷文本中醫(yī)療實體之間的關(guān)系。相比于其它文本,電子病歷存在邊界模糊、標注數(shù)據(jù)少、書寫不規(guī)范等問題,以上問題加大了命名實體識別和實體關(guān)系抽取的難度,為有效地提取電子病歷中的醫(yī)療實體以及實體間的關(guān)系,本文做了如下工作:電子病歷中的實體識別:本文提出一種基于預(yù)訓(xùn)練模型EMR-BERT的電子病歷實體識別的方法,利用BERT預(yù)訓(xùn)練模型為EMR-BERT提供基本參數(shù),使用相關(guān)的電子病歷的語料庫為EMR-BERT提供預(yù)訓(xùn)練數(shù)據(jù),再結(jié)合Bi-LSTM-CRF模型進行實體的抽取。最終結(jié)果與傳統(tǒng)的...
【文章來源】:南華大學(xué)湖南省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題背景
1.2 研究目的和意義
1.3 研究現(xiàn)狀及分析
1.3.1 臨床電子病歷實體識別研究現(xiàn)狀
1.3.2 臨床電子病歷實體關(guān)系抽取研究現(xiàn)狀
1.4 主要研究內(nèi)容
1.5 結(jié)構(gòu)安排
第2章 相關(guān)工作
2.1 中文電子病歷概述
2.1.1 電子病歷文本類型
2.1.2 電子病歷實體分類體系
2.1.3 電子病歷實體關(guān)系分類體系
2.2 電子病歷命名實體識別相關(guān)技術(shù)
2.2.1 條件隨機場
2.2.2 長短時記憶網(wǎng)絡(luò)
2.2.3 注意力機制
2.2.4 BERT
2.3 電子病歷實體關(guān)系抽取相關(guān)技術(shù)
2.3.1 卷積神經(jīng)網(wǎng)絡(luò)
2.3.2 GRU模型
第3章 電子病歷命名實體識別研究
3.1 基于深度學(xué)習(xí)的醫(yī)療電子病歷實體識別
3.1.1 預(yù)訓(xùn)練EMR-BERT
3.1.2 面向電子病歷的實體識別模型
3.2 數(shù)據(jù)與評價標準
3.2.1 數(shù)據(jù)集介紹
3.2.2 數(shù)據(jù)標注格式
3.2.3 評價指標
3.3 實驗與分析
3.3.1 實驗參數(shù)設(shè)置
3.3.2 系統(tǒng)性能與分析
3.4 本章小結(jié)
第4章 電子病歷實體關(guān)系抽取研究
4.1 基于深度學(xué)習(xí)的醫(yī)療電子病歷實體關(guān)系抽取
4.1.1 基于注意力機制的Bi-GRU-CNN模型
4.1.2 詞表示層
4.1.3 門控循環(huán)單元層
4.1.4 注意力機制層
4.1.5 卷積池化層
4.1.6 醫(yī)療實體關(guān)系分類層
4.2 數(shù)據(jù)與評價標準
4.2.1 數(shù)據(jù)集介紹
4.2.2 數(shù)據(jù)標注格式
4.2.3 評價指標
4.3 實驗與分析
4.3.1 實驗參數(shù)設(shè)置
4.3.2 系統(tǒng)性能與分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻
作者攻讀學(xué)位期間的科研成果
致謝
【參考文獻】:
期刊論文
[1]國家衛(wèi)生計生委發(fā)布《關(guān)于印發(fā)電子病歷應(yīng)用管理規(guī)范(試行)的通知》[J]. 醫(yī)學(xué)信息學(xué)雜志. 2017(02)
[2]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動化學(xué)報. 2014(08)
[3]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
本文編號:3518440
【文章來源】:南華大學(xué)湖南省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題背景
1.2 研究目的和意義
1.3 研究現(xiàn)狀及分析
1.3.1 臨床電子病歷實體識別研究現(xiàn)狀
1.3.2 臨床電子病歷實體關(guān)系抽取研究現(xiàn)狀
1.4 主要研究內(nèi)容
1.5 結(jié)構(gòu)安排
第2章 相關(guān)工作
2.1 中文電子病歷概述
2.1.1 電子病歷文本類型
2.1.2 電子病歷實體分類體系
2.1.3 電子病歷實體關(guān)系分類體系
2.2 電子病歷命名實體識別相關(guān)技術(shù)
2.2.1 條件隨機場
2.2.2 長短時記憶網(wǎng)絡(luò)
2.2.3 注意力機制
2.2.4 BERT
2.3 電子病歷實體關(guān)系抽取相關(guān)技術(shù)
2.3.1 卷積神經(jīng)網(wǎng)絡(luò)
2.3.2 GRU模型
第3章 電子病歷命名實體識別研究
3.1 基于深度學(xué)習(xí)的醫(yī)療電子病歷實體識別
3.1.1 預(yù)訓(xùn)練EMR-BERT
3.1.2 面向電子病歷的實體識別模型
3.2 數(shù)據(jù)與評價標準
3.2.1 數(shù)據(jù)集介紹
3.2.2 數(shù)據(jù)標注格式
3.2.3 評價指標
3.3 實驗與分析
3.3.1 實驗參數(shù)設(shè)置
3.3.2 系統(tǒng)性能與分析
3.4 本章小結(jié)
第4章 電子病歷實體關(guān)系抽取研究
4.1 基于深度學(xué)習(xí)的醫(yī)療電子病歷實體關(guān)系抽取
4.1.1 基于注意力機制的Bi-GRU-CNN模型
4.1.2 詞表示層
4.1.3 門控循環(huán)單元層
4.1.4 注意力機制層
4.1.5 卷積池化層
4.1.6 醫(yī)療實體關(guān)系分類層
4.2 數(shù)據(jù)與評價標準
4.2.1 數(shù)據(jù)集介紹
4.2.2 數(shù)據(jù)標注格式
4.2.3 評價指標
4.3 實驗與分析
4.3.1 實驗參數(shù)設(shè)置
4.3.2 系統(tǒng)性能與分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻
作者攻讀學(xué)位期間的科研成果
致謝
【參考文獻】:
期刊論文
[1]國家衛(wèi)生計生委發(fā)布《關(guān)于印發(fā)電子病歷應(yīng)用管理規(guī)范(試行)的通知》[J]. 醫(yī)學(xué)信息學(xué)雜志. 2017(02)
[2]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動化學(xué)報. 2014(08)
[3]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
本文編號:3518440
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3518440.html
最近更新
教材專著