中文電子病歷醫(yī)學(xué)實(shí)體識(shí)別算法研究
發(fā)布時(shí)間:2022-11-03 18:47
電子病歷是患者完整病程的數(shù)字化記錄,對(duì)幫助醫(yī)生分析病案和醫(yī)療決策具有重要意義。結(jié)構(gòu)化電子病歷由于選擇復(fù)雜、限制醫(yī)生思維以及病例高度重復(fù)等問(wèn)題,慢慢被醫(yī)生使用自然語(yǔ)言進(jìn)行書(shū)寫(xiě)的非結(jié)構(gòu)化和后結(jié)構(gòu)化電子病歷所取代。結(jié)構(gòu)化的電子病歷是醫(yī)療大數(shù)據(jù)分析的基礎(chǔ),因此,將自然語(yǔ)言書(shū)寫(xiě)的電子病歷轉(zhuǎn)化為具有一定規(guī)則的結(jié)構(gòu)化數(shù)據(jù)是現(xiàn)在醫(yī)學(xué)信息學(xué)研究的重要方向。深度學(xué)習(xí)方法的出現(xiàn)和使用也使針對(duì)電子病歷的自然語(yǔ)言處理成為研究熱點(diǎn)。本文研究基于深度學(xué)習(xí)的命名實(shí)體識(shí)別技術(shù),可完成對(duì)醫(yī)學(xué)文本中的實(shí)體名詞進(jìn)行識(shí)別與提取,從而達(dá)到電子病歷的后結(jié)構(gòu)化目的。在命名實(shí)體識(shí)別任務(wù)中,詞嵌入作為最重要的預(yù)訓(xùn)練方法,將上下文中的詞語(yǔ)信息轉(zhuǎn)化為數(shù)學(xué)空間中的向量。不同于英文從詞語(yǔ)或句子級(jí)別的角度進(jìn)行研究,中文詞嵌入的研究重點(diǎn)在于挖掘中文詞語(yǔ)與字符的內(nèi)在偏旁部首與筆畫(huà)信息。故本文提出一種融合詞信息與子詞信息作為詞嵌入的模型,使用字符與筆畫(huà)組合來(lái)構(gòu)成子詞信息部分,對(duì)比現(xiàn)有詞嵌入方法結(jié)合更多詞語(yǔ)的內(nèi)在信息。通過(guò)外部評(píng)估的方式,在四種不同命名實(shí)體識(shí)別模型中進(jìn)行測(cè)試,結(jié)果表明,本文提出的融合模型比僅使用單一詞語(yǔ)作為詞嵌入,在模型的F1值評(píng)估指標(biāo)上...
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外發(fā)展現(xiàn)狀
1.2.1 詞嵌入算法研究現(xiàn)狀
1.2.2 眾包標(biāo)注研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文結(jié)構(gòu)安排
第二章 中文醫(yī)學(xué)文本詞嵌入融合模型算法研究
2.1 詞嵌入問(wèn)題研究
2.1.1 詞嵌入算法發(fā)展
2.1.2 中文詞嵌入研究進(jìn)展
2.1.3 中文醫(yī)學(xué)文本詞嵌入現(xiàn)有問(wèn)題分析
2.2 中文醫(yī)學(xué)文本詞嵌入融合模型算法設(shè)計(jì)
2.2.1 本文融合模型算法思想與流程
2.2.2 融合模型理論基礎(chǔ)
2.2.3 融合模型構(gòu)建
2.3 中文醫(yī)學(xué)文本詞嵌入融合模型算法實(shí)現(xiàn)
2.3.1 數(shù)據(jù)來(lái)源
2.3.2 數(shù)據(jù)預(yù)處理
2.3.3 融合模型訓(xùn)練相關(guān)參數(shù)
2.4 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
2.4.1 對(duì)比實(shí)驗(yàn)?zāi)P瓦x擇
2.4.2 模型質(zhì)量評(píng)估指標(biāo)
2.4.3 實(shí)驗(yàn)結(jié)果分析
2.5 本章小結(jié)
第三章 中文電子病歷眾包標(biāo)注模型算法研究
3.1 眾包標(biāo)注存在的問(wèn)題分析
3.1.1 眾包標(biāo)注的概念
3.1.2 眾包標(biāo)注發(fā)展現(xiàn)狀
3.1.3 眾包標(biāo)注的問(wèn)題
3.2 眾包標(biāo)注模型算法設(shè)計(jì)
3.2.1 眾包標(biāo)注模型算法思想與流程
3.2.2 眾包算法理論基礎(chǔ)
3.2.4 眾包標(biāo)注模型構(gòu)建
3.3 眾包標(biāo)注模型算法實(shí)現(xiàn)
3.3.1 數(shù)據(jù)來(lái)源及預(yù)處理
3.3.2 醫(yī)學(xué)實(shí)體選擇與標(biāo)記策略
3.3.3 病歷數(shù)據(jù)眾包標(biāo)注實(shí)現(xiàn)
3.3.4 模型參數(shù)設(shè)置
3.4 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
3.4.1 對(duì)比實(shí)驗(yàn)?zāi)P瓦x擇
3.4.2 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 中文電子病歷標(biāo)注系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
4.1 標(biāo)注系統(tǒng)總體設(shè)計(jì)
4.1.1 標(biāo)注系統(tǒng)架構(gòu)設(shè)計(jì)
4.1.2 系統(tǒng)開(kāi)發(fā)框架選擇與介紹
4.2 系統(tǒng)主要功能模塊設(shè)計(jì)與實(shí)現(xiàn)
4.2.1 API接口設(shè)計(jì)與實(shí)現(xiàn)
4.2.2 數(shù)據(jù)存儲(chǔ)設(shè)計(jì)與實(shí)現(xiàn)
4.2.3 實(shí)時(shí)監(jiān)控設(shè)計(jì)與實(shí)現(xiàn)
4.3 DevOps開(kāi)發(fā)流程
4.4 系統(tǒng)測(cè)試與分析
4.4.1 系統(tǒng)部署
4.4.2 系統(tǒng)測(cè)試
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]電子病歷命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動(dòng)化學(xué)報(bào). 2014(08)
[2]眾包問(wèn)題研究綜述[J]. 張利斌,鐘復(fù)平,涂慧. 科技進(jìn)步與對(duì)策. 2012(06)
[3]眾包的理念以及我國(guó)企業(yè)眾包商業(yè)模式設(shè)計(jì)[J]. 魏拴成. 技術(shù)經(jīng)濟(jì)與管理研究. 2010(01)
本文編號(hào):3700430
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外發(fā)展現(xiàn)狀
1.2.1 詞嵌入算法研究現(xiàn)狀
1.2.2 眾包標(biāo)注研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文結(jié)構(gòu)安排
第二章 中文醫(yī)學(xué)文本詞嵌入融合模型算法研究
2.1 詞嵌入問(wèn)題研究
2.1.1 詞嵌入算法發(fā)展
2.1.2 中文詞嵌入研究進(jìn)展
2.1.3 中文醫(yī)學(xué)文本詞嵌入現(xiàn)有問(wèn)題分析
2.2 中文醫(yī)學(xué)文本詞嵌入融合模型算法設(shè)計(jì)
2.2.1 本文融合模型算法思想與流程
2.2.2 融合模型理論基礎(chǔ)
2.2.3 融合模型構(gòu)建
2.3 中文醫(yī)學(xué)文本詞嵌入融合模型算法實(shí)現(xiàn)
2.3.1 數(shù)據(jù)來(lái)源
2.3.2 數(shù)據(jù)預(yù)處理
2.3.3 融合模型訓(xùn)練相關(guān)參數(shù)
2.4 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
2.4.1 對(duì)比實(shí)驗(yàn)?zāi)P瓦x擇
2.4.2 模型質(zhì)量評(píng)估指標(biāo)
2.4.3 實(shí)驗(yàn)結(jié)果分析
2.5 本章小結(jié)
第三章 中文電子病歷眾包標(biāo)注模型算法研究
3.1 眾包標(biāo)注存在的問(wèn)題分析
3.1.1 眾包標(biāo)注的概念
3.1.2 眾包標(biāo)注發(fā)展現(xiàn)狀
3.1.3 眾包標(biāo)注的問(wèn)題
3.2 眾包標(biāo)注模型算法設(shè)計(jì)
3.2.1 眾包標(biāo)注模型算法思想與流程
3.2.2 眾包算法理論基礎(chǔ)
3.2.4 眾包標(biāo)注模型構(gòu)建
3.3 眾包標(biāo)注模型算法實(shí)現(xiàn)
3.3.1 數(shù)據(jù)來(lái)源及預(yù)處理
3.3.2 醫(yī)學(xué)實(shí)體選擇與標(biāo)記策略
3.3.3 病歷數(shù)據(jù)眾包標(biāo)注實(shí)現(xiàn)
3.3.4 模型參數(shù)設(shè)置
3.4 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
3.4.1 對(duì)比實(shí)驗(yàn)?zāi)P瓦x擇
3.4.2 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 中文電子病歷標(biāo)注系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
4.1 標(biāo)注系統(tǒng)總體設(shè)計(jì)
4.1.1 標(biāo)注系統(tǒng)架構(gòu)設(shè)計(jì)
4.1.2 系統(tǒng)開(kāi)發(fā)框架選擇與介紹
4.2 系統(tǒng)主要功能模塊設(shè)計(jì)與實(shí)現(xiàn)
4.2.1 API接口設(shè)計(jì)與實(shí)現(xiàn)
4.2.2 數(shù)據(jù)存儲(chǔ)設(shè)計(jì)與實(shí)現(xiàn)
4.2.3 實(shí)時(shí)監(jiān)控設(shè)計(jì)與實(shí)現(xiàn)
4.3 DevOps開(kāi)發(fā)流程
4.4 系統(tǒng)測(cè)試與分析
4.4.1 系統(tǒng)部署
4.4.2 系統(tǒng)測(cè)試
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]電子病歷命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動(dòng)化學(xué)報(bào). 2014(08)
[2]眾包問(wèn)題研究綜述[J]. 張利斌,鐘復(fù)平,涂慧. 科技進(jìn)步與對(duì)策. 2012(06)
[3]眾包的理念以及我國(guó)企業(yè)眾包商業(yè)模式設(shè)計(jì)[J]. 魏拴成. 技術(shù)經(jīng)濟(jì)與管理研究. 2010(01)
本文編號(hào):3700430
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3700430.html
最近更新
教材專著