基于深度學(xué)習(xí)的電子病歷中醫(yī)療知識抽取研究
發(fā)布時間:2022-02-17 17:16
隨著互聯(lián)網(wǎng)技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用,大量具有豐富醫(yī)學(xué)知識的電子病歷隨之產(chǎn)生。其中隱含著患者的診斷與癥狀、用藥情況及治療方式之間的潛在聯(lián)系。對這些隱含知識進行分析與挖掘可以為臨床輔助決策提供幫助,還可以為后續(xù)建立結(jié)構(gòu)化的醫(yī)療領(lǐng)域知識圖譜提供基礎(chǔ)支持。然而,由于電子病歷為醫(yī)務(wù)人員所撰寫的非結(jié)構(gòu)化自由本文,其表述復(fù)雜,包含了大量醫(yī)療領(lǐng)域?qū)I(yè)詞匯,且在一定程度上受撰寫者書寫習(xí)慣影響。所以,對電子病歷中包含的醫(yī)療知識實現(xiàn)高效準(zhǔn)確地抽取仍然面臨著巨大的挑戰(zhàn)。本文依托于自然語言處理與深度學(xué)習(xí)技術(shù),對醫(yī)療知識抽取中的命名實體識別與醫(yī)療關(guān)系抽取任務(wù)進行了深入的研究與探討,并提出了可用性強的實現(xiàn)方案,解決了現(xiàn)有方法存在的過于依賴人工操作、特征稀疏、方法適用性差、模型運行效率低等問題,并在抽取效果上取得了顯著的提升。本文的主要工作主要分為以下三部分:(一)對于常見的分布式文本表示方法,本文通過實驗對比選取了GloVe模型,并將維基百科與所使用的I2B2 2010英文電子病歷文本共同作為詞向量訓(xùn)練的語料庫,最終構(gòu)建得到了電子病歷文本的單詞向量。而且本文考慮到單詞對文本信息表示稀疏的問題,將字母信息作為特征補充,構(gòu)...
【文章來源】:杭州師范大學(xué)浙江省
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
Sigmoid函數(shù)
杭州師范大學(xué)碩士學(xué)位論文研究綜述與相關(guān)理論12圖2-3ReLU函數(shù)采用ReLU激活函數(shù)的神經(jīng)元在計算上更加高效。此外,在優(yōu)化方面,ReLU激活函數(shù)為左飽和函數(shù),且在>0時導(dǎo)數(shù)為1,相對于Sigmoid型函數(shù)的兩端飽和,ReLU函數(shù)在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)中可能會出現(xiàn)的梯度消失問題,并在反向傳播過程中梯度下降的收斂速度上有較大提升。(3)Tanh激活函數(shù)Tanh函數(shù)是也就是雙曲正切函數(shù),它可以將輸入值變換到-1與1之間。Tanh的函數(shù)曲線與Sigmoid函數(shù)的類似,只是Tanh的函數(shù)關(guān)于坐標(biāo)系原點對稱。Tanh函數(shù)可以看作是放大并平移的Sigmoid函數(shù),不過由于Tanh是0均值的,其在實際應(yīng)用中效果會好于Sigmoid函數(shù)。()=121+2(2.4)圖2-4Tanh函數(shù)
杭州師范大學(xué)碩士學(xué)位論文研究綜述與相關(guān)理論12圖2-3ReLU函數(shù)采用ReLU激活函數(shù)的神經(jīng)元在計算上更加高效。此外,在優(yōu)化方面,ReLU激活函數(shù)為左飽和函數(shù),且在>0時導(dǎo)數(shù)為1,相對于Sigmoid型函數(shù)的兩端飽和,ReLU函數(shù)在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)中可能會出現(xiàn)的梯度消失問題,并在反向傳播過程中梯度下降的收斂速度上有較大提升。(3)Tanh激活函數(shù)Tanh函數(shù)是也就是雙曲正切函數(shù),它可以將輸入值變換到-1與1之間。Tanh的函數(shù)曲線與Sigmoid函數(shù)的類似,只是Tanh的函數(shù)關(guān)于坐標(biāo)系原點對稱。Tanh函數(shù)可以看作是放大并平移的Sigmoid函數(shù),不過由于Tanh是0均值的,其在實際應(yīng)用中效果會好于Sigmoid函數(shù)。()=121+2(2.4)圖2-4Tanh函數(shù)
【參考文獻】:
期刊論文
[1]無指導(dǎo)的中文開放式實體關(guān)系抽取[J]. 秦兵,劉安安,劉挺. 計算機研究與發(fā)展. 2015(05)
[2]CRF與規(guī)則相結(jié)合的醫(yī)學(xué)病歷實體識別[J]. 栗偉,趙大哲,李博,彭新茗,劉積仁. 計算機應(yīng)用研究. 2015(04)
[3]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
[4]電子病歷基本規(guī)范(試行)[J]. 中國衛(wèi)生質(zhì)量管理. 2010(04)
[5]用語義模式提取實體關(guān)系的方法[J]. 鄧擘,樊孝忠,楊立公. 計算機工程. 2007(10)
[6]中文金融新聞中公司名的識別[J]. 王寧,葛瑞芳,苑春法,黃錦輝,李文捷. 中文信息學(xué)報. 2002(02)
本文編號:3629804
【文章來源】:杭州師范大學(xué)浙江省
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
Sigmoid函數(shù)
杭州師范大學(xué)碩士學(xué)位論文研究綜述與相關(guān)理論12圖2-3ReLU函數(shù)采用ReLU激活函數(shù)的神經(jīng)元在計算上更加高效。此外,在優(yōu)化方面,ReLU激活函數(shù)為左飽和函數(shù),且在>0時導(dǎo)數(shù)為1,相對于Sigmoid型函數(shù)的兩端飽和,ReLU函數(shù)在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)中可能會出現(xiàn)的梯度消失問題,并在反向傳播過程中梯度下降的收斂速度上有較大提升。(3)Tanh激活函數(shù)Tanh函數(shù)是也就是雙曲正切函數(shù),它可以將輸入值變換到-1與1之間。Tanh的函數(shù)曲線與Sigmoid函數(shù)的類似,只是Tanh的函數(shù)關(guān)于坐標(biāo)系原點對稱。Tanh函數(shù)可以看作是放大并平移的Sigmoid函數(shù),不過由于Tanh是0均值的,其在實際應(yīng)用中效果會好于Sigmoid函數(shù)。()=121+2(2.4)圖2-4Tanh函數(shù)
杭州師范大學(xué)碩士學(xué)位論文研究綜述與相關(guān)理論12圖2-3ReLU函數(shù)采用ReLU激活函數(shù)的神經(jīng)元在計算上更加高效。此外,在優(yōu)化方面,ReLU激活函數(shù)為左飽和函數(shù),且在>0時導(dǎo)數(shù)為1,相對于Sigmoid型函數(shù)的兩端飽和,ReLU函數(shù)在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)中可能會出現(xiàn)的梯度消失問題,并在反向傳播過程中梯度下降的收斂速度上有較大提升。(3)Tanh激活函數(shù)Tanh函數(shù)是也就是雙曲正切函數(shù),它可以將輸入值變換到-1與1之間。Tanh的函數(shù)曲線與Sigmoid函數(shù)的類似,只是Tanh的函數(shù)關(guān)于坐標(biāo)系原點對稱。Tanh函數(shù)可以看作是放大并平移的Sigmoid函數(shù),不過由于Tanh是0均值的,其在實際應(yīng)用中效果會好于Sigmoid函數(shù)。()=121+2(2.4)圖2-4Tanh函數(shù)
【參考文獻】:
期刊論文
[1]無指導(dǎo)的中文開放式實體關(guān)系抽取[J]. 秦兵,劉安安,劉挺. 計算機研究與發(fā)展. 2015(05)
[2]CRF與規(guī)則相結(jié)合的醫(yī)學(xué)病歷實體識別[J]. 栗偉,趙大哲,李博,彭新茗,劉積仁. 計算機應(yīng)用研究. 2015(04)
[3]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
[4]電子病歷基本規(guī)范(試行)[J]. 中國衛(wèi)生質(zhì)量管理. 2010(04)
[5]用語義模式提取實體關(guān)系的方法[J]. 鄧擘,樊孝忠,楊立公. 計算機工程. 2007(10)
[6]中文金融新聞中公司名的識別[J]. 王寧,葛瑞芳,苑春法,黃錦輝,李文捷. 中文信息學(xué)報. 2002(02)
本文編號:3629804
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3629804.html
最近更新
教材專著