基于深度學(xué)習(xí)的中文電子病歷實體及其修飾識別技術(shù)研究
發(fā)布時間:2020-06-28 17:16
【摘要】:智慧醫(yī)療是當(dāng)前人工智能領(lǐng)域的研究熱點,而在各種醫(yī)療數(shù)據(jù)中,電子病歷具有重要價值。電子病歷是醫(yī)務(wù)人員通過電子病歷系統(tǒng)在醫(yī)療活動過程中產(chǎn)生的一種臨床文本信息,是一種記錄患者信息的數(shù)字化信息。通過對電子病歷的分析與挖掘,可以得到大量的與患者密切相關(guān)的醫(yī)療信息,這對臨床決策能起到很大的幫助。自然語言處理技術(shù)可以幫助我們實現(xiàn)對電子病歷文本信息的挖掘,如命名實體識別、實體修飾識別等技術(shù)。其中實體識別旨在識別出病歷中不同實體的實體邊界與類別,實體修飾旨在識別出特定實體與患者之間的修飾關(guān)系。但是與其他文本相比,中文電子病歷存在大量包括書寫不規(guī)范、專業(yè)術(shù)語較多、特殊字符頻繁、句子結(jié)構(gòu)不完整等問題。同時,由于涉及到患者的隱私,導(dǎo)致目前開源的電子病歷數(shù)據(jù)不多。這些問題加大了對電子病歷的信息進行挖掘和識別的難度。因此為了更好地對電子病歷信息進行抽取,本文利用深度學(xué)習(xí)方法在自主標(biāo)注的數(shù)據(jù)集上對中文電子病歷的醫(yī)療實體與修飾識別及其聯(lián)合識別技術(shù)進行了研究:(1)基于知識注意力機制增強的實體識別。雖然以往的相關(guān)工作都取得了較好的成果,但是卻忽略了能夠提供豐富實體信息的外部醫(yī)療知識,因此本文提出了基于醫(yī)療知識注意力增強的CNN-BLSTM-CRF方法。通過使用注意力機制,對醫(yī)療詞典中的醫(yī)療實體的定義與邊界信息進行編碼,來增強神經(jīng)網(wǎng)絡(luò)模型的性能。其中,在BLSTM對文本信息編碼前,先用CNN預(yù)先提取了文本的字級別表示并作為文本信息的補充信息,有效地解決了上文中提出的電子病歷存在的書寫不規(guī)范和特殊詞頻繁等問題。(2)基于CNN-GRU神經(jīng)網(wǎng)絡(luò)的實體修飾識別。使用了 GRU網(wǎng)絡(luò)對電子病歷文本信息進行了編碼,并使用Softmax進行解碼。其中,GRU網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)一個變體,與之相比GRU更好地解決了遠(yuǎn)距離依賴的問題且計算方式更簡單。同時使用了 CNN網(wǎng)絡(luò)預(yù)先提取了字符級表示以解決書寫不規(guī)范和特殊字符頻繁等問題。(3)實體及其修飾聯(lián)合識別。在聯(lián)合識別任務(wù)中本文提出了一種基于多標(biāo)簽方案的聯(lián)合識別方法,并使用BLSTM-LSTM模型進行識別。與傳統(tǒng)的串聯(lián)式識別方法相比,基于多標(biāo)簽方案的方法,可以成功的將兩個步驟轉(zhuǎn)換為一個步驟:通過多標(biāo)簽方案,使用端到端模型一步識別。實驗結(jié)果表明,在相同的數(shù)據(jù)集上,本文的方法相較于其他方法取得了較好的性能。
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R-05;TP391.1;TP18
【圖文】:
圖2-3實體與修飾標(biāo)注工具逡逑
圖3-1深度學(xué)習(xí)模型結(jié)構(gòu)逡逑在本文中,模型首先將輸入文本分別轉(zhuǎn)換為每個字對應(yīng)的預(yù)訓(xùn)練字符的嵌入逡逑向量矩陣和隨機生成的字符向量矩陣,其中預(yù)訓(xùn)練的字符嵌入向量通過查詢預(yù)先逡逑'
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R-05;TP391.1;TP18
【圖文】:
圖2-3實體與修飾標(biāo)注工具逡逑
圖3-1深度學(xué)習(xí)模型結(jié)構(gòu)逡逑在本文中,模型首先將輸入文本分別轉(zhuǎn)換為每個字對應(yīng)的預(yù)訓(xùn)練字符的嵌入逡逑向量矩陣和隨機生成的字符向量矩陣,其中預(yù)訓(xùn)練的字符嵌入向量通過查詢預(yù)先逡逑'
【參考文獻】
相關(guān)期刊論文 前1條
1 葉楓;陳鶯鶯;周根貴;李昊e
本文編號:2733254
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2733254.html
最近更新
教材專著