基于注意力機制的疾病預(yù)測關(guān)鍵技術(shù)研究
發(fā)布時間:2021-06-07 16:05
伴隨著醫(yī)療行業(yè)信息化的發(fā)展,產(chǎn)生了越來越多的醫(yī)療健康數(shù)據(jù)。醫(yī)療健康大數(shù)據(jù)的挖掘與應(yīng)用也成為了必然趨勢。人們生活水平和健康意識的提高使得人們對疾病的治療和預(yù)防提出了更高的要求;國家也提出了疾病要以預(yù)防為主,強調(diào)要治未病。電子健康記錄(Electronic Health Records,EHR)中包含著患者的患病情況、治療信息以及人口統(tǒng)計學(xué)信息等。通過對這些數(shù)據(jù)的挖掘分析能夠完成疾病預(yù)測任務(wù),從而幫助醫(yī)生實現(xiàn)疾病的預(yù)防,提高醫(yī)療服務(wù)質(zhì)量。在利用電子健康記錄進(jìn)行疾病預(yù)測任務(wù)時仍存在著一些問題需要解決。首先是電子健康記錄中存在數(shù)據(jù)不一致問題,電子健康記錄中的診斷信息通過醫(yī)學(xué)代碼來進(jìn)行記錄。在進(jìn)行醫(yī)學(xué)代碼分配的過程中,社會歧視、編碼不規(guī)范等很多原因都會導(dǎo)致錯誤醫(yī)學(xué)代碼出現(xiàn),比如很多癲癇數(shù)據(jù)都被記錄為高熱驚厥。這種編碼錯誤會導(dǎo)致診斷信息和藥物信息數(shù)據(jù)不一致,影響最終的預(yù)測任務(wù)。此外,患者的歷史就醫(yī)信息本身數(shù)據(jù)量很大,并且是高維的時序數(shù)據(jù)。這些特性使得傳統(tǒng)的機器學(xué)習(xí)算法對數(shù)據(jù)的建模效果不佳。盡管已經(jīng)有研究人員將循環(huán)神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)模型應(yīng)用到疾病預(yù)測任務(wù)中,但仍然存在一些問題導(dǎo)致模型效果不是很理想。...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1疾病預(yù)測任務(wù)流程??9??
?山東大學(xué)碩士學(xué)位論文???性。一些數(shù)據(jù)的醫(yī)療特性與記錄不同。由于某些疾病通常與社會歧視相關(guān),因??此醫(yī)生傾向于使用其他類似疾病來避免這種恥辱感。??癲癇患者?高熱驚厥患者??#?0?像?▲?▲??#?m?a?M?a?A???????▲▲?▲?▲??o?m?a??m?.A???A?A?A??A?A?A??■被醫(yī)生記錄為癲癇??A被醫(yī)生記錄為高熱驚厥??圖2-2錯誤標(biāo)記示例??由歧視引起的典型醫(yī)療代碼錯誤是中國的癲癇病例,如圖2-2所示。癲癇??的發(fā)病率通常是根據(jù)每年100,000人中新發(fā)現(xiàn)的癲癇患者人數(shù)的比例來計算的。??根據(jù)世界衛(wèi)生組織的數(shù)據(jù)[32】,高收入國家的發(fā)病人數(shù)是49,低收入和中等收入??國家的發(fā)病人數(shù)是139。相比之下,中國的發(fā)病人數(shù)為28.9。從以上數(shù)據(jù)可以??看出,中國癲癇的發(fā)病率明顯低于國外。但事實并非如此。癲癇病是一種常見??的中樞神經(jīng)系統(tǒng)疾玻國際癲癇局的調(diào)查顯示,中國許多父母或患者傾向于隱??瞞自己的病情[33]。盡管在控制癲癇發(fā)作方面取得了進(jìn)展,但癲癇患者仍會遭受??恥辱和歧視I34.35】。因此,在EHR數(shù)據(jù)中,高熱驚厥或其他相關(guān)疾病經(jīng)常被用來??代替癲癇作為診斷結(jié)果,如圖3-2所示。這將導(dǎo)致醫(yī)學(xué)特征和疾病名稱的不一??致,即醫(yī)學(xué)概念上的不一致。許多現(xiàn)有方法使用臨床記錄作為ICD代碼的唯一??信息來源,這些方法通常使用自然語言處理來從臨床記錄中提取患者的癥狀、??用藥、疾病描述和其他相關(guān)信息。但是,如果醫(yī)生有意幫助患者掩蓋疾病,通??過臨床記錄很難正確提取準(zhǔn)確的疾病信息。這就導(dǎo)致醫(yī)學(xué)概念的不一致性是不??可避免的。??除了這類醫(yī)生故意產(chǎn)生的代碼錯誤之外,還
?山東大學(xué)碩士學(xué)位論文???^Knowledge?base^??,??embedding?'一\??卜?n?e/?、?rn???1——、??x2? ̄ ̄|?e:,?、、〇i???——??...-????...?-二——??j/?-?尸一?y????廠??'丨???Pn-I????■Y”"?Q-Q?e^r?’?f,n??y,?I□口?e”丨?丨??l^i?H?h:?j??、—?J??圖3*4KEAM模型結(jié)構(gòu)圖??3.2.2嵌入表示模塊??假設(shè)Cd表示唯一藥物代碼的數(shù)量,根據(jù)one-hot編碼,每種藥物可以用Cd??維數(shù)的二進(jìn)制矢量表示。因此,藥物D,可以表示為-?個向量\£{0,1}^1,只有??第i維為1。如果在一次患者就診中醫(yī)生規(guī)定了?n種藥物,則就診藥物信息可以??表示為大小為〃\心的矩陣。??我們基于ATC的內(nèi)部結(jié)構(gòu),通過使用父節(jié)點和同級節(jié)點的信息來幫助葉子??節(jié)點學(xué)習(xí)嵌入。在我們的方法中,如圖3-5所示,僅將葉節(jié)點和父節(jié)點的信息??用作雙向GRU?(Bi-GRU)的輸入,這避免了在其他類型藥物上合并過多信息??并確保藥物表達(dá)的特異性。Bi-GRU由前向GRU和后向GRU組成。他們分別??從正向和反向讀取輸入序列。我們通過將兩個GRU的隱藏狀態(tài)結(jié)合在一起來獲??得藥物表示向量。??Q2E33I?>?h;?!?!i2??____?——??...?C03CA02??>?h|?I?|?hi?1????V?J??ATC?Code?Bi-GRU??圖3-5?KEAM模型嵌入表示模塊??21??
【參考文獻(xiàn)】:
期刊論文
[1]基于電子病歷大數(shù)據(jù)分析的疾病預(yù)測建模[J]. 陳可. 中國數(shù)字醫(yī)學(xué). 2018(03)
[2]基于電子病歷數(shù)據(jù)挖掘的疾病危重度動態(tài)預(yù)測研究[J]. 李季,丁鳳一,李翔宇. 信息資源管理學(xué)報. 2017(04)
[3]普適醫(yī)療信息管理與服務(wù)的關(guān)鍵技術(shù)與挑戰(zhàn)[J]. 吳信東,葉明全,胡東輝,吳共慶,胡學(xué)鋼,王浩. 計算機學(xué)報. 2012(05)
[4]BP神經(jīng)網(wǎng)絡(luò)在疾病預(yù)測中的應(yīng)用[J]. 王俊杰,陳景武. 數(shù)理醫(yī)藥學(xué)雜志. 2008(03)
碩士論文
[1]基于體檢數(shù)據(jù)的慢性疾病風(fēng)險預(yù)測研究[D]. 譚恒.鄭州大學(xué) 2016
本文編號:3216882
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1疾病預(yù)測任務(wù)流程??9??
?山東大學(xué)碩士學(xué)位論文???性。一些數(shù)據(jù)的醫(yī)療特性與記錄不同。由于某些疾病通常與社會歧視相關(guān),因??此醫(yī)生傾向于使用其他類似疾病來避免這種恥辱感。??癲癇患者?高熱驚厥患者??#?0?像?▲?▲??#?m?a?M?a?A???????▲▲?▲?▲??o?m?a??m?.A???A?A?A??A?A?A??■被醫(yī)生記錄為癲癇??A被醫(yī)生記錄為高熱驚厥??圖2-2錯誤標(biāo)記示例??由歧視引起的典型醫(yī)療代碼錯誤是中國的癲癇病例,如圖2-2所示。癲癇??的發(fā)病率通常是根據(jù)每年100,000人中新發(fā)現(xiàn)的癲癇患者人數(shù)的比例來計算的。??根據(jù)世界衛(wèi)生組織的數(shù)據(jù)[32】,高收入國家的發(fā)病人數(shù)是49,低收入和中等收入??國家的發(fā)病人數(shù)是139。相比之下,中國的發(fā)病人數(shù)為28.9。從以上數(shù)據(jù)可以??看出,中國癲癇的發(fā)病率明顯低于國外。但事實并非如此。癲癇病是一種常見??的中樞神經(jīng)系統(tǒng)疾玻國際癲癇局的調(diào)查顯示,中國許多父母或患者傾向于隱??瞞自己的病情[33]。盡管在控制癲癇發(fā)作方面取得了進(jìn)展,但癲癇患者仍會遭受??恥辱和歧視I34.35】。因此,在EHR數(shù)據(jù)中,高熱驚厥或其他相關(guān)疾病經(jīng)常被用來??代替癲癇作為診斷結(jié)果,如圖3-2所示。這將導(dǎo)致醫(yī)學(xué)特征和疾病名稱的不一??致,即醫(yī)學(xué)概念上的不一致。許多現(xiàn)有方法使用臨床記錄作為ICD代碼的唯一??信息來源,這些方法通常使用自然語言處理來從臨床記錄中提取患者的癥狀、??用藥、疾病描述和其他相關(guān)信息。但是,如果醫(yī)生有意幫助患者掩蓋疾病,通??過臨床記錄很難正確提取準(zhǔn)確的疾病信息。這就導(dǎo)致醫(yī)學(xué)概念的不一致性是不??可避免的。??除了這類醫(yī)生故意產(chǎn)生的代碼錯誤之外,還
?山東大學(xué)碩士學(xué)位論文???^Knowledge?base^??,??embedding?'一\??卜?n?e/?、?rn???1——、??x2? ̄ ̄|?e:,?、、〇i???——??...-????...?-二——??j/?-?尸一?y????廠??'丨???Pn-I????■Y”"?Q-Q?e^r?’?f,n??y,?I□口?e”丨?丨??l^i?H?h:?j??、—?J??圖3*4KEAM模型結(jié)構(gòu)圖??3.2.2嵌入表示模塊??假設(shè)Cd表示唯一藥物代碼的數(shù)量,根據(jù)one-hot編碼,每種藥物可以用Cd??維數(shù)的二進(jìn)制矢量表示。因此,藥物D,可以表示為-?個向量\£{0,1}^1,只有??第i維為1。如果在一次患者就診中醫(yī)生規(guī)定了?n種藥物,則就診藥物信息可以??表示為大小為〃\心的矩陣。??我們基于ATC的內(nèi)部結(jié)構(gòu),通過使用父節(jié)點和同級節(jié)點的信息來幫助葉子??節(jié)點學(xué)習(xí)嵌入。在我們的方法中,如圖3-5所示,僅將葉節(jié)點和父節(jié)點的信息??用作雙向GRU?(Bi-GRU)的輸入,這避免了在其他類型藥物上合并過多信息??并確保藥物表達(dá)的特異性。Bi-GRU由前向GRU和后向GRU組成。他們分別??從正向和反向讀取輸入序列。我們通過將兩個GRU的隱藏狀態(tài)結(jié)合在一起來獲??得藥物表示向量。??Q2E33I?>?h;?!?!i2??____?——??...?C03CA02??>?h|?I?|?hi?1????V?J??ATC?Code?Bi-GRU??圖3-5?KEAM模型嵌入表示模塊??21??
【參考文獻(xiàn)】:
期刊論文
[1]基于電子病歷大數(shù)據(jù)分析的疾病預(yù)測建模[J]. 陳可. 中國數(shù)字醫(yī)學(xué). 2018(03)
[2]基于電子病歷數(shù)據(jù)挖掘的疾病危重度動態(tài)預(yù)測研究[J]. 李季,丁鳳一,李翔宇. 信息資源管理學(xué)報. 2017(04)
[3]普適醫(yī)療信息管理與服務(wù)的關(guān)鍵技術(shù)與挑戰(zhàn)[J]. 吳信東,葉明全,胡東輝,吳共慶,胡學(xué)鋼,王浩. 計算機學(xué)報. 2012(05)
[4]BP神經(jīng)網(wǎng)絡(luò)在疾病預(yù)測中的應(yīng)用[J]. 王俊杰,陳景武. 數(shù)理醫(yī)藥學(xué)雜志. 2008(03)
碩士論文
[1]基于體檢數(shù)據(jù)的慢性疾病風(fēng)險預(yù)測研究[D]. 譚恒.鄭州大學(xué) 2016
本文編號:3216882
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3216882.html
最近更新
教材專著