電子健康記錄缺失數(shù)據(jù)預(yù)測與填充方法研究
發(fā)布時間:2021-01-14 15:58
電子健康記錄(EHR)包含了患者的身體狀況、疾病信息、免疫狀況、住院記錄等個人健康相關(guān)的信息。利用神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)方法從大量的EHR數(shù)據(jù)中挖掘醫(yī)學(xué)規(guī)律有助于及早發(fā)現(xiàn)疾病并進行治療。然而,由于數(shù)據(jù)記錄不及時、數(shù)據(jù)測量條件有限等客觀原因,常常導(dǎo)致EHR數(shù)據(jù)存在大量缺失數(shù)據(jù)項,極大限制了機器學(xué)習(xí)方法的應(yīng)用,因此,必須尋找有效的方法處理缺失數(shù)據(jù)項。論文通過分析EHR數(shù)據(jù)和現(xiàn)有缺失數(shù)據(jù)預(yù)測方法的特點,提出了兩種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的缺失數(shù)據(jù)預(yù)測方法,并對MIMIC-III數(shù)據(jù)集的缺失數(shù)據(jù)進行處理,然后基于填充后的數(shù)據(jù)集預(yù)測住院期間患者死亡率,以驗證缺失數(shù)據(jù)處理方法的有效性。論文主要工作如下:(1)提出了一種基于長短時記憶網(wǎng)絡(luò)(LSTM)的EHR缺失數(shù)據(jù)預(yù)測與填充方法。首先,從EHR數(shù)據(jù)中提取出病人生理數(shù)據(jù)字段,標(biāo)記字段中的缺失數(shù)據(jù)項,同時標(biāo)記帶有缺失數(shù)據(jù)項的患者相應(yīng)就診數(shù)據(jù),形成新的數(shù)據(jù)集。其次,基于新的數(shù)據(jù)集訓(xùn)練LSTM模型,然后使用訓(xùn)練后的模型預(yù)測缺失數(shù)據(jù)項,根據(jù)標(biāo)記將預(yù)測值填入缺失位置以形成完整數(shù)據(jù)集。最后,采用平均絕對誤差(MAE)方法和住院期間患者死亡率預(yù)測方法驗證預(yù)測數(shù)據(jù)。實...
【文章來源】: 陳宣池 山東師范大學(xué)
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 EHR研究現(xiàn)狀
1.2.2 缺失數(shù)據(jù)處理研究現(xiàn)狀
1.2.3 LSTM研究現(xiàn)狀
1.3 主要內(nèi)容和創(chuàng)新點
1.4 論文的組織架構(gòu)
1.5 本章小結(jié)
第二章 缺失數(shù)據(jù)處理方法研究
2.1 缺失數(shù)據(jù)處理方法
2.1.1 缺失數(shù)據(jù)
2.1.2 常規(guī)缺失數(shù)據(jù)處理方法
2.2 長短時記憶網(wǎng)絡(luò)
2.2.1 背景及現(xiàn)狀
2.2.2 基本LSTM結(jié)構(gòu)
2.3 本章小結(jié)
第三章 基于LSTM的 EHR缺失數(shù)據(jù)預(yù)測與填充方法
3.1 方法描述
3.1.1 方法過程描述
3.1.2 字段選擇和數(shù)據(jù)預(yù)處理
3.1.3 LSTM模型
3.2 驗證方法
3.2.1 平均絕對誤差法
3.2.2 住院期間患者死亡率預(yù)測結(jié)果驗證法
3.3 實驗與分析
3.3.1 數(shù)據(jù)集
3.3.2 實驗對比算法
3.3.3 實驗結(jié)果與分析
3.4 本章小結(jié)
第四章 基于Attention-BiLSTM的 EHR缺失數(shù)據(jù)預(yù)測與填充方法
4.1 引言
4.2 方法描述
4.2.1 BiLSTM模型
4.2.2 注意力機制
4.2.3 Attention-BiLSTM模型
4.3 實驗與分析
4.3.1 數(shù)據(jù)準(zhǔn)備
4.3.2 實驗設(shè)置
4.3.3 平均絕對誤差實驗
4.3.4 住院期間患者死亡率預(yù)測實驗
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 下一步研究工作
參考文獻
攻讀碩士學(xué)位期間的主要成果
致謝
【參考文獻】:
期刊論文
[1]LSTM在輸變電設(shè)備缺失值填補中的應(yīng)用[J]. 辜超,白德盟,王晶,閆丹鳳. 電測與儀表. 2019(05)
[2]采用雙向LSTM模型的雷達HRRP目標(biāo)識別[J]. 徐彬,陳渤,劉家麒,王鵬輝,劉宏偉. 西安電子科技大學(xué)學(xué)報. 2019(02)
[3]基于CNN和雙向LSTM融合的實體關(guān)系抽取[J]. 張曉斌,陳福才,黃瑞陽. 網(wǎng)絡(luò)與信息安全學(xué)報. 2018(09)
[4]基于雙向LSTM神經(jīng)網(wǎng)絡(luò)模型的中文分詞[J]. 金宸,李維華,姬晨,金緒澤,郭延哺. 中文信息學(xué)報. 2018(02)
[5]MIMIC-Ⅲ電子病歷數(shù)據(jù)集及其挖掘研究[J]. 陳靜,李保萍. 信息資源管理學(xué)報. 2017(04)
[6]深度學(xué)習(xí)框架下LSTM網(wǎng)絡(luò)在短期電力負荷預(yù)測中的應(yīng)用[J]. 陳亮,王震,王剛. 電力信息與通信技術(shù). 2017(05)
本文編號:2977134
【文章來源】: 陳宣池 山東師范大學(xué)
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 EHR研究現(xiàn)狀
1.2.2 缺失數(shù)據(jù)處理研究現(xiàn)狀
1.2.3 LSTM研究現(xiàn)狀
1.3 主要內(nèi)容和創(chuàng)新點
1.4 論文的組織架構(gòu)
1.5 本章小結(jié)
第二章 缺失數(shù)據(jù)處理方法研究
2.1 缺失數(shù)據(jù)處理方法
2.1.1 缺失數(shù)據(jù)
2.1.2 常規(guī)缺失數(shù)據(jù)處理方法
2.2 長短時記憶網(wǎng)絡(luò)
2.2.1 背景及現(xiàn)狀
2.2.2 基本LSTM結(jié)構(gòu)
2.3 本章小結(jié)
第三章 基于LSTM的 EHR缺失數(shù)據(jù)預(yù)測與填充方法
3.1 方法描述
3.1.1 方法過程描述
3.1.2 字段選擇和數(shù)據(jù)預(yù)處理
3.1.3 LSTM模型
3.2 驗證方法
3.2.1 平均絕對誤差法
3.2.2 住院期間患者死亡率預(yù)測結(jié)果驗證法
3.3 實驗與分析
3.3.1 數(shù)據(jù)集
3.3.2 實驗對比算法
3.3.3 實驗結(jié)果與分析
3.4 本章小結(jié)
第四章 基于Attention-BiLSTM的 EHR缺失數(shù)據(jù)預(yù)測與填充方法
4.1 引言
4.2 方法描述
4.2.1 BiLSTM模型
4.2.2 注意力機制
4.2.3 Attention-BiLSTM模型
4.3 實驗與分析
4.3.1 數(shù)據(jù)準(zhǔn)備
4.3.2 實驗設(shè)置
4.3.3 平均絕對誤差實驗
4.3.4 住院期間患者死亡率預(yù)測實驗
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 下一步研究工作
參考文獻
攻讀碩士學(xué)位期間的主要成果
致謝
【參考文獻】:
期刊論文
[1]LSTM在輸變電設(shè)備缺失值填補中的應(yīng)用[J]. 辜超,白德盟,王晶,閆丹鳳. 電測與儀表. 2019(05)
[2]采用雙向LSTM模型的雷達HRRP目標(biāo)識別[J]. 徐彬,陳渤,劉家麒,王鵬輝,劉宏偉. 西安電子科技大學(xué)學(xué)報. 2019(02)
[3]基于CNN和雙向LSTM融合的實體關(guān)系抽取[J]. 張曉斌,陳福才,黃瑞陽. 網(wǎng)絡(luò)與信息安全學(xué)報. 2018(09)
[4]基于雙向LSTM神經(jīng)網(wǎng)絡(luò)模型的中文分詞[J]. 金宸,李維華,姬晨,金緒澤,郭延哺. 中文信息學(xué)報. 2018(02)
[5]MIMIC-Ⅲ電子病歷數(shù)據(jù)集及其挖掘研究[J]. 陳靜,李保萍. 信息資源管理學(xué)報. 2017(04)
[6]深度學(xué)習(xí)框架下LSTM網(wǎng)絡(luò)在短期電力負荷預(yù)測中的應(yīng)用[J]. 陳亮,王震,王剛. 電力信息與通信技術(shù). 2017(05)
本文編號:2977134
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2977134.html
最近更新
教材專著