基于時序圖的醫(yī)療風險預測研究
發(fā)布時間:2018-05-11 17:45
本文選題:醫(yī)療數(shù)據(jù) + 時序圖。 參考:《山東大學》2017年碩士論文
【摘要】:隨著信息技術的快速發(fā)展以及醫(yī)療信息系統(tǒng)的逐步健全,醫(yī)療與每個人的日常生活已息息相關,并產(chǎn)生了越來越多可利用的醫(yī)療大數(shù)據(jù)。在醫(yī)療領域,包括的醫(yī)療數(shù)據(jù)和信息類型非常廣泛,可以大致分為以下三種:臨床數(shù)據(jù)(Clinical Data)、體檢數(shù)據(jù)(Biometric Data)、醫(yī)保數(shù)據(jù)(Medicare Data);谏鲜鲠t(yī)療數(shù)據(jù)進行風險預測模型研究是當今一個很熱的醫(yī)學研究趨勢,例如預測病人是否會患某種特定的疾病、預測病人未來會患不同疾病的概率風險等都屬于醫(yī)療風險預測范疇。若可以利用醫(yī)學數(shù)據(jù)進行有效的醫(yī)療風險預測模型研究,則可以大大降低醫(yī)療浪費,從而提高醫(yī)療質(zhì)量,擁有更好的醫(yī)療服務。病人的電子健康檔案(EHRs)以電子的形式系統(tǒng)性收集了病人在不同時間點的醫(yī)療健康信息,是指導數(shù)據(jù)驅(qū)動醫(yī)療研究的主要載體之一。鑒于原始EHRs數(shù)據(jù)的異構(gòu)性、稀疏性等特點,直接使用未加工的EHRs去指導個性化醫(yī)療是非常具有挑戰(zhàn)性的,因此,在進行具體的疾病風險預測應用之前需要對原始EHRs數(shù)據(jù)進行一致性表示,將未加工的電子健康檔案數(shù)據(jù)轉(zhuǎn)化為臨床相關的特征信息是一個值得研究的問題,F(xiàn)已有一些工作基于EHRs數(shù)據(jù)提出了不同的預測方法,并對醫(yī)療數(shù)據(jù)進行了一致性表示,但使用圖以及考慮不同醫(yī)療事件之間時序關系的表示形式研究的比較少,然而圖具有直觀易理解性并且時序關系能夠捕捉到疾病未來發(fā)展趨勢的重要信號,本文將上述兩點進行結(jié)合,為每位病人構(gòu)建一個醫(yī)療時序圖,時序圖的表示形式壓縮了原始數(shù)據(jù)使其更緊湊,從而有效解決了醫(yī)療數(shù)據(jù)的稀疏性問題,并且為每位病人的分散數(shù)據(jù)提供了一種全景概括視圖。本文主要在不同類型的醫(yī)療數(shù)據(jù)下,基于構(gòu)建的病人時序圖,針對現(xiàn)有風險預測工作存在的一些不足,對不同的醫(yī)療風險預測模型進行一系列研究。本文的具體工作和貢獻概括如下:1.提出一種基于病人時序圖的疾病風險預測方法(A Data-Driven Approach to Predict Medical Risk Based on Temporal Profile Graph,MTPGraph)。首先對每位病人的原始電子健康檔案數(shù)據(jù)(EHRs)進行一致性表示,即提出一種時序圖的表示形式;其次運用改進的Apriori頻繁項集挖掘算法TRApriori,基于病人時序圖挖掘頻繁特征圖;根據(jù)圖的重構(gòu)原理,每位病人的時序圖可由時序特征圖重新構(gòu)成,最終獲得針對不同病人的重構(gòu)系數(shù)(即特征向量),對病人是否會患某種特定疾病進行有效預測。通過對兩種真實臨床場景的實驗驗證并與傳統(tǒng)方法比較,結(jié)果顯示該疾病風險預測方法可達到更好的預測效果。2.提出一種基于病人時序圖表示的協(xié)同評估預測模型(Collaborative Prediction Model of Disease Risk by Mining Electronic Health Records,CAPM),僅需依賴病人EHRs數(shù)據(jù)中的疾病ICD-10編碼來對病人未來會患不同疾病的概率風險進行預測。首先將每位病人的原始EHR數(shù)據(jù)表示為時序圖;其次提出一種混合協(xié)同過濾方法,基于個人醫(yī)療歷史記錄和與其相似病人的醫(yī)療數(shù)據(jù)對每位病人的患病風險進行預測;另外,為了能夠進行早期預防,提出一種計算對應疾病開始時間的方法。通過在真實的EHR數(shù)據(jù)集上進行的實驗,結(jié)果證明CAPM能更好的對病人未來會患哪些疾病及對應疾病可能的開始時間進行預測。3.提出一種基于多類型醫(yī)療數(shù)據(jù)的疾病風險預測模型。首先將病人的三類醫(yī)療數(shù)據(jù)(臨床EHRs、體檢數(shù)據(jù)、醫(yī)療保險數(shù)據(jù))進行有序鏈接,為每位病人構(gòu)建一個醫(yī)療時序圖;其次提出改進的AGM算法,基于所有病人的醫(yī)療時序圖本身來挖掘頻繁子圖,利用所挖子圖對病人是否患病進行預測;基于真實世界的三類型數(shù)據(jù)集對該方法在特定臨床場景下進行驗證,實驗結(jié)果表明,與傳統(tǒng)方法相比該方法是有效及高效的。
[Abstract]:With the rapid development of information technology and the gradual improvement of medical information system , medical care is closely related to the daily life of each person , and has produced more and more available medical data . In the medical field , including medical data and information types , it can be broadly divided into three categories : Clinical Data , Biometric Data , Medicare Data . The study of risk prediction model based on the above medical data is a very hot trend of medical research . For example , it is very challenging to predict whether the patient is suffering from a certain disease and predict the future of the patient . This paper presents a new method for predicting disease risk by using modified Apriori frequent itemset mining algorithm , and then proposes a new method for predicting the disease risk by using modified Apriori algorithm .
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:R-05;TP311.13
【相似文獻】
相關會議論文 前1條
1 介龍梅;徐麗;谷文祥;;基于啟發(fā)式策略的時序圖規(guī)劃研究[A];2005年全國理論計算機科學學術年會論文集[C];2005年
相關博士學位論文 前1條
1 韓文_";時序圖數(shù)據(jù)處理技術研究[D];清華大學;2015年
相關碩士學位論文 前4條
1 王雪嬌;基于UML時序圖的系統(tǒng)形式模型自動生成研究[D];江西理工大學;2016年
2 張帥;基于時序圖的醫(yī)療風險預測研究[D];山東大學;2017年
3 崔康樂;UML時序圖模型到UPPAAL時間自動機模型轉(zhuǎn)換方法研究和工具實現(xiàn)[D];華東師范大學;2011年
4 陳艷;重慶職業(yè)信息學院績效考評系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2011年
,本文編號:1874938
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1874938.html
最近更新
教材專著