基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘
發(fā)布時間:2017-05-25 10:25
本文關(guān)鍵詞:基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人口老齡化問題日趨嚴重,我國的醫(yī)療費用占GDP比重的提升,以及醫(yī)療大數(shù)據(jù)領(lǐng)域?qū)a(chǎn)生萬億市場價值等多因素的帶動下,醫(yī)學領(lǐng)域已經(jīng)開始擁抱醫(yī)療大數(shù)據(jù),并將其應用于醫(yī)學研究、醫(yī)學臨床以及醫(yī)學管理等各方面的實踐。醫(yī)療機構(gòu)對患者進行診斷和治療過程中產(chǎn)生的數(shù)據(jù)統(tǒng)稱為醫(yī)療數(shù)據(jù),包括患者個人信息、就診記錄、醫(yī)療報告、醫(yī)學影像數(shù)據(jù)和檢驗指標數(shù)據(jù)等。以上海瑞金醫(yī)院來為例,日均需要接待上萬人次的患者前來就診,這么多數(shù)據(jù)匯集在一起,成年累月的增長量非?简炘撫t(yī)院數(shù)據(jù)庫容量的存儲能力。在長時間內(nèi)進行有效的數(shù)據(jù)管理外,對這些醫(yī)療大數(shù)據(jù)進行數(shù)據(jù)挖掘使其能夠幫助醫(yī)院進行運營決策則是一個值得研究的課題。醫(yī)療行業(yè)在走向信息電子化的過程中就已經(jīng)遇到了海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn),特別是近年來“大數(shù)據(jù)”概念的盛行,大公司們提出了很多關(guān)于醫(yī)療大數(shù)據(jù)的解決方案。針對這種情況,開展醫(yī)療大數(shù)據(jù)相關(guān)研究工作對醫(yī)院的信息化發(fā)展是有著重要意義的。本課題基于Hana平臺,結(jié)合對聯(lián)機分析處理系統(tǒng)(OLAP)的研究,設計了一套用于支持多維度復雜查詢的可視化系統(tǒng),并在多維度數(shù)據(jù)集的基礎(chǔ)上進行相關(guān)的數(shù)據(jù)挖掘工作,從而找到患者臨床醫(yī)療大數(shù)據(jù)間潛在的未知知識。本文首先對上海瑞金醫(yī)院在線應用系統(tǒng)中產(chǎn)生的臨床數(shù)據(jù)進行預處理,給出了多張數(shù)據(jù)表的業(yè)務說明以及關(guān)聯(lián)關(guān)系,并闡述了臨床醫(yī)療數(shù)據(jù)的OLAP模型。在此基礎(chǔ)上,本文通過分析系統(tǒng)的可行性與功能需求,從而設計了臨床醫(yī)療數(shù)據(jù)的多維度可視化系統(tǒng),分別介紹了系統(tǒng)中的四個主要的模塊:數(shù)據(jù)預處理模塊、數(shù)據(jù)建模模塊、數(shù)據(jù)挖掘算法模塊以及數(shù)據(jù)可視化模塊。針對多病種情況,本文進行專門的數(shù)據(jù)分析。根據(jù)甲亢患者重要指標的檢驗情況,可以將甲亢患者治療過程分成四個階段:臨床緩解階段、生化緩解階段、免疫緩解階段以及免疫治愈階段,而且每個階段都可以出現(xiàn)治療復燃情況。通過對不同階段的患者數(shù)據(jù)進行分析,可以統(tǒng)計得出甲亢患者在不同階段的治愈率。而糖尿病屬于長期高血糖癥狀,檢測指標眾多,但往往多對指標組合存在強相關(guān)性。所以通過對糖尿病患者指標檢驗數(shù)據(jù)的分析,可以得到某對指標的潛在關(guān)系,從而為合理減少患者的多余檢驗檢測提供了數(shù)據(jù)支持。最后,為了驗證數(shù)據(jù)分析結(jié)果的有效性,本文還使用多種挖掘算法(關(guān)聯(lián)規(guī)則算法、聚類分類算法等)對患者的檢驗報告、檢驗指標以及用藥情況等數(shù)據(jù)等進行挖掘,通過對比而得出一些輔助性的醫(yī)療結(jié)論,這些結(jié)論可以為將來疾病的病因起源分析提供一定的理論支持。
【關(guān)鍵詞】:數(shù)據(jù)分析 數(shù)據(jù)挖掘 醫(yī)療大數(shù)據(jù) 關(guān)聯(lián)規(guī)則 聚類
【學位授予單位】:東華大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要4-6
- Abstract6-11
- 1 緒論11-16
- 1.1 研究背景11
- 1.2 研究現(xiàn)狀11-13
- 1.3 研究內(nèi)容13-14
- 1.4 論文結(jié)構(gòu)14-16
- 2 相關(guān)技術(shù)介紹16-23
- 2.1 數(shù)據(jù)挖掘的概念16
- 2.2 數(shù)據(jù)挖掘的過程16-17
- 2.3 系統(tǒng)涉及的關(guān)鍵技術(shù)17-21
- 2.3.1 Hana數(shù)據(jù)庫18
- 2.3.2 ETL18-19
- 2.3.3 SQLScript19-20
- 2.3.4 BO20
- 2.3.5 數(shù)據(jù)倉庫、數(shù)據(jù)集市與數(shù)據(jù)挖掘20-21
- 2.4 系統(tǒng)實現(xiàn)的難點21-22
- 2.5 本章小結(jié)22-23
- 3 系統(tǒng)分析與設計23-33
- 3.1 可行性分析23-26
- 3.1.1 數(shù)據(jù)量大小23-25
- 3.1.2 算法可行性25-26
- 3.2 需求分析26-27
- 3.2.1 數(shù)據(jù)多維度分析的需求26
- 3.2.2 性能需求26-27
- 3.3 系統(tǒng)開發(fā)環(huán)境27
- 3.4 系統(tǒng)的整體框架設計27
- 3.5 概要設計27-31
- 3.5.1 系統(tǒng)功能結(jié)構(gòu)28
- 3.5.2 系統(tǒng)模塊設計28-31
- 3.6 本章小結(jié)31-33
- 4 OLAP系統(tǒng)實現(xiàn)33-45
- 4.1 數(shù)據(jù)建模33-34
- 4.2 主要的數(shù)據(jù)表結(jié)構(gòu)34
- 4.3 視圖集成34-37
- 4.3.1 屬性視圖35-36
- 4.3.2 分析視圖36
- 4.3.3 計算視圖36-37
- 4.4 PAL算法的實現(xiàn)37-38
- 4.5 BO平臺對外提供查詢38-44
- 4.6 本章小結(jié)44-45
- 5 多病種臨床數(shù)據(jù)分析45-56
- 5.1 甲亢臨床數(shù)據(jù)分析45-52
- 5.1.1 甲亢緩解過程分析45-49
- 5.1.2 甲亢緩解天數(shù)分析49-50
- 5.1.3 甲亢再燃過程50-51
- 5.1.4 甲亢再燃天數(shù)過程51-52
- 5.2 糖尿病臨床數(shù)據(jù)分析52-55
- 5.2.1 糖尿病指標A1C跟GLU的相關(guān)性分析53-54
- 5.2.2 糖尿病A1C與GLU正常率分析54-55
- 5.3 本章小結(jié)55-56
- 6 多病種多維度數(shù)據(jù)挖掘56-80
- 6.1 多維度數(shù)據(jù)挖掘56-58
- 6.2 關(guān)聯(lián)規(guī)則算法在Hana上實現(xiàn)58-62
- 6.2.1 Hana PAL APRIORI算法的編程規(guī)范59-60
- 6.2.2 Hana實現(xiàn)APRIORIRULE60-62
- 6.3 聚類算法在Hana上實現(xiàn)62-65
- 6.3.1 Hana PAL K分值硬聚類算法K-Means編程規(guī)范62-64
- 6.3.2 Hana實現(xiàn)K-Means64-65
- 6.4 關(guān)聯(lián)規(guī)則算法在甲亢數(shù)據(jù)上的應用65-72
- 6.5 關(guān)聯(lián)規(guī)則算法在糖尿病數(shù)據(jù)上的應用72-74
- 6.6 聚類算法在甲亢數(shù)據(jù)上的應用74-78
- 6.7 數(shù)據(jù)挖掘帶來的醫(yī)療隱私問題78-79
- 6.8 本章小結(jié)79-80
- 7 總結(jié)與展望80-82
- 7.1 課題總結(jié)80
- 7.2 課題展望80-82
- 致謝82-83
- 參考文獻83-85
- 攻讀學位期間的研究成果目錄85
【相似文獻】
中國重要報紙全文數(shù)據(jù)庫 前4條
1 本報記者 邱燕娜;云計算、HANA支撐業(yè)務雙位數(shù)增長[N];中國計算機報;2014年
2 《網(wǎng)絡世界》記者 王瑩;SAP挾HANA征戰(zhàn)大數(shù)據(jù)時代[N];網(wǎng)絡世界;2012年
3 本報記者 邱燕娜;HANA扛起SAP創(chuàng)新大旗[N];中國計算機報;2012年
4 本報記者 邱燕娜;SAP引導商務套件用戶選擇HANA[N];中國計算機報;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 梁曉杰;基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘[D];東華大學;2016年
本文關(guān)鍵詞:基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘,由筆耕文化傳播整理發(fā)布。
,本文編號:393481
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/393481.html
最近更新
教材專著