基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘
發(fā)布時(shí)間:2017-05-25 10:25
本文關(guān)鍵詞:基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人口老齡化問題日趨嚴(yán)重,我國的醫(yī)療費(fèi)用占GDP比重的提升,以及醫(yī)療大數(shù)據(jù)領(lǐng)域?qū)a(chǎn)生萬億市場價(jià)值等多因素的帶動(dòng)下,醫(yī)學(xué)領(lǐng)域已經(jīng)開始擁抱醫(yī)療大數(shù)據(jù),并將其應(yīng)用于醫(yī)學(xué)研究、醫(yī)學(xué)臨床以及醫(yī)學(xué)管理等各方面的實(shí)踐。醫(yī)療機(jī)構(gòu)對(duì)患者進(jìn)行診斷和治療過程中產(chǎn)生的數(shù)據(jù)統(tǒng)稱為醫(yī)療數(shù)據(jù),包括患者個(gè)人信息、就診記錄、醫(yī)療報(bào)告、醫(yī)學(xué)影像數(shù)據(jù)和檢驗(yàn)指標(biāo)數(shù)據(jù)等。以上海瑞金醫(yī)院來為例,日均需要接待上萬人次的患者前來就診,這么多數(shù)據(jù)匯集在一起,成年累月的增長量非常考驗(yàn)該醫(yī)院數(shù)據(jù)庫容量的存儲(chǔ)能力。在長時(shí)間內(nèi)進(jìn)行有效的數(shù)據(jù)管理外,對(duì)這些醫(yī)療大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘使其能夠幫助醫(yī)院進(jìn)行運(yùn)營決策則是一個(gè)值得研究的課題。醫(yī)療行業(yè)在走向信息電子化的過程中就已經(jīng)遇到了海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn),特別是近年來“大數(shù)據(jù)”概念的盛行,大公司們提出了很多關(guān)于醫(yī)療大數(shù)據(jù)的解決方案。針對(duì)這種情況,開展醫(yī)療大數(shù)據(jù)相關(guān)研究工作對(duì)醫(yī)院的信息化發(fā)展是有著重要意義的。本課題基于Hana平臺(tái),結(jié)合對(duì)聯(lián)機(jī)分析處理系統(tǒng)(OLAP)的研究,設(shè)計(jì)了一套用于支持多維度復(fù)雜查詢的可視化系統(tǒng),并在多維度數(shù)據(jù)集的基礎(chǔ)上進(jìn)行相關(guān)的數(shù)據(jù)挖掘工作,從而找到患者臨床醫(yī)療大數(shù)據(jù)間潛在的未知知識(shí)。本文首先對(duì)上海瑞金醫(yī)院在線應(yīng)用系統(tǒng)中產(chǎn)生的臨床數(shù)據(jù)進(jìn)行預(yù)處理,給出了多張數(shù)據(jù)表的業(yè)務(wù)說明以及關(guān)聯(lián)關(guān)系,并闡述了臨床醫(yī)療數(shù)據(jù)的OLAP模型。在此基礎(chǔ)上,本文通過分析系統(tǒng)的可行性與功能需求,從而設(shè)計(jì)了臨床醫(yī)療數(shù)據(jù)的多維度可視化系統(tǒng),分別介紹了系統(tǒng)中的四個(gè)主要的模塊:數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)建模模塊、數(shù)據(jù)挖掘算法模塊以及數(shù)據(jù)可視化模塊。針對(duì)多病種情況,本文進(jìn)行專門的數(shù)據(jù)分析。根據(jù)甲亢患者重要指標(biāo)的檢驗(yàn)情況,可以將甲亢患者治療過程分成四個(gè)階段:臨床緩解階段、生化緩解階段、免疫緩解階段以及免疫治愈階段,而且每個(gè)階段都可以出現(xiàn)治療復(fù)燃情況。通過對(duì)不同階段的患者數(shù)據(jù)進(jìn)行分析,可以統(tǒng)計(jì)得出甲亢患者在不同階段的治愈率。而糖尿病屬于長期高血糖癥狀,檢測指標(biāo)眾多,但往往多對(duì)指標(biāo)組合存在強(qiáng)相關(guān)性。所以通過對(duì)糖尿病患者指標(biāo)檢驗(yàn)數(shù)據(jù)的分析,可以得到某對(duì)指標(biāo)的潛在關(guān)系,從而為合理減少患者的多余檢驗(yàn)檢測提供了數(shù)據(jù)支持。最后,為了驗(yàn)證數(shù)據(jù)分析結(jié)果的有效性,本文還使用多種挖掘算法(關(guān)聯(lián)規(guī)則算法、聚類分類算法等)對(duì)患者的檢驗(yàn)報(bào)告、檢驗(yàn)指標(biāo)以及用藥情況等數(shù)據(jù)等進(jìn)行挖掘,通過對(duì)比而得出一些輔助性的醫(yī)療結(jié)論,這些結(jié)論可以為將來疾病的病因起源分析提供一定的理論支持。
【關(guān)鍵詞】:數(shù)據(jù)分析 數(shù)據(jù)挖掘 醫(yī)療大數(shù)據(jù) 關(guān)聯(lián)規(guī)則 聚類
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
- 摘要4-6
- Abstract6-11
- 1 緒論11-16
- 1.1 研究背景11
- 1.2 研究現(xiàn)狀11-13
- 1.3 研究內(nèi)容13-14
- 1.4 論文結(jié)構(gòu)14-16
- 2 相關(guān)技術(shù)介紹16-23
- 2.1 數(shù)據(jù)挖掘的概念16
- 2.2 數(shù)據(jù)挖掘的過程16-17
- 2.3 系統(tǒng)涉及的關(guān)鍵技術(shù)17-21
- 2.3.1 Hana數(shù)據(jù)庫18
- 2.3.2 ETL18-19
- 2.3.3 SQLScript19-20
- 2.3.4 BO20
- 2.3.5 數(shù)據(jù)倉庫、數(shù)據(jù)集市與數(shù)據(jù)挖掘20-21
- 2.4 系統(tǒng)實(shí)現(xiàn)的難點(diǎn)21-22
- 2.5 本章小結(jié)22-23
- 3 系統(tǒng)分析與設(shè)計(jì)23-33
- 3.1 可行性分析23-26
- 3.1.1 數(shù)據(jù)量大小23-25
- 3.1.2 算法可行性25-26
- 3.2 需求分析26-27
- 3.2.1 數(shù)據(jù)多維度分析的需求26
- 3.2.2 性能需求26-27
- 3.3 系統(tǒng)開發(fā)環(huán)境27
- 3.4 系統(tǒng)的整體框架設(shè)計(jì)27
- 3.5 概要設(shè)計(jì)27-31
- 3.5.1 系統(tǒng)功能結(jié)構(gòu)28
- 3.5.2 系統(tǒng)模塊設(shè)計(jì)28-31
- 3.6 本章小結(jié)31-33
- 4 OLAP系統(tǒng)實(shí)現(xiàn)33-45
- 4.1 數(shù)據(jù)建模33-34
- 4.2 主要的數(shù)據(jù)表結(jié)構(gòu)34
- 4.3 視圖集成34-37
- 4.3.1 屬性視圖35-36
- 4.3.2 分析視圖36
- 4.3.3 計(jì)算視圖36-37
- 4.4 PAL算法的實(shí)現(xiàn)37-38
- 4.5 BO平臺(tái)對(duì)外提供查詢38-44
- 4.6 本章小結(jié)44-45
- 5 多病種臨床數(shù)據(jù)分析45-56
- 5.1 甲亢臨床數(shù)據(jù)分析45-52
- 5.1.1 甲亢緩解過程分析45-49
- 5.1.2 甲亢緩解天數(shù)分析49-50
- 5.1.3 甲亢再燃過程50-51
- 5.1.4 甲亢再燃天數(shù)過程51-52
- 5.2 糖尿病臨床數(shù)據(jù)分析52-55
- 5.2.1 糖尿病指標(biāo)A1C跟GLU的相關(guān)性分析53-54
- 5.2.2 糖尿病A1C與GLU正常率分析54-55
- 5.3 本章小結(jié)55-56
- 6 多病種多維度數(shù)據(jù)挖掘56-80
- 6.1 多維度數(shù)據(jù)挖掘56-58
- 6.2 關(guān)聯(lián)規(guī)則算法在Hana上實(shí)現(xiàn)58-62
- 6.2.1 Hana PAL APRIORI算法的編程規(guī)范59-60
- 6.2.2 Hana實(shí)現(xiàn)APRIORIRULE60-62
- 6.3 聚類算法在Hana上實(shí)現(xiàn)62-65
- 6.3.1 Hana PAL K分值硬聚類算法K-Means編程規(guī)范62-64
- 6.3.2 Hana實(shí)現(xiàn)K-Means64-65
- 6.4 關(guān)聯(lián)規(guī)則算法在甲亢數(shù)據(jù)上的應(yīng)用65-72
- 6.5 關(guān)聯(lián)規(guī)則算法在糖尿病數(shù)據(jù)上的應(yīng)用72-74
- 6.6 聚類算法在甲亢數(shù)據(jù)上的應(yīng)用74-78
- 6.7 數(shù)據(jù)挖掘帶來的醫(yī)療隱私問題78-79
- 6.8 本章小結(jié)79-80
- 7 總結(jié)與展望80-82
- 7.1 課題總結(jié)80
- 7.2 課題展望80-82
- 致謝82-83
- 參考文獻(xiàn)83-85
- 攻讀學(xué)位期間的研究成果目錄85
【相似文獻(xiàn)】
中國重要報(bào)紙全文數(shù)據(jù)庫 前4條
1 本報(bào)記者 邱燕娜;云計(jì)算、HANA支撐業(yè)務(wù)雙位數(shù)增長[N];中國計(jì)算機(jī)報(bào);2014年
2 《網(wǎng)絡(luò)世界》記者 王瑩;SAP挾HANA征戰(zhàn)大數(shù)據(jù)時(shí)代[N];網(wǎng)絡(luò)世界;2012年
3 本報(bào)記者 邱燕娜;HANA扛起SAP創(chuàng)新大旗[N];中國計(jì)算機(jī)報(bào);2012年
4 本報(bào)記者 邱燕娜;SAP引導(dǎo)商務(wù)套件用戶選擇HANA[N];中國計(jì)算機(jī)報(bào);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 梁曉杰;基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘[D];東華大學(xué);2016年
本文關(guān)鍵詞:基于Hana的醫(yī)療大數(shù)據(jù)多維度挖掘,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):393481
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/393481.html
最近更新
教材專著