大數(shù)據(jù)環(huán)境下慢病管理信息系統(tǒng)的研究與設(shè)計
本文關(guān)鍵詞:大數(shù)據(jù)環(huán)境下慢病管理信息系統(tǒng)的研究與設(shè)計
更多相關(guān)文章: 分布式計算 醫(yī)療大數(shù)據(jù) 大數(shù)據(jù)技術(shù) 實時數(shù)據(jù)計算 批量增量數(shù)據(jù)計算
【摘要】:伴隨著醫(yī)療信息技術(shù)的發(fā)展以及醫(yī)療數(shù)據(jù)的快速增長,傳統(tǒng)的醫(yī)療信息系統(tǒng)已經(jīng)無法適應(yīng)新的行業(yè)需求,尤其是隨著數(shù)據(jù)的爆炸式增長,對于海量數(shù)據(jù)的價值挖掘,是傳統(tǒng)的技術(shù)不能夠?qū)崿F(xiàn)的。將大數(shù)據(jù)技術(shù)以及其先進(jìn)的計算理念應(yīng)用到醫(yī)療行業(yè),不僅能夠輔助醫(yī)生做有效的決策,而且還能夠?qū)崿F(xiàn)各大醫(yī)療機構(gòu)的數(shù)據(jù)進(jìn)行無縫結(jié)合、海量數(shù)據(jù)彈性存儲、有效的管理以及高效率的分析利用,從而提高應(yīng)用可拓展性。本課題設(shè)計了大數(shù)據(jù)環(huán)境下慢病管理信息系統(tǒng),充分的將大數(shù)據(jù)處理技術(shù)應(yīng)用到醫(yī)療行業(yè),設(shè)計了面向行業(yè)的專業(yè)化健康大數(shù)據(jù)架構(gòu)。從而解決了傳統(tǒng)醫(yī)療信息不能夠有效存儲、不能適用于大規(guī)模的醫(yī)療應(yīng)用、不能夠互相共享醫(yī)療數(shù)據(jù)、不能夠協(xié)助醫(yī)生做有效決策等問題。在本課題中,首先詳細(xì)研究了大數(shù)據(jù)相關(guān)技術(shù)、提出了以Spark為分布式計算框架、HDFS為存儲系統(tǒng)、HBase、Hive為在線、離線數(shù)據(jù)庫以及數(shù)據(jù)倉庫、Echarts為頁面展示技術(shù),構(gòu)建可用于計算海量數(shù)據(jù)的高效慢病管理信息系統(tǒng)。搭建了面向?qū)I(yè)的醫(yī)療健康大數(shù)據(jù)平臺,使用Hibench進(jìn)行基準(zhǔn)測試,使得平臺具有高可用性以及高容錯性能。其次,將數(shù)據(jù)從Oracle中使用Sqoop導(dǎo)入到Spark平臺,采用批量增量計算降低計算時間并且保證離線數(shù)據(jù)計算結(jié)果的正確性。接著,使用Kafka、Spark Streaming進(jìn)行實時數(shù)據(jù)計算。
【關(guān)鍵詞】:分布式計算 醫(yī)療大數(shù)據(jù) 大數(shù)據(jù)技術(shù) 實時數(shù)據(jù)計算 批量增量數(shù)據(jù)計算
【學(xué)位授予單位】:南昌大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.52
【目錄】:
- 摘要3-4
- ABSTRACT4-8
- 第1章 緒論8-16
- 1.1 研究背景及意義8-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-13
- 1.3 研究內(nèi)容與創(chuàng)新點13-16
- 1.3.1 研究內(nèi)容13-15
- 1.3.2 創(chuàng)新點15-16
- 第2章 關(guān)鍵技術(shù)介紹16-25
- 2.1 慢病管理信息系統(tǒng)概述16
- 2.2 大數(shù)據(jù)及其關(guān)鍵技術(shù)16-24
- 2.2.1 大數(shù)據(jù)概述16-17
- 2.2.2 關(guān)鍵技術(shù)介紹17-24
- 2.3 本章小結(jié)24-25
- 第3章 系統(tǒng)架構(gòu)設(shè)計25-32
- 3.1 系統(tǒng)架構(gòu)設(shè)計思路25-26
- 3.2 概念模型設(shè)計26-27
- 3.3 邏輯模型設(shè)計27-29
- 3.4 物理模型設(shè)計29-31
- 3.5 本章小結(jié)31-32
- 第4章 大數(shù)據(jù)平臺構(gòu)建32-49
- 4.1 集群搭建32-39
- 4.1.1 安裝環(huán)境32-33
- 4.1.2 功能規(guī)劃33-34
- 4.1.3 集群拓?fù)浣Y(jié)構(gòu)34-35
- 4.1.4 集群環(huán)境搭建35-39
- 4.2 集群HA39-43
- 4.2.1 HDFS HA39-41
- 4.2.2 Spark HA41-43
- 4.3 基準(zhǔn)測試43-48
- 4.3.1 測試目的43
- 4.3.2 測試原理與方案43-45
- 4.3.3 測試過程45-48
- 4.3.4 測試結(jié)論48
- 4.4 本章小結(jié)48-49
- 第5章 系統(tǒng)實現(xiàn)49-73
- 5.1 批量數(shù)據(jù)抽取49-53
- 5.2 批量增量計算53-63
- 5.2.1 增量計算介紹53-54
- 5.2.2 批量增量計算算法介紹54-58
- 5.2.3 批量增量計算場景58-62
- 5.2.4 批量增量計算性能評估62-63
- 5.3 實時數(shù)據(jù)流處理63-71
- 5.3.1 數(shù)據(jù)流介紹63-64
- 5.3.2 實時數(shù)據(jù)流處理介紹64
- 5.3.3 HBase數(shù)據(jù)庫設(shè)計64-69
- 5.3.4 實時數(shù)據(jù)流處理69-71
- 5.4 Oozie自動調(diào)度71-72
- 5.5 本章小結(jié)72-73
- 第6章 總結(jié)與展望73-75
- 6.1 全文總結(jié)73-74
- 6.2 工作展望74-75
- 致謝75-76
- 參考文獻(xiàn)76-80
- 攻讀學(xué)位期間的研究成果80
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王巖;王純;;一種基于Kafka的可靠的Consumer的設(shè)計方案[J];軟件;2016年01期
2 ;深入理解Spark Streaming執(zhí)行模型[J];電腦編程技巧與維護(hù);2015年20期
3 薛瑞;朱曉民;;基于Spark Streaming的實時日志處理平臺設(shè)計與實現(xiàn)[J];電信工程技術(shù)與標(biāo)準(zhǔn)化;2015年09期
4 王毅;;大數(shù)據(jù)時代高職院校網(wǎng)絡(luò)信息化教學(xué)模式探究[J];電子世界;2015年16期
5 ;國務(wù)院辦公廳印發(fā)《關(guān)于運用大數(shù)據(jù)加強對市場主體服務(wù)和監(jiān)管的若干意見》[J];電子政務(wù);2015年07期
6 羅旭;劉友江;;醫(yī)療大數(shù)據(jù)研究現(xiàn)狀及其臨床應(yīng)用[J];醫(yī)學(xué)信息學(xué)雜志;2015年05期
7 ;阿里大健康——開始搶占醫(yī)院的地盤![J];領(lǐng)導(dǎo)決策信息;2015年18期
8 張貝貝;;華為牽手東華 詮釋“全聯(lián)接”醫(yī)療[J];軟件和信息服務(wù);2015年05期
9 李彥廣;;基于Spark+MLlib分布式學(xué)習(xí)算法的研究[J];商洛學(xué)院學(xué)報;2015年02期
10 李海陽;;“2015華為中國合作伙伴大會”醫(yī)療行業(yè)看點[J];中國數(shù)字醫(yī)學(xué);2015年04期
,本文編號:615766
本文鏈接:http://sikaile.net/wenyilunwen/huanjingshejilunwen/615766.html