基于大數(shù)據(jù)的身體數(shù)據(jù)采集與分析的研究
發(fā)布時(shí)間:2021-02-21 09:50
近年來,醫(yī)療機(jī)構(gòu)信息化程度不斷提高,各類醫(yī)療健康信息在數(shù)量上有著驚人的增長(zhǎng)。由于醫(yī)療健康大數(shù)據(jù)具有數(shù)據(jù)量大、多樣性突出的獨(dú)特性,所要采集與處理的數(shù)據(jù)類型也變得越來越復(fù)雜和多樣,傳統(tǒng)的醫(yī)療數(shù)據(jù)處理技術(shù)手段已經(jīng)漸漸無法滿足目前的需要,所以如何采集與分析醫(yī)療健康大數(shù)據(jù)并從中挖掘出潛在的價(jià)值,依然是值得研究的問題。身體數(shù)據(jù)作為一種常見的醫(yī)療健康大數(shù)據(jù),比其他的數(shù)據(jù)更能反映醫(yī)療大數(shù)據(jù)的特點(diǎn)。本文針對(duì)身體數(shù)據(jù),在研究了現(xiàn)有的數(shù)據(jù)采集方法以及數(shù)據(jù)分析方法的基礎(chǔ)上,設(shè)計(jì)了一種基于大數(shù)據(jù)的身體數(shù)據(jù)采集與分析系統(tǒng)。系統(tǒng)實(shí)現(xiàn)了身體數(shù)據(jù)的采集、存儲(chǔ)、分析、管理及可視化功能。針對(duì)身體數(shù)據(jù)的特征,本文研究了國(guó)內(nèi)外大數(shù)據(jù)采集發(fā)展的現(xiàn)狀,分析了主流大數(shù)據(jù)采集產(chǎn)品的優(yōu)缺點(diǎn),設(shè)計(jì)制定了身體數(shù)據(jù)采集集群的架構(gòu),并劃分了集群的各個(gè)組件模塊,對(duì)集群的各個(gè)組件模塊的配置和實(shí)現(xiàn)進(jìn)行了詳細(xì)的描述。針對(duì)現(xiàn)有數(shù)據(jù)挖掘中的關(guān)聯(lián)分類算法,本文通過引入全置信度對(duì)經(jīng)典關(guān)聯(lián)分類算法進(jìn)行改進(jìn),提出了一種改進(jìn)的關(guān)聯(lián)分類算法。該算法不同于傳統(tǒng)的基于支持度-置信度模型的關(guān)聯(lián)分類算法,采用了全置信度的判別機(jī)制,從而大大減少了規(guī)則生成的數(shù)量,算法還對(duì)新實(shí)例預(yù)...
【文章來源】:北方工業(yè)大學(xué)北京市
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 醫(yī)療數(shù)據(jù)采集的國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 醫(yī)療數(shù)據(jù)分析的國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
1.5 本章小結(jié)
第二章 大數(shù)據(jù)平臺(tái)及相關(guān)理論介紹
2.1 大數(shù)據(jù)平臺(tái)介紹
2.1.1 Hadoop平臺(tái)
2.1.2 Spark平臺(tái)
2.2 數(shù)據(jù)挖掘介紹
2.2.1 數(shù)據(jù)挖掘概述
2.2.2 數(shù)據(jù)挖掘算法
2.3 本章小結(jié)
第三章 身體數(shù)據(jù)采集集群的設(shè)計(jì)
3.1 身體數(shù)據(jù)采集常用方法
3.2 身體數(shù)據(jù)采集集群詳細(xì)設(shè)計(jì)
3.2.1 分布式集群
3.2.2 采集組件模塊配置
3.2.3 采集工作流程
3.3 本章小結(jié)
第四章 針對(duì)身體數(shù)據(jù)的關(guān)聯(lián)分類算法改進(jìn)
4.1 身體數(shù)據(jù)特征分析
4.2 關(guān)聯(lián)分類算法存在的問題
4.3 關(guān)聯(lián)分類算法的改進(jìn)
4.3.1 規(guī)則生成與剪枝
4.3.2 新實(shí)例預(yù)測(cè)
4.3.3 測(cè)試結(jié)果的對(duì)比與分析
4.4 本章小結(jié)
第五章 系統(tǒng)集成與驗(yàn)證
5.1 系統(tǒng)架構(gòu)實(shí)現(xiàn)
5.2 身體數(shù)據(jù)采集實(shí)驗(yàn)
5.3 身體數(shù)據(jù)分析算法實(shí)驗(yàn)
5.4 管理系統(tǒng)及數(shù)據(jù)可視化實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 后續(xù)工作展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Spark的并行化高效用項(xiàng)集挖掘算法[J]. 何登平,何宗浩,李培強(qiáng). 計(jì)算機(jī)工程與科學(xué). 2019(10)
[2]面向生產(chǎn)管控的工業(yè)大數(shù)據(jù)研究及應(yīng)用[J]. 趙穎,侯俊杰,于成龍,徐皓,張偉. 計(jì)算機(jī)科學(xué). 2019(S1)
[3]不平衡數(shù)據(jù)挖掘方法綜述[J]. 向鴻鑫,楊云. 計(jì)算機(jī)工程與應(yīng)用. 2019(04)
[4]基于大數(shù)據(jù)技術(shù)的EAST實(shí)驗(yàn)數(shù)據(jù)訪問日志分析系統(tǒng)的設(shè)計(jì)[J]. 章琦皓,王楓,王月婷. 計(jì)算機(jī)應(yīng)用與軟件. 2018(09)
[5]關(guān)聯(lián)分類及其改進(jìn)算法綜述[J]. 李家輝,周忠眉. 科技通報(bào). 2018(08)
[6]基于模型過濾的多任務(wù)回歸在帕金森癥預(yù)測(cè)中的應(yīng)用[J]. 劉峰,季薇,李云. 計(jì)算機(jī)應(yīng)用. 2018(11)
[7]大數(shù)據(jù)時(shí)代下的動(dòng)態(tài)可配置數(shù)據(jù)采集系統(tǒng)的研究與設(shè)計(jì)[J]. 丁俊,鄭輝. 計(jì)算機(jī)應(yīng)用與軟件. 2018(03)
[8]海量日志數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與優(yōu)化[J]. 郭鵬程,李迎春,付春燕,曹炳堯. 電子測(cè)量技術(shù). 2018(01)
[9]Layered Software Patterns for Data Analysis in Big Data Environment[J]. Hossam Hakeem. International Journal of Automation and Computing. 2017(06)
[10]Hadoop與Spark應(yīng)用場(chǎng)景研究[J]. 馮興杰,王文超. 計(jì)算機(jī)應(yīng)用研究. 2018(09)
博士論文
[1]分布式環(huán)境下大數(shù)據(jù)組織與管理關(guān)鍵技術(shù)的研究[D]. 陳志坤.國(guó)防科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]關(guān)聯(lián)規(guī)則挖掘算法的并行化及應(yīng)用研究[D]. 許德心.南京郵電大學(xué) 2019
[2]云平臺(tái)下醫(yī)療大數(shù)據(jù)的FP-Growth算法的優(yōu)化研究[D]. 毛振平.華北水利水電大學(xué) 2019
[3]基于Spark的煙草大數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉小方.沈陽(yáng)工業(yè)大學(xué) 2019
[4]基于Spark的數(shù)據(jù)挖掘技術(shù)研究[D]. 杜沛.華北電力大學(xué) 2019
[5]大數(shù)據(jù)平臺(tái)數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 逯衍.北京交通大學(xué) 2018
[6]基于醫(yī)療大數(shù)據(jù)的可視化算法研究與應(yīng)用[D]. 王藝.天津工業(yè)大學(xué) 2018
[7]基于Hbase的健康監(jiān)測(cè)大數(shù)據(jù)平臺(tái)性能優(yōu)化研究及應(yīng)用[D]. 尹鵬飛.北京工業(yè)大學(xué) 2017
[8]基于Spark平臺(tái)的高血壓藥物推薦及療效預(yù)測(cè)研究[D]. 車晉強(qiáng).太原理工大學(xué) 2016
[9]基于Spark的若干數(shù)據(jù)挖掘技術(shù)研究[D]. 寧永恒.中國(guó)計(jì)量學(xué)院 2015
[10]基于物聯(lián)網(wǎng)的遠(yuǎn)程移動(dòng)醫(yī)療監(jiān)護(hù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 曾繩濤.廣東工業(yè)大學(xué) 2014
本文編號(hào):3044180
【文章來源】:北方工業(yè)大學(xué)北京市
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 醫(yī)療數(shù)據(jù)采集的國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 醫(yī)療數(shù)據(jù)分析的國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
1.5 本章小結(jié)
第二章 大數(shù)據(jù)平臺(tái)及相關(guān)理論介紹
2.1 大數(shù)據(jù)平臺(tái)介紹
2.1.1 Hadoop平臺(tái)
2.1.2 Spark平臺(tái)
2.2 數(shù)據(jù)挖掘介紹
2.2.1 數(shù)據(jù)挖掘概述
2.2.2 數(shù)據(jù)挖掘算法
2.3 本章小結(jié)
第三章 身體數(shù)據(jù)采集集群的設(shè)計(jì)
3.1 身體數(shù)據(jù)采集常用方法
3.2 身體數(shù)據(jù)采集集群詳細(xì)設(shè)計(jì)
3.2.1 分布式集群
3.2.2 采集組件模塊配置
3.2.3 采集工作流程
3.3 本章小結(jié)
第四章 針對(duì)身體數(shù)據(jù)的關(guān)聯(lián)分類算法改進(jìn)
4.1 身體數(shù)據(jù)特征分析
4.2 關(guān)聯(lián)分類算法存在的問題
4.3 關(guān)聯(lián)分類算法的改進(jìn)
4.3.1 規(guī)則生成與剪枝
4.3.2 新實(shí)例預(yù)測(cè)
4.3.3 測(cè)試結(jié)果的對(duì)比與分析
4.4 本章小結(jié)
第五章 系統(tǒng)集成與驗(yàn)證
5.1 系統(tǒng)架構(gòu)實(shí)現(xiàn)
5.2 身體數(shù)據(jù)采集實(shí)驗(yàn)
5.3 身體數(shù)據(jù)分析算法實(shí)驗(yàn)
5.4 管理系統(tǒng)及數(shù)據(jù)可視化實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 后續(xù)工作展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Spark的并行化高效用項(xiàng)集挖掘算法[J]. 何登平,何宗浩,李培強(qiáng). 計(jì)算機(jī)工程與科學(xué). 2019(10)
[2]面向生產(chǎn)管控的工業(yè)大數(shù)據(jù)研究及應(yīng)用[J]. 趙穎,侯俊杰,于成龍,徐皓,張偉. 計(jì)算機(jī)科學(xué). 2019(S1)
[3]不平衡數(shù)據(jù)挖掘方法綜述[J]. 向鴻鑫,楊云. 計(jì)算機(jī)工程與應(yīng)用. 2019(04)
[4]基于大數(shù)據(jù)技術(shù)的EAST實(shí)驗(yàn)數(shù)據(jù)訪問日志分析系統(tǒng)的設(shè)計(jì)[J]. 章琦皓,王楓,王月婷. 計(jì)算機(jī)應(yīng)用與軟件. 2018(09)
[5]關(guān)聯(lián)分類及其改進(jìn)算法綜述[J]. 李家輝,周忠眉. 科技通報(bào). 2018(08)
[6]基于模型過濾的多任務(wù)回歸在帕金森癥預(yù)測(cè)中的應(yīng)用[J]. 劉峰,季薇,李云. 計(jì)算機(jī)應(yīng)用. 2018(11)
[7]大數(shù)據(jù)時(shí)代下的動(dòng)態(tài)可配置數(shù)據(jù)采集系統(tǒng)的研究與設(shè)計(jì)[J]. 丁俊,鄭輝. 計(jì)算機(jī)應(yīng)用與軟件. 2018(03)
[8]海量日志數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與優(yōu)化[J]. 郭鵬程,李迎春,付春燕,曹炳堯. 電子測(cè)量技術(shù). 2018(01)
[9]Layered Software Patterns for Data Analysis in Big Data Environment[J]. Hossam Hakeem. International Journal of Automation and Computing. 2017(06)
[10]Hadoop與Spark應(yīng)用場(chǎng)景研究[J]. 馮興杰,王文超. 計(jì)算機(jī)應(yīng)用研究. 2018(09)
博士論文
[1]分布式環(huán)境下大數(shù)據(jù)組織與管理關(guān)鍵技術(shù)的研究[D]. 陳志坤.國(guó)防科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]關(guān)聯(lián)規(guī)則挖掘算法的并行化及應(yīng)用研究[D]. 許德心.南京郵電大學(xué) 2019
[2]云平臺(tái)下醫(yī)療大數(shù)據(jù)的FP-Growth算法的優(yōu)化研究[D]. 毛振平.華北水利水電大學(xué) 2019
[3]基于Spark的煙草大數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉小方.沈陽(yáng)工業(yè)大學(xué) 2019
[4]基于Spark的數(shù)據(jù)挖掘技術(shù)研究[D]. 杜沛.華北電力大學(xué) 2019
[5]大數(shù)據(jù)平臺(tái)數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 逯衍.北京交通大學(xué) 2018
[6]基于醫(yī)療大數(shù)據(jù)的可視化算法研究與應(yīng)用[D]. 王藝.天津工業(yè)大學(xué) 2018
[7]基于Hbase的健康監(jiān)測(cè)大數(shù)據(jù)平臺(tái)性能優(yōu)化研究及應(yīng)用[D]. 尹鵬飛.北京工業(yè)大學(xué) 2017
[8]基于Spark平臺(tái)的高血壓藥物推薦及療效預(yù)測(cè)研究[D]. 車晉強(qiáng).太原理工大學(xué) 2016
[9]基于Spark的若干數(shù)據(jù)挖掘技術(shù)研究[D]. 寧永恒.中國(guó)計(jì)量學(xué)院 2015
[10]基于物聯(lián)網(wǎng)的遠(yuǎn)程移動(dòng)醫(yī)療監(jiān)護(hù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 曾繩濤.廣東工業(yè)大學(xué) 2014
本文編號(hào):3044180
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3044180.html
最近更新
教材專著