睡眠呼吸疾病分析決策系統(tǒng)的關(guān)鍵技術(shù)研究和實(shí)現(xiàn)
發(fā)布時(shí)間:2021-09-30 02:00
隨著互聯(lián)網(wǎng)的日益發(fā)展,各行各業(yè)的用戶量和數(shù)據(jù)量都呈現(xiàn)爆炸式的增長。面對越來越多的數(shù)據(jù)量,傳統(tǒng)的數(shù)據(jù)庫和分析系統(tǒng)已經(jīng)不能滿足行業(yè)的業(yè)務(wù)需求,大數(shù)據(jù)框架成為近年來熱點(diǎn),不僅提供了對結(jié)構(gòu)和非結(jié)構(gòu)的存儲查詢模式,而且支持智能決策的大數(shù)據(jù)分析和智能挖掘計(jì)算技術(shù)。在醫(yī)療行業(yè)中,不但存在大量傳統(tǒng)的病人、醫(yī)生信息等結(jié)構(gòu)化管理數(shù)據(jù),同時(shí)存在大量診斷記錄、監(jiān)測、影像等非結(jié)構(gòu)化數(shù)據(jù),如何有效利用大數(shù)據(jù)技術(shù),實(shí)現(xiàn)數(shù)據(jù)的多維統(tǒng)計(jì)分析,為醫(yī)生提供多視角、直觀的病人信息,為診療決策提供依據(jù);如何利用數(shù)據(jù)挖掘技術(shù),從大量歷史病例中挖掘潛在規(guī)律,實(shí)現(xiàn)病因追溯、疾病建模、自動診療方案建議等智能醫(yī)療。因而研究大數(shù)據(jù)架構(gòu)下,研究醫(yī)療數(shù)據(jù)分析、智能計(jì)算相關(guān)技術(shù),為智能醫(yī)療平臺構(gòu)建提供經(jīng)驗(yàn),具有良好的應(yīng)用意義。為實(shí)現(xiàn)醫(yī)療大數(shù)據(jù)分析平臺,本文以睡眠呼吸疾病為案例,采用大數(shù)據(jù)實(shí)時(shí)處理框架Druid,作為系統(tǒng)的數(shù)據(jù)倉庫,實(shí)現(xiàn)聯(lián)機(jī)分析處理(OLAP)的數(shù)據(jù)統(tǒng)計(jì)分析模塊。采用開源大數(shù)據(jù)框架Spark作為數(shù)據(jù)挖掘模塊的分析引擎,使用改進(jìn)的加權(quán)FP-growth等算法對數(shù)據(jù)進(jìn)行聚類分析、關(guān)聯(lián)規(guī)則挖掘。在此基礎(chǔ)上,完成了核心功能模塊設(shè)計(jì)開發(fā)。主...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
系統(tǒng)功能結(jié)構(gòu)圖
圖 2-3 數(shù)據(jù)采集模塊邏輯結(jié)構(gòu)圖Fid 2-3 Logical structure diagram of data collection module數(shù)據(jù)采集模塊邏輯結(jié)構(gòu)圖如圖 2-3 所示,包括感知數(shù)據(jù)采集和離線數(shù)據(jù)兩個(gè)部分。(1) 感知數(shù)據(jù)采集包括三個(gè)功能模塊:數(shù)據(jù)緩存、數(shù)據(jù) ETL 通道和數(shù)據(jù)控制。數(shù)據(jù)緩存 —— 用于對多源在線流式數(shù)據(jù)進(jìn)行分區(qū)緩存,確保接入數(shù)據(jù)整性。該模塊使用 Kafka 軟件工具通過配置緩存通道實(shí)現(xiàn)。數(shù)據(jù) ETL 通道 —— 用于對接入的流式數(shù)據(jù)進(jìn)行 ETL 處理,其中一個(gè)ETL 通道可以對應(yīng)一個(gè)或多個(gè)在線流式數(shù)據(jù)源。該模塊擬使用 Spark Strea軟件工具作為基礎(chǔ)運(yùn)行框架,通過開發(fā) Spark Streaming 應(yīng)用實(shí)現(xiàn)各數(shù)據(jù) ET道實(shí)例。數(shù)據(jù) ETL 通道的部署和運(yùn)行管理可由 Spark 框架的內(nèi)嵌機(jī)制完成。數(shù)據(jù)采集控制器 —— 用于根據(jù)數(shù)據(jù)提供者的需求,在線自動配置相應(yīng)據(jù)緩存區(qū)域,并與 Spark Streaming 平臺交互,觸發(fā)數(shù)據(jù) ETL 通道的部署和功能。
第 2 章 睡眠呼吸病情分析決策系統(tǒng)概述儲、離線數(shù)據(jù)存儲兩個(gè)方面。由于讀寫模式的不同,在線和離線兩類數(shù)據(jù)將采用不同的存儲管理機(jī)制。其中在線數(shù)據(jù)(感知數(shù)據(jù))存儲實(shí)現(xiàn)對感知數(shù)據(jù)的緩存和持久化轉(zhuǎn)存;離線數(shù)據(jù)(歷史數(shù)據(jù))存儲實(shí)現(xiàn)對數(shù)據(jù)的基本原子操作,如增、刪、改、查等。
本文編號:3414899
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
系統(tǒng)功能結(jié)構(gòu)圖
圖 2-3 數(shù)據(jù)采集模塊邏輯結(jié)構(gòu)圖Fid 2-3 Logical structure diagram of data collection module數(shù)據(jù)采集模塊邏輯結(jié)構(gòu)圖如圖 2-3 所示,包括感知數(shù)據(jù)采集和離線數(shù)據(jù)兩個(gè)部分。(1) 感知數(shù)據(jù)采集包括三個(gè)功能模塊:數(shù)據(jù)緩存、數(shù)據(jù) ETL 通道和數(shù)據(jù)控制。數(shù)據(jù)緩存 —— 用于對多源在線流式數(shù)據(jù)進(jìn)行分區(qū)緩存,確保接入數(shù)據(jù)整性。該模塊使用 Kafka 軟件工具通過配置緩存通道實(shí)現(xiàn)。數(shù)據(jù) ETL 通道 —— 用于對接入的流式數(shù)據(jù)進(jìn)行 ETL 處理,其中一個(gè)ETL 通道可以對應(yīng)一個(gè)或多個(gè)在線流式數(shù)據(jù)源。該模塊擬使用 Spark Strea軟件工具作為基礎(chǔ)運(yùn)行框架,通過開發(fā) Spark Streaming 應(yīng)用實(shí)現(xiàn)各數(shù)據(jù) ET道實(shí)例。數(shù)據(jù) ETL 通道的部署和運(yùn)行管理可由 Spark 框架的內(nèi)嵌機(jī)制完成。數(shù)據(jù)采集控制器 —— 用于根據(jù)數(shù)據(jù)提供者的需求,在線自動配置相應(yīng)據(jù)緩存區(qū)域,并與 Spark Streaming 平臺交互,觸發(fā)數(shù)據(jù) ETL 通道的部署和功能。
第 2 章 睡眠呼吸病情分析決策系統(tǒng)概述儲、離線數(shù)據(jù)存儲兩個(gè)方面。由于讀寫模式的不同,在線和離線兩類數(shù)據(jù)將采用不同的存儲管理機(jī)制。其中在線數(shù)據(jù)(感知數(shù)據(jù))存儲實(shí)現(xiàn)對感知數(shù)據(jù)的緩存和持久化轉(zhuǎn)存;離線數(shù)據(jù)(歷史數(shù)據(jù))存儲實(shí)現(xiàn)對數(shù)據(jù)的基本原子操作,如增、刪、改、查等。
本文編號:3414899
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3414899.html
最近更新
教材專著