醫(yī)療健康大數(shù)據(jù)的并行處理方法研究
發(fā)布時間:2020-07-02 22:44
【摘要】:隨著信息技術的不斷發(fā)展,醫(yī)院內(nèi)信息系統(tǒng)愈加完善,特別是物聯(lián)網(wǎng)、移動醫(yī)療、自動化分析檢測儀、可穿戴設備的普及,醫(yī)院、醫(yī)生和患者都成了數(shù)據(jù)的直接創(chuàng)造者,每天都會有大量的數(shù)據(jù)產(chǎn)生并存儲。充分挖掘醫(yī)療健康大數(shù)據(jù)中包含的潛在價值,對提高醫(yī)療服務質(zhì)量、節(jié)約醫(yī)療成本、加強個人健康管理具有重要作用。但是將潛在價值挖掘出來的過程卻充滿挑戰(zhàn)。其中一個問題就是計算負擔的問題,數(shù)據(jù)量的增長、數(shù)據(jù)維度的增長都使得現(xiàn)有的串行計算方式不堪重負,醫(yī)生如果想從海量臨床記錄中挖掘出有效的信息,可能僅在算法模型訓練階段就耗費幾小時甚至幾天的時間,數(shù)據(jù)處理的工作會占用醫(yī)生大量寶貴的時間和精力。還有一個問題就是醫(yī)療健康大數(shù)據(jù)的不完整性和時效性常常導致研究人員訓練出的模型具有較差的泛化能力,在面對真實的數(shù)據(jù)時,經(jīng)常表現(xiàn)出較大的精度落差。在醫(yī)療健康大數(shù)據(jù)環(huán)境下,針對現(xiàn)有數(shù)據(jù)分析算法處理能力不足,數(shù)據(jù)分析耗時長,分析算法適應能力較差等問題,本論文研究了當今主流的并行計算方法,來應對這些挑戰(zhàn)。主要研究內(nèi)容包括:在臨床數(shù)據(jù)方面,研究了 CUDA并行平臺,結合心電數(shù)據(jù)特點,設計了并行的心拍分割和特征提取方法,再結合算法特點,設計出并行的廣義回歸神經(jīng)網(wǎng)絡用于心拍的分類任務,為心血管疾病的診斷提供輔助信息。在保證較高分類精度的前提下,并行算法使得程序的運行效率獲得上百倍的提升,大大縮短了數(shù)據(jù)處理時間,為醫(yī)生節(jié)約出更多的時間,使得醫(yī)生可以將更多的精力放在診療過程中。在個人健康數(shù)據(jù)方面,研究了 OpenCL并行平臺,設計出了一種基于智能手機的個性化運動分類方法,通過集成在智能手機中的加速度傳感器和陀螺儀收集運動數(shù)據(jù),設計實現(xiàn)了并行Adaboost-stump算法用于分類模型的訓練,對坐、站、走、跑、騎車五種常見的運動進行分類,并取得了令人滿意的分類精度。OpenCL下的并行設計充分發(fā)揮了智能手機的計算能力,大大縮短了數(shù)據(jù)處理時間,使得用戶可以便捷、高效地在智能手機上訓練屬于自己的個性化模型。在數(shù)據(jù)分析平臺方面,設計實現(xiàn)了基于并行計算和機器學習的臨床決策支持系統(tǒng),在機器學習算法方面實現(xiàn)了 6種常用的機器學習模型,以適應不同的數(shù)據(jù)分析需求。在程序運行效率方面分別把上述6種算法在3種不同框架下并行化,使得系統(tǒng)可以在不同的硬件環(huán)境下都能獲得效率提升。實驗中,系統(tǒng)表現(xiàn)出了出色的運行效率和分類精度,可以高效、精確地完成提供醫(yī)療輔助建議的作用。
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:R-05
【圖文】:
GHJ則面對的是類翌較為統(tǒng)一的、相互依賴性低的、規(guī)模較大的數(shù)逡逑據(jù),W及沒有分支、中斷的單一計算環(huán)境。這就導致CPU和GPU在硬件架構上逡逑呈現(xiàn)出很大的不同。如圖2.2所示。圖中綠包的部分是計算單元,黃的是控制單逡逑元,撞龜?shù)氖谴鎯卧。從圖中我們可W看出,在GPU中存在大量的計算單元,逡逑存儲和控制單元被大大簡化。而CPU中,大量的空間被存儲單元,而且還有復逡逑雜邀輯控制單元和圖中沒有展示的諸多優(yōu)化電路,相比之下計算單元在CPU中逡逑1之逡逑
樣串行執(zhí)行,下面我們來介紹核函數(shù)是如何在GPU硬件上并行執(zhí)行的t66l逡逑核函數(shù)中的計算任務在執(zhí)行時被映射為大量可W并行執(zhí)行的線程,并由硬件逡逑動態(tài)巧度并執(zhí)行這些線程。這些線程的組織形式如圖2.6所示,所有的線程被映逡逑射成若干個Grid,每個Grid由若干個B1ck±構成,k胃觶攏歟錚悖脛杏職舾篩鰣義希裕瑁潁澹幔。蕦嵞紦溟樃菱k桑裕瑁潁澹幔渫瓿桑桓觶攏耄;C勑的所有Th}澹幔洌笫遣⑿繡義現(xiàn)蔥械,灾q飧觶攏歟錚悖脛興怯形ㄒ壞模簦瑁潁澹幔洌歟洌曄叮誄絳蟶杓頻氖焙蚩桑族義細菡廡┍曄肚植煌南叱,控制不同的线程秷A煌氖萁脅僮鰨詞迪皺義系ブ噶疃嗍薟僮鰨櫻桑停膩澹ǎ櫻椋睿紓歟澹歟睿螅簦恚悖簦椋錚睿停酰歟簦椋穡歟澹模幔簦幔。此外,壤_跡玻鄧懼義蟢胃觶攏歟悖耍輳脛卸加幸豢榭桑贅咚俜夢實墓蠶砬紗媯誨澹攏歟錚悖脛械乃校裕瑁潁澹幔洌簀義峽桑桌謎飪楣蠶砟詿嫦嗷ネㄐ擰T儐蟶峽匆桓霾忝媯琸胃觶攏歟錚悖朐謨布弦彩清義喜⑿兄蔥械
本文編號:2738779
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:R-05
【圖文】:
GHJ則面對的是類翌較為統(tǒng)一的、相互依賴性低的、規(guī)模較大的數(shù)逡逑據(jù),W及沒有分支、中斷的單一計算環(huán)境。這就導致CPU和GPU在硬件架構上逡逑呈現(xiàn)出很大的不同。如圖2.2所示。圖中綠包的部分是計算單元,黃的是控制單逡逑元,撞龜?shù)氖谴鎯卧。從圖中我們可W看出,在GPU中存在大量的計算單元,逡逑存儲和控制單元被大大簡化。而CPU中,大量的空間被存儲單元,而且還有復逡逑雜邀輯控制單元和圖中沒有展示的諸多優(yōu)化電路,相比之下計算單元在CPU中逡逑1之逡逑
樣串行執(zhí)行,下面我們來介紹核函數(shù)是如何在GPU硬件上并行執(zhí)行的t66l逡逑核函數(shù)中的計算任務在執(zhí)行時被映射為大量可W并行執(zhí)行的線程,并由硬件逡逑動態(tài)巧度并執(zhí)行這些線程。這些線程的組織形式如圖2.6所示,所有的線程被映逡逑射成若干個Grid,每個Grid由若干個B1ck±構成,k胃觶攏歟錚悖脛杏職舾篩鰣義希裕瑁潁澹幔。蕦嵞紦溟樃菱k桑裕瑁潁澹幔渫瓿桑桓觶攏耄;C勑的所有Th}澹幔洌笫遣⑿繡義現(xiàn)蔥械,灾q飧觶攏歟錚悖脛興怯形ㄒ壞模簦瑁潁澹幔洌歟洌曄叮誄絳蟶杓頻氖焙蚩桑族義細菡廡┍曄肚植煌南叱,控制不同的线程秷A煌氖萁脅僮鰨詞迪皺義系ブ噶疃嗍薟僮鰨櫻桑停膩澹ǎ櫻椋睿紓歟澹歟睿螅簦恚悖簦椋錚睿停酰歟簦椋穡歟澹模幔簦幔。此外,壤_跡玻鄧懼義蟢胃觶攏歟悖耍輳脛卸加幸豢榭桑贅咚俜夢實墓蠶砬紗媯誨澹攏歟錚悖脛械乃校裕瑁潁澹幔洌簀義峽桑桌謎飪楣蠶砟詿嫦嗷ネㄐ擰T儐蟶峽匆桓霾忝媯琸胃觶攏歟錚悖朐謨布弦彩清義喜⑿兄蔥械
本文編號:2738779
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2738779.html
最近更新
教材專著