相關(guān)興趣度的分布式關(guān)聯(lián)規(guī)則算法研究及其在急性炎癥診斷中的應(yīng)用
發(fā)布時間:2020-07-29 19:05
【摘要】:隨著互聯(lián)網(wǎng)通信技術(shù)迅猛的發(fā)展,醫(yī)療行業(yè)聚集了海量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)中潛在的有價值信息不能通過簡單的收集或統(tǒng)計分析來獲得,因此可以借助相關(guān)數(shù)據(jù)挖掘技術(shù)來探索醫(yī)療數(shù)據(jù)之間內(nèi)在聯(lián)系和發(fā)現(xiàn)對醫(yī)療診斷有幫助的知識。本文研究了關(guān)聯(lián)規(guī)則算法并做了相關(guān)改進(jìn)來提取急性炎癥醫(yī)療數(shù)據(jù)中隱藏的疾病與癥狀的關(guān)聯(lián)關(guān)系,為醫(yī)療診斷提供輔助決策。課題的研究內(nèi)容主要有以下三個方面:(1)針對傳統(tǒng)基于支持度-置信度的關(guān)聯(lián)規(guī)則挖掘框架存在的缺陷,提出了基于相關(guān)興趣度的關(guān)聯(lián)規(guī)則算法IItemMine_AC(ItemSetItem association correlation)。實驗證明,該算法提高了所生成關(guān)聯(lián)規(guī)則的質(zhì)量,且其相關(guān)度量具有很好的剪枝效果。(2)針對單機處理和存儲大數(shù)據(jù)時計算能力和內(nèi)存空間的限制,實現(xiàn)了基于Spark集群的分布式并行計算。實驗證明,分布式并行計算具有優(yōu)越的時效性和可擴展性。(3)在相關(guān)興趣度的關(guān)聯(lián)規(guī)則挖掘算法和Spark的基礎(chǔ)上,構(gòu)建針對急性炎癥的醫(yī)療輔助診斷系統(tǒng)。通過來自UCI的數(shù)據(jù)集對系統(tǒng)進(jìn)行測試,證明了系統(tǒng)的有效性和可行性。
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.13;R364.5
【圖文】:
鮮
本文編號:2774370
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.13;R364.5
【圖文】:
鮮
本文編號:2774370
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2774370.html
最近更新
教材專著