天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Apriori算法在慢病預(yù)測(cè)中的應(yīng)用研究

發(fā)布時(shí)間:2020-03-30 12:32
【摘要】:目前慢性病已成為危害人們健康生活的一個(gè)因素,尤其是慢性腎病,每年都有數(shù)以萬(wàn)計(jì)的人群因患上該病而痛苦,為了改善這樣的局面,緩解慢性腎病帶來(lái)的危害,對(duì)于慢性病的預(yù)測(cè)研究已經(jīng)成為一個(gè)熱點(diǎn)。本文通過(guò)對(duì)慢性腎病的體檢數(shù)據(jù)運(yùn)用改進(jìn)的Apriori算法進(jìn)行處理,挖掘出有實(shí)際參考價(jià)值的法則從而達(dá)到對(duì)慢性腎病進(jìn)行預(yù)測(cè)的目標(biāo),并且減少了獲取知識(shí)的時(shí)間,具有一定的實(shí)際意義。論文所做的工作如下:1.對(duì)研究課題的概念理論和幾類比較流行的算法,國(guó)內(nèi)外相應(yīng)的數(shù)據(jù)處理技術(shù)的發(fā)展、現(xiàn)狀以及其在智慧醫(yī)療領(lǐng)域的應(yīng)用進(jìn)行了相關(guān)研究,對(duì)數(shù)據(jù)挖掘的醫(yī)學(xué)應(yīng)用有了清晰地認(rèn)識(shí);2.研究了數(shù)據(jù)挖掘中常見(jiàn)的疾病預(yù)測(cè)模型樸素貝葉斯分類器、決策樹(shù)和BP神經(jīng)網(wǎng)絡(luò)算法,分析了它們各自的優(yōu)勢(shì)和不足,針對(duì)利用體檢特征項(xiàng)來(lái)預(yù)測(cè)慢性腎病的研究目標(biāo),提出了使用關(guān)聯(lián)規(guī)則Apriori算法進(jìn)行具體的數(shù)據(jù)挖掘和分析;3.為了解決傳統(tǒng)Apriori算法在計(jì)算上的瓶頸,多次掃描數(shù)據(jù)庫(kù)和生成候選項(xiàng)集過(guò)多的問(wèn)題,對(duì)基于垂直數(shù)據(jù)格式的Apriori算法分別提出了基于指針數(shù)組和差集理論優(yōu)化的DSE算法和基于Hash表優(yōu)化的HE算法,DSE算法通過(guò)引入差集減少TID集的大小,節(jié)省內(nèi)存同時(shí)減少交集求解時(shí)間,HE算法利用Hash表在計(jì)算大容量數(shù)據(jù)交集時(shí)快速高效的性質(zhì),減少求交集時(shí)的循環(huán)和遍歷的時(shí)間,相比與傳統(tǒng)的算法,這兩種優(yōu)化算法都在運(yùn)行時(shí)間上有了明顯的減少,提高了算法的運(yùn)行效率;4.對(duì)慢性腎病的體檢數(shù)據(jù)進(jìn)行預(yù)處理操作,通過(guò)離散化和標(biāo)識(shí)映射等步驟將原始數(shù)據(jù)表轉(zhuǎn)化為可以進(jìn)行實(shí)際挖掘的數(shù)據(jù)表進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,并用多項(xiàng)Logistic回歸分析算法對(duì)結(jié)果進(jìn)行驗(yàn)證,證實(shí)了算法的可靠性。通過(guò)關(guān)聯(lián)規(guī)則挖掘得到的有價(jià)值的知識(shí)規(guī)則可以很好地對(duì)慢性腎病進(jìn)行一定程度上的概率預(yù)測(cè),作為醫(yī)生進(jìn)行疾病診斷的參考依據(jù),并對(duì)自動(dòng)化醫(yī)療有著重要的意義。
【圖文】:

數(shù)據(jù)預(yù)處理


第 2 章 相關(guān)理論技術(shù)誤數(shù)據(jù)或是偏離正常區(qū)間的離群點(diǎn)等。這樣的數(shù)據(jù)會(huì)對(duì)最終的數(shù)據(jù)挖掘結(jié)果產(chǎn)很大的影響,因此需要通過(guò)數(shù)據(jù)預(yù)處理工作將低質(zhì)量的數(shù)據(jù)轉(zhuǎn)化為一致、完整、確的高質(zhì)量數(shù)據(jù)。數(shù)據(jù)預(yù)處理的一般方法[37]有數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)變換、據(jù)規(guī)約和數(shù)據(jù)離散化等,具體任務(wù)如圖 2-1 所示。

流程圖,數(shù)據(jù)挖掘,流程,聚類分析


圖 2-2 數(shù)據(jù)挖掘流程Figure 2-2 Data Mining Process數(shù)據(jù)挖掘方法 聚類分析聚類分析是通過(guò)使用樣本數(shù)據(jù)所具有的一組屬性對(duì)數(shù)據(jù)進(jìn)行劃分的[38],依的相似程度來(lái)計(jì)算數(shù)據(jù)之間的相似性和差異性。聚類分析系統(tǒng)的輸入包括析的數(shù)據(jù)集,以及可以用來(lái)作為衡量?jī)蓚(gè)簇集之間相似(相異)程度的標(biāo)準(zhǔn)分析的結(jié)果輸出是將數(shù)據(jù)集進(jìn)行劃分后的組群。聚類分析往往會(huì)對(duì)每一個(gè)進(jìn)行相應(yīng)的說(shuō)明或是概括性的描述,這種結(jié)果描述對(duì)于進(jìn)一步分析數(shù)據(jù)集尤為重要。目前比較常見(jiàn)的聚類分析算法有 K-means、基于劃分的聚類算法模型的聚類方法等等,聚類分析往往應(yīng)用在商業(yè)對(duì)客戶群體的分類;股市民購(gòu)買趨勢(shì)的預(yù)測(cè)、市場(chǎng)銷售的細(xì)分;許多圖書銷售網(wǎng)站也會(huì)對(duì)客戶的購(gòu)進(jìn)行聚類分析,,從而根據(jù)用戶喜歡的圖書類型推薦新上市的或是流行的書
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:R319;TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張宏哲;;FFT算法的一種改進(jìn)[J];長(zhǎng)安大學(xué)學(xué)報(bào)(自然科學(xué)版);1988年01期

2 苑寶生,俞鐵城;連呼漢語(yǔ)識(shí)別研究[J];聲學(xué)學(xué)報(bào);1989年06期

3 孫楊模;;操作系統(tǒng)常見(jiàn)的幾種算法舉例分析[J];湖北三峽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年02期

4 郜振華;吳昊;;一種改進(jìn)的混合蝙蝠算法[J];南華大學(xué)學(xué)報(bào)(自然科學(xué)版);2019年01期

5 吳天行;郭鍵;;基于“反學(xué)習(xí)”理論的人工蜂群算法在訂單分批問(wèn)題中的應(yīng)用[J];物流技術(shù);2017年12期

6 全燕;陳龍;;算法傳播的風(fēng)險(xiǎn)批判:公共性背離與主體扭曲[J];華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2019年01期

7 肖海軍;成金華;何凡;;雙核因素蝙蝠算法[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2018年01期

8 張進(jìn);;一種快速雙對(duì)分邏輯運(yùn)算算法[J];情報(bào)學(xué)報(bào);1992年03期

9 陳廣江;用MUSIC算法處理非均勻間隔采樣數(shù)據(jù)[J];系統(tǒng)工程與電子技術(shù);1998年09期

10 于浩;王芳;;ROHC算法在LWIP上的仿真與實(shí)現(xiàn)[J];計(jì)算機(jī)仿真;2017年12期

相關(guān)會(huì)議論文 前8條

1 李孟霖;余祥;巫岱s

本文編號(hào):2607548


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/swyx/2607548.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶baed6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com