Apriori算法在慢病預(yù)測(cè)中的應(yīng)用研究
【圖文】:
第 2 章 相關(guān)理論技術(shù)誤數(shù)據(jù)或是偏離正常區(qū)間的離群點(diǎn)等。這樣的數(shù)據(jù)會(huì)對(duì)最終的數(shù)據(jù)挖掘結(jié)果產(chǎn)很大的影響,因此需要通過(guò)數(shù)據(jù)預(yù)處理工作將低質(zhì)量的數(shù)據(jù)轉(zhuǎn)化為一致、完整、確的高質(zhì)量數(shù)據(jù)。數(shù)據(jù)預(yù)處理的一般方法[37]有數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)變換、據(jù)規(guī)約和數(shù)據(jù)離散化等,具體任務(wù)如圖 2-1 所示。
圖 2-2 數(shù)據(jù)挖掘流程Figure 2-2 Data Mining Process數(shù)據(jù)挖掘方法 聚類分析聚類分析是通過(guò)使用樣本數(shù)據(jù)所具有的一組屬性對(duì)數(shù)據(jù)進(jìn)行劃分的[38],依的相似程度來(lái)計(jì)算數(shù)據(jù)之間的相似性和差異性。聚類分析系統(tǒng)的輸入包括析的數(shù)據(jù)集,以及可以用來(lái)作為衡量?jī)蓚(gè)簇集之間相似(相異)程度的標(biāo)準(zhǔn)分析的結(jié)果輸出是將數(shù)據(jù)集進(jìn)行劃分后的組群。聚類分析往往會(huì)對(duì)每一個(gè)進(jìn)行相應(yīng)的說(shuō)明或是概括性的描述,這種結(jié)果描述對(duì)于進(jìn)一步分析數(shù)據(jù)集尤為重要。目前比較常見(jiàn)的聚類分析算法有 K-means、基于劃分的聚類算法模型的聚類方法等等,聚類分析往往應(yīng)用在商業(yè)對(duì)客戶群體的分類;股市民購(gòu)買趨勢(shì)的預(yù)測(cè)、市場(chǎng)銷售的細(xì)分;許多圖書銷售網(wǎng)站也會(huì)對(duì)客戶的購(gòu)進(jìn)行聚類分析,,從而根據(jù)用戶喜歡的圖書類型推薦新上市的或是流行的書
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:R319;TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張宏哲;;FFT算法的一種改進(jìn)[J];長(zhǎng)安大學(xué)學(xué)報(bào)(自然科學(xué)版);1988年01期
2 苑寶生,俞鐵城;連呼漢語(yǔ)識(shí)別研究[J];聲學(xué)學(xué)報(bào);1989年06期
3 孫楊模;;操作系統(tǒng)常見(jiàn)的幾種算法舉例分析[J];湖北三峽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年02期
4 郜振華;吳昊;;一種改進(jìn)的混合蝙蝠算法[J];南華大學(xué)學(xué)報(bào)(自然科學(xué)版);2019年01期
5 吳天行;郭鍵;;基于“反學(xué)習(xí)”理論的人工蜂群算法在訂單分批問(wèn)題中的應(yīng)用[J];物流技術(shù);2017年12期
6 全燕;陳龍;;算法傳播的風(fēng)險(xiǎn)批判:公共性背離與主體扭曲[J];華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2019年01期
7 肖海軍;成金華;何凡;;雙核因素蝙蝠算法[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2018年01期
8 張進(jìn);;一種快速雙對(duì)分邏輯運(yùn)算算法[J];情報(bào)學(xué)報(bào);1992年03期
9 陳廣江;用MUSIC算法處理非均勻間隔采樣數(shù)據(jù)[J];系統(tǒng)工程與電子技術(shù);1998年09期
10 于浩;王芳;;ROHC算法在LWIP上的仿真與實(shí)現(xiàn)[J];計(jì)算機(jī)仿真;2017年12期
相關(guān)會(huì)議論文 前8條
1 李孟霖;余祥;巫岱s
本文編號(hào):2607548
本文鏈接:http://sikaile.net/yixuelunwen/swyx/2607548.html