CLIQUE網(wǎng)格聚類算法在醫(yī)學(xué)空間數(shù)據(jù)中的應(yīng)用
本文關(guān)鍵詞:CLIQUE網(wǎng)格聚類算法在醫(yī)學(xué)空間數(shù)據(jù)中的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:目的:糖尿病指的是由于身體機能失衡,所導(dǎo)致的以血糖高于正常值范圍為主要表現(xiàn)的全身進行性疾病,其并發(fā)癥多,患病率高,已經(jīng)逐漸成為了影響世界各國的一個重要公共問題。根據(jù)國際糖尿病聯(lián)盟(IDF)截止到2013年底的數(shù)據(jù)顯示,2013年間,全球死于糖尿病相關(guān)疾病的人數(shù)超過了510萬,達到了全年死亡人口的8.39%,全年的相關(guān)醫(yī)療花費達到了5480億美元,占到了全部花費的11%,其中我國從進入21世紀(jì)以來,糖尿病人口數(shù)不斷上升,到2013年底,已經(jīng)成為了世界上患病人數(shù)最多的國家,達到了9840萬人。所以如何運用統(tǒng)計學(xué)的方法對糖尿病數(shù)據(jù)進行分析,從而有效地預(yù)防該病的發(fā)生和發(fā)展,具有很好的現(xiàn)實意義。本文的研究主要有以下兩個目的:第一將CLIQUE網(wǎng)格聚類算法運用到糖尿病患者的時空數(shù)據(jù)中并與基于劃分(K-means算法)和基于密度(DBSCAN算法)的算法進行比較;第二對聚類結(jié)果中各個維度(如年齡、性別、生活習(xí)慣等方面)進行進一步分析,預(yù)防糖尿病的發(fā)生。方法:空間數(shù)據(jù)挖掘中的聚類分析是數(shù)據(jù)挖掘研究中一個重要領(lǐng)域,它既可以作為一個單獨的工具發(fā)現(xiàn)數(shù)據(jù)庫中隱藏分布的一些信息,也可以作為其他數(shù)據(jù)挖掘算法的預(yù)處理步驟。它主要目的是將數(shù)據(jù)集劃分為若干個簇,使得簇內(nèi)差異最小,簇間差異最大。在描述簇間的相似度大小時,主要是根據(jù)對象間的距離來確定的,距離越大,相似度越小,常用的距離有歐幾里得距離和曼哈坦距離以及明考斯基距離。網(wǎng)格聚類技術(shù)是指把數(shù)據(jù)空間分成確定數(shù)目的網(wǎng)格單元來構(gòu)建網(wǎng)格結(jié)構(gòu),然后再在得到的網(wǎng)格上進行聚類操作,與傳統(tǒng)的聚類算法相比,基于網(wǎng)格的聚類算法具有更高的效率,且能夠識別任意形狀的簇,網(wǎng)格聚類分析現(xiàn)已被廣泛的應(yīng)用于模式識別、數(shù)據(jù)分析以及圖像處理等領(lǐng)域。結(jié)果:得到了聚類時間以及內(nèi)在外在方法的聚類精度方面的結(jié)果,通過對這些結(jié)果的分析可以得出以下的結(jié)論。結(jié)論:本文利用統(tǒng)計學(xué)上的三種聚類算法對美國130所醫(yī)院10年間的糖尿病病人的相關(guān)數(shù)據(jù)進行實例分析,并對聚類結(jié)果在運算時間、結(jié)果的精確度方面進行了比較,通過比較可以發(fā)現(xiàn)無論是時間還是精度方面,結(jié)果最好的聚類算法是CLIQUE算法,其次為DBSCAN算法,最差的為K-means算法。
【關(guān)鍵詞】:空間數(shù)據(jù) 數(shù)據(jù)挖掘 網(wǎng)格聚類法
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:R181.2
【目錄】:
- 中文摘要5-7
- 英文摘要7-9
- 前言9-12
- 1 空間數(shù)據(jù)挖掘概述12-17
- 1.1 空間數(shù)據(jù)挖掘的定義及過程12-13
- 1.2 空間數(shù)據(jù)挖掘的特點13-14
- 1.3 空間數(shù)據(jù)挖掘的主要方法14-15
- 1.4 本章小結(jié)15-17
- 2 聚類分析17-23
- 2.1 聚類分析的研究意義與概念17
- 2.2 聚類分析的數(shù)學(xué)描述和主要方法17-22
- 2.3 本章小結(jié)22-23
- 3 網(wǎng)格聚類算法23-30
- 3.1 算法介紹23-25
- 3.2 實例分析25-27
- 3.3 結(jié)果比較和討論27-30
- 4 總結(jié)與展望30-32
- 4.1 總結(jié)30
- 4.2 展望30-32
- 參考文獻32-35
- 綜述35-39
- 參考文獻38-39
- 致謝39-40
- 在學(xué)期間承擔(dān)/參與的科研課題與研究成果40-41
- 個人簡介41
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 胡玉鎖;陳宗海;;基于混合遺傳算法的聚類分析[J];模式識別與人工智能;2001年03期
2 吉根林;趙斌;;面向大數(shù)據(jù)的時空數(shù)據(jù)挖掘綜述[J];南京師大學(xué)報(自然科學(xué)版);2014年01期
3 陳寧,陳安,周龍驤;基于密度的增量式網(wǎng)格聚類算法(英文)[J];軟件學(xué)報;2002年01期
4 邱保志;鄭智杰;;基于局部密度和動態(tài)生成網(wǎng)格聚類算法[J];計算機工程與設(shè)計;2010年02期
5 白鷺;馬驥;;基于測度的網(wǎng)格聚類算法[J];沈陽大學(xué)學(xué)報;2009年04期
6 李德仁,王樹良,李德毅,王新洲;論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論與方法[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2002年03期
7 趙慧;劉希玉;崔海青;;網(wǎng)格聚類算法[J];計算機技術(shù)與發(fā)展;2010年09期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 陽斌;密度影響因子相關(guān)的網(wǎng)格聚類算法研究[D];浙江理工大學(xué);2014年
本文關(guān)鍵詞:CLIQUE網(wǎng)格聚類算法在醫(yī)學(xué)空間數(shù)據(jù)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:302290
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/302290.html