K-Means算法研究及其與智能算法的融合
本文關(guān)鍵詞:K-Means算法研究及其與智能算法的融合
更多相關(guān)文章: 數(shù)據(jù)挖掘 聚類分析 遺傳算子 K-Means算法 蟻群算法
【摘要】:隨著大數(shù)據(jù)時(shí)代的到來(lái),從海量數(shù)據(jù)中獲取有價(jià)值信息的需求日益增加,迫切需要一些新的方法來(lái)處理海量數(shù)據(jù)。聚類分析作為數(shù)據(jù)挖掘中的重要組成部分,對(duì)數(shù)據(jù)挖掘技術(shù)的發(fā)展有著重要意義。聚類分析不僅可以單獨(dú)對(duì)數(shù)據(jù)集進(jìn)行處理,獲得需要的數(shù)據(jù)分布情況,還能夠作為其他數(shù)據(jù)挖掘算法的數(shù)據(jù)前期預(yù)處理操作。針對(duì)傳統(tǒng)方法在解決現(xiàn)有問(wèn)題上的不足,和更好的對(duì)海量數(shù)據(jù)進(jìn)行處理,發(fā)現(xiàn)數(shù)據(jù)集中隱含的有價(jià)值信息,以及能更全面、更高效的滿足實(shí)際應(yīng)用需要,亟需對(duì)相關(guān)聚類方法進(jìn)行深入研究。K-Means聚類算法是一種思想簡(jiǎn)單易于實(shí)現(xiàn),并且收斂速度快的經(jīng)典聚類方法,該算法存在的主要缺點(diǎn)是初始化時(shí)需要明確給出數(shù)據(jù)集要聚成簇的數(shù)目和初始的聚類中心。群體智能算法是一種模擬群體生物生活習(xí)性的優(yōu)化搜索算法,遺傳算法和螞蟻算法是其代表性算法。遺傳算法是對(duì)整個(gè)解空間進(jìn)行搜索并且下一代的產(chǎn)生是通過(guò)遺傳操作獲得,所以能夠增加解的多樣性,擴(kuò)大搜索范圍,避免收斂于局部最優(yōu)解。螞蟻算法具有較強(qiáng)適應(yīng)性,能處理多種類型數(shù)據(jù)并且能夠發(fā)現(xiàn)最優(yōu)解,并且還具有易于與其他智能算法或聚類算法結(jié)合成高效、新型組合算法的優(yōu)點(diǎn)。本文主要是對(duì)聚類算法和智能算法進(jìn)行研究。首先對(duì)聚類分析的相關(guān)內(nèi)容進(jìn)行了介紹,詳細(xì)分析了聚類的要求、評(píng)價(jià)準(zhǔn)則和經(jīng)典的聚類方法等,然后介紹了群體智能的相關(guān)概念,主要分析了遺傳算法和螞蟻算法的原理及算法流程和優(yōu)缺點(diǎn)。由于蟻群聚類算法存在前期收斂速度慢,后期出現(xiàn)易早熟的缺點(diǎn),有學(xué)者針對(duì)K-Means聚類算法收斂速度快和螞蟻算法能獲得最優(yōu)解的優(yōu)點(diǎn)提出將兩者相結(jié)合的算法,但該算法并沒(méi)有改善后期易早熟的問(wèn)題。針對(duì)現(xiàn)有方法在后期易陷入早熟的缺點(diǎn),本文提出在算法迭代后期引入遺傳算法中的變異算子,增加解的多樣性,擴(kuò)大搜索范圍。通過(guò)采用UCI數(shù)據(jù)集中數(shù)據(jù),以及與螞蟻聚類算法、原有K-Means蟻群聚類算法的對(duì)比實(shí)驗(yàn)驗(yàn)證改進(jìn)的新算法能夠有效改善收斂局部最優(yōu)的問(wèn)題,并且保留了原有算法加快收斂速度的優(yōu)點(diǎn)。針對(duì)K-Means聚類算法初始簇?cái)?shù)目值的給定以及隨機(jī)選擇聚類中心對(duì)聚類結(jié)果產(chǎn)生較大波動(dòng)的弊端,結(jié)合層次聚類的分裂和凝聚思想,提出基于最小生成樹的層次K-Means聚類算法,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了該算法的有效性。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 聚類分析 遺傳算子 K-Means算法 蟻群算法
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP18;TP311.13
【目錄】:
- 摘要3-5
- Abstract5-9
- 第1章 緒論9-14
- 1.1 研究的背景與意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-13
- 1.3 論文內(nèi)容安排13-14
- 1.3.1 本文主要研究?jī)?nèi)容13
- 1.3.2 章節(jié)安排13-14
- 第2章 聚類算法概述14-21
- 2.1 聚類算法的要求14-15
- 2.2 數(shù)據(jù)樣本相似性判定15-16
- 2.3 聚類的評(píng)價(jià)準(zhǔn)則16-17
- 2.4 聚類算法介紹17-20
- 2.5 本章小結(jié)20-21
- 第3章 群體智能的基本理論21-30
- 3.1 遺傳算法的基本原理21-23
- 3.1.1 遺傳算法的重要特征21-22
- 3.1.2 遺傳算法的主要運(yùn)算過(guò)程22-23
- 3.2 蟻群算法的基本描述23-25
- 3.3 蟻群算法優(yōu)缺點(diǎn)分析25-27
- 3.4 蟻群聚類算法27-29
- 3.4.1 基于覓食原理的蟻群聚類算法27-28
- 3.4.2 基于蟻堆的蟻群聚類算法28-29
- 3.5 本章小結(jié)29-30
- 第4章 一種改進(jìn)的K-Means蟻群聚類算法30-37
- 4.1 K-Means和螞蟻聚類算法的結(jié)合30-32
- 4.1.1 基于信息素的螞蟻聚類算法和K-Means算法的結(jié)合31-32
- 4.1.2 基于蟻堆聚類算法和K-Means算法的結(jié)合32
- 4.2 一種改進(jìn)的K-Means螞蟻聚類算法32-34
- 4.2.1 現(xiàn)有算法的優(yōu)缺點(diǎn)32
- 4.2.2 本文改進(jìn)思想32-33
- 4.2.3 算法的具體步驟33-34
- 4.3 仿真實(shí)驗(yàn)34-36
- 4.4 本章小結(jié)36-37
- 第5章 基于最小生成樹的層次K-Means聚類算法37-46
- 5.1 改進(jìn)K-Means算法介紹37-38
- 5.2 Prim算法38
- 5.3 基于最小生成樹的層次K-Means算法38-45
- 5.3.1 改進(jìn)思想38-39
- 5.3.2 算法具體實(shí)現(xiàn)步驟39-40
- 5.3.3 仿真實(shí)驗(yàn)40-45
- 5.4 本章小結(jié)45-46
- 第6章 總結(jié)與展望46-48
- 6.1 總結(jié)46
- 6.2 展望46-48
- 參考文獻(xiàn)48-52
- 致謝52-53
- 附錄 (攻讀碩士學(xué)位期間發(fā)表錄用論文)53
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 馮舜璽;;新書推薦:《算法分析導(dǎo)論》[J];計(jì)算機(jī)教育;2006年05期
2 張力,慕曉冬;計(jì)算機(jī)算法分析淺談[J];武警工程學(xué)院學(xué)報(bào);2002年04期
3 馬安光;;飛彈問(wèn)題的算法分析——2003年第10期題解[J];程序員;2003年12期
4 蘇運(yùn)霖;;《算法分析導(dǎo)論》評(píng)介[J];計(jì)算機(jī)教育;2006年07期
5 朱力強(qiáng);;培養(yǎng)學(xué)生創(chuàng)新思維與能力的算法分析案例[J];計(jì)算機(jī)與信息技術(shù);2007年11期
6 汪菊琴;;幾種常見特殊方陣的算法分析與實(shí)現(xiàn)[J];無(wú)錫職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年05期
7 李涵;;“算法分析與設(shè)計(jì)”課程教學(xué)改革和實(shí)踐[J];中國(guó)電力教育;2010年16期
8 劉寧;管濤;;淺析案例教學(xué)法在算法分析與設(shè)計(jì)課程中的應(yīng)用[J];科技風(fēng);2011年07期
9 胡峰;王國(guó)胤;;“算法分析與設(shè)計(jì)”教學(xué)模式探索[J];當(dāng)代教育理論與實(shí)踐;2011年12期
10 趙娟;;淺析啟發(fā)式教學(xué)法在《算法分析與設(shè)計(jì)》課程中的應(yīng)用[J];福建電腦;2012年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 俞洋;田亞菲;;一種新的變步長(zhǎng)LMS算法及其仿真[A];通信理論與信號(hào)處理新進(jìn)展——2005年通信理論與信號(hào)處理年會(huì)論文集[C];2005年
2 周顥;劉振華;趙保華;;構(gòu)造型的D~2FA生成算法[A];中國(guó)通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年
3 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年
4 劉遠(yuǎn)新;鄧飛其;羅艷輝;舒添慧;;ERP柔性平臺(tái)下物流運(yùn)輸配送系統(tǒng)算法分析[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
5 王樹西;白碩;姜吉發(fā);;模式合一的“減首去尾”算法[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
6 王萬(wàn)青;張曉輝;;改進(jìn)的A~*算法的高效實(shí)現(xiàn)[A];2009全國(guó)測(cè)繪科技信息交流會(huì)暨首屆測(cè)繪博客征文頒獎(jiǎng)?wù)撐募痆C];2009年
7 孫煥良;邱菲;劉俊嶺;朱葉麗;;IncSNN——一種基于密度的增量聚類算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
8 韓建民;岑婷婷;于娟;;實(shí)現(xiàn)敏感屬性l-多樣性的l-MDAV算法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
9 張悅;尤楓;趙瑞蓮;;利用蟻群算法實(shí)現(xiàn)基于程序結(jié)構(gòu)的主變?cè)治鯷A];第五屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2008年
10 王旭東;劉渝;鄧振淼;;正弦波頻率估計(jì)的修正Rife算法及其FPGA實(shí)現(xiàn)[A];全國(guó)第十屆信號(hào)與信息處理、第四屆DSP應(yīng)用技術(shù)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 科文;VIXD算法分析Web異常[N];中國(guó)計(jì)算機(jī)報(bào);2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 魏哲學(xué);樣本斷點(diǎn)距離問(wèn)題的算法與復(fù)雜性研究[D];山東大學(xué);2015年
2 劉春明;基于增強(qiáng)學(xué)習(xí)和車輛動(dòng)力學(xué)的高速公路自主駕駛研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
3 張敏霞;生物地理學(xué)優(yōu)化算法及其在應(yīng)急交通規(guī)劃中的應(yīng)用研究[D];浙江工業(yè)大學(xué);2015年
4 李紅;流程挖掘算法研究[D];云南大學(xué);2015年
5 盛歆漪;粒子群優(yōu)化算法及其應(yīng)用研究[D];江南大學(xué);2015年
6 黃磊;高動(dòng)態(tài)環(huán)境捷聯(lián)慣導(dǎo)信號(hào)處理及高精度姿態(tài)速度算法研究[D];南京航空航天大學(xué);2015年
7 劉新旺;多核學(xué)習(xí)算法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
8 于濱;城市公交系統(tǒng)模型與算法研究[D];大連理工大學(xué);2006年
9 曾國(guó)強(qiáng);改進(jìn)的極值優(yōu)化算法及其在組合優(yōu)化問(wèn)題中的應(yīng)用研究[D];浙江大學(xué);2011年
10 肖永豪;蜂群算法及在圖像處理中的應(yīng)用研究[D];華南理工大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 黃廈;基于改進(jìn)蟻群算法的柔性作業(yè)車間調(diào)度問(wèn)題研究[D];昆明理工大學(xué);2015年
2 李平;基于Hadoop的信息爬取與輿情檢測(cè)算法研究[D];昆明理工大學(xué);2015年
3 趙官寶;基于位表的關(guān)聯(lián)規(guī)則挖掘算法研究[D];昆明理工大學(xué);2015年
4 殷文華;移動(dòng)容遲網(wǎng)絡(luò)中基于社會(huì)感知的多播分發(fā)算法研究[D];內(nèi)蒙古大學(xué);2015年
5 徐翔燕;人工魚群優(yōu)化算法及其應(yīng)用研究[D];西南交通大學(xué);2015年
6 李德福;基于小世界模型的啟發(fā)式尋路算法研究[D];華中師范大學(xué);2015年
7 鄭海彬;一種面向MAPREDUCE的DATASHUFFLE的優(yōu)化方法[D];蘇州大學(xué);2015年
8 趙曉寒;輪換步長(zhǎng)PSO算法及SMVSC參數(shù)優(yōu)化[D];沈陽(yáng)理工大學(xué);2015年
9 安豐洋;基于無(wú)線網(wǎng)絡(luò)的廣播算法研究[D];曲阜師范大學(xué);2015年
10 李智明;基于改進(jìn)FastICA算法的混合語(yǔ)音盲分離[D];上海交通大學(xué);2015年
,本文編號(hào):873447
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/873447.html