基于類劃分和近鄰選取的k近鄰算法研究
發(fā)布時(shí)間:2021-05-18 08:23
在大數(shù)據(jù)時(shí)代,怎樣從海量數(shù)據(jù)中挖掘出有用信息已經(jīng)成為大眾廣泛關(guān)注的一個(gè)焦點(diǎn)問(wèn)題,數(shù)據(jù)挖掘技術(shù)為解決該問(wèn)題提供了一個(gè)有效途徑。數(shù)據(jù)分類是數(shù)據(jù)挖掘中的一個(gè)重要方法,其中k近鄰分類算法憑借其簡(jiǎn)單、易操作等優(yōu)點(diǎn)被人們廣泛應(yīng)用。但與此同時(shí),k近鄰分類算法也存在著對(duì)k值選取敏感、易受不平衡數(shù)據(jù)影響和距離度量選取過(guò)于簡(jiǎn)單等問(wèn)題。本文主要在k近鄰分類算法和基于局部均值的k近鄰分類算法的基礎(chǔ)上,利用群智能優(yōu)化和稀疏表示等技術(shù)對(duì)k近鄰分類算法進(jìn)行改進(jìn),來(lái)克服原始算法的一些缺陷,進(jìn)而提升算法的分類性能。具體研究?jī)?nèi)容和研究結(jié)果如下:1.針對(duì)基本的蚱蜢優(yōu)化算法易陷入局部最優(yōu)和收斂精度不高等問(wèn)題,提出了一種改進(jìn)的蚱蜢優(yōu)化算法。首先,利用混沌反向?qū)W習(xí)初始化策略,產(chǎn)生了一群較優(yōu)的初始種群;利用自然指數(shù)遞減策略,平衡了算法的勘測(cè)和開發(fā)能力;利用高斯變異策略,克服了算法的易陷入局部最優(yōu)的問(wèn)題。然后,利用10個(gè)基準(zhǔn)測(cè)試函數(shù)進(jìn)行實(shí)驗(yàn),結(jié)果表明,改進(jìn)的算法具有較高的收斂效率和求解精度。最后,針對(duì)距離加權(quán)k近鄰算法對(duì)距離度量的依賴性過(guò)高,生成的權(quán)重具有一定的隨機(jī)性等問(wèn)題,提出了一種基于改進(jìn)的蚱蜢優(yōu)化算法的距離加權(quán)k近鄰算法,利用...
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 k近鄰算法國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 蚱蜢優(yōu)化算法國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 本文組織結(jié)構(gòu)
2 預(yù)備知識(shí)
2.1 k近鄰分類算法及其相關(guān)概念
2.1.1 基本概念
2.1.2 鄰近度度量
2.1.3 評(píng)價(jià)方法和指標(biāo)
2.2 蚱蜢優(yōu)化算法
2.2.1 蚱蜢優(yōu)化算法的基本概念
2.2.2 蚱蜢優(yōu)化算法的應(yīng)用領(lǐng)域
2.3 本章小結(jié)
3 基于改進(jìn)的蚱蜢優(yōu)化算法的距離加權(quán)k近鄰算法
3.1 改進(jìn)的蚱蜢優(yōu)化算法
3.1.1 算法的基本思想
3.1.2 混沌反向?qū)W習(xí)初始化策略
3.1.3 自然指數(shù)遞減策略
3.1.4 高斯變異策略
3.1.5 改進(jìn)算法的描述
3.1.6 IGOA的實(shí)驗(yàn)與分析
3.2 基于改進(jìn)的蚱蜢優(yōu)化算法的距離加權(quán)k近鄰算法
3.2.1 算法的基本思想
3.2.2 距離加權(quán)的k近鄰算法
3.2.3 算法的基本描述
3.2.4 IGOA-DWKNN的實(shí)驗(yàn)與分析
3.3 本章小結(jié)
4 基于互信息相關(guān)度和局部均值的k近鄰改進(jìn)算法
4.1 算法的基本思想
4.1.1 基于互信息相關(guān)度的屬性權(quán)重
4.1.2 基于局部均值的類劃分策略
4.1.3 算法步驟
4.2 實(shí)驗(yàn)結(jié)果與分析
4.2.1 實(shí)驗(yàn)?zāi)康?br> 4.2.2 實(shí)驗(yàn)結(jié)果
4.3 本章小結(jié)
5 基于屬性加權(quán)和稀疏系數(shù)的調(diào)和近鄰算法
5.1 算法的基本思想
5.2 基于屬性權(quán)重和稀疏系數(shù)的調(diào)和近鄰算法
5.2.1 相關(guān)概念
5.2.2 綜合屬性權(quán)重
5.2.3 兩步近鄰選取策略
5.2.4 近鄰樣本代表性分析
5.2.5 算法步驟
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)環(huán)境
5.3.2 標(biāo)準(zhǔn)數(shù)據(jù)集
5.3.3 含噪數(shù)據(jù)集
5.3.4 Wilcoxon符號(hào)秩檢驗(yàn)
5.3.5 算法復(fù)雜度分析
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 主要研究結(jié)果
6.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)K-modes聚類的KNN分類算法[J]. 王志華,劉紹廷,羅齊. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(08)
[2]改進(jìn)多元宇宙算法求解大規(guī)模實(shí)值優(yōu)化問(wèn)題[J]. 劉小龍. 電子與信息學(xué)報(bào). 2019(07)
[3]基于聚類的環(huán)形kNN算法[J]. 匡振曦,武繼剛,李嘉興. 計(jì)算機(jī)工程與科學(xué). 2019(05)
[4]基于GOA-SVM的短期負(fù)荷預(yù)測(cè)[J]. 宮毓斌,滕歡. 電測(cè)與儀表. 2019(14)
[5]KNN算法綜述[J]. 竇小凡. 通訊世界. 2018(10)
[6]模型決策樹:一種決策樹加速算法[J]. 尹儒,門昌騫,王文劍,劉澍澤. 模式識(shí)別與人工智能. 2018(07)
[7]基于類別信息熵加權(quán)的MKNN算法[J]. 陳雪云,劉艷芳,柯婷,張劍楠. 數(shù)碼設(shè)計(jì). 2017(01)
[8]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[9]大數(shù)據(jù)關(guān)聯(lián)關(guān)系度量研究綜述[J]. 錢宇華,成紅紅,梁新彥,王建新. 數(shù)據(jù)采集與處理. 2015(06)
[10]用于大數(shù)據(jù)分類的KNN算法研究[J]. 耿麗娟,李星毅. 計(jì)算機(jī)應(yīng)用研究. 2014(05)
碩士論文
[1]基于蚱蜢優(yōu)化和最小二乘支持向量機(jī)的電力負(fù)荷預(yù)測(cè)研究[D]. 張育凡.蘭州大學(xué) 2018
[2]基于互信息的屬性選擇算法研究[D]. 郭衍奎.北京交通大學(xué) 2015
本文編號(hào):3193473
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 k近鄰算法國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 蚱蜢優(yōu)化算法國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 本文組織結(jié)構(gòu)
2 預(yù)備知識(shí)
2.1 k近鄰分類算法及其相關(guān)概念
2.1.1 基本概念
2.1.2 鄰近度度量
2.1.3 評(píng)價(jià)方法和指標(biāo)
2.2 蚱蜢優(yōu)化算法
2.2.1 蚱蜢優(yōu)化算法的基本概念
2.2.2 蚱蜢優(yōu)化算法的應(yīng)用領(lǐng)域
2.3 本章小結(jié)
3 基于改進(jìn)的蚱蜢優(yōu)化算法的距離加權(quán)k近鄰算法
3.1 改進(jìn)的蚱蜢優(yōu)化算法
3.1.1 算法的基本思想
3.1.2 混沌反向?qū)W習(xí)初始化策略
3.1.3 自然指數(shù)遞減策略
3.1.4 高斯變異策略
3.1.5 改進(jìn)算法的描述
3.1.6 IGOA的實(shí)驗(yàn)與分析
3.2 基于改進(jìn)的蚱蜢優(yōu)化算法的距離加權(quán)k近鄰算法
3.2.1 算法的基本思想
3.2.2 距離加權(quán)的k近鄰算法
3.2.3 算法的基本描述
3.2.4 IGOA-DWKNN的實(shí)驗(yàn)與分析
3.3 本章小結(jié)
4 基于互信息相關(guān)度和局部均值的k近鄰改進(jìn)算法
4.1 算法的基本思想
4.1.1 基于互信息相關(guān)度的屬性權(quán)重
4.1.2 基于局部均值的類劃分策略
4.1.3 算法步驟
4.2 實(shí)驗(yàn)結(jié)果與分析
4.2.1 實(shí)驗(yàn)?zāi)康?br> 4.2.2 實(shí)驗(yàn)結(jié)果
4.3 本章小結(jié)
5 基于屬性加權(quán)和稀疏系數(shù)的調(diào)和近鄰算法
5.1 算法的基本思想
5.2 基于屬性權(quán)重和稀疏系數(shù)的調(diào)和近鄰算法
5.2.1 相關(guān)概念
5.2.2 綜合屬性權(quán)重
5.2.3 兩步近鄰選取策略
5.2.4 近鄰樣本代表性分析
5.2.5 算法步驟
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)環(huán)境
5.3.2 標(biāo)準(zhǔn)數(shù)據(jù)集
5.3.3 含噪數(shù)據(jù)集
5.3.4 Wilcoxon符號(hào)秩檢驗(yàn)
5.3.5 算法復(fù)雜度分析
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 主要研究結(jié)果
6.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)K-modes聚類的KNN分類算法[J]. 王志華,劉紹廷,羅齊. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(08)
[2]改進(jìn)多元宇宙算法求解大規(guī)模實(shí)值優(yōu)化問(wèn)題[J]. 劉小龍. 電子與信息學(xué)報(bào). 2019(07)
[3]基于聚類的環(huán)形kNN算法[J]. 匡振曦,武繼剛,李嘉興. 計(jì)算機(jī)工程與科學(xué). 2019(05)
[4]基于GOA-SVM的短期負(fù)荷預(yù)測(cè)[J]. 宮毓斌,滕歡. 電測(cè)與儀表. 2019(14)
[5]KNN算法綜述[J]. 竇小凡. 通訊世界. 2018(10)
[6]模型決策樹:一種決策樹加速算法[J]. 尹儒,門昌騫,王文劍,劉澍澤. 模式識(shí)別與人工智能. 2018(07)
[7]基于類別信息熵加權(quán)的MKNN算法[J]. 陳雪云,劉艷芳,柯婷,張劍楠. 數(shù)碼設(shè)計(jì). 2017(01)
[8]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[9]大數(shù)據(jù)關(guān)聯(lián)關(guān)系度量研究綜述[J]. 錢宇華,成紅紅,梁新彥,王建新. 數(shù)據(jù)采集與處理. 2015(06)
[10]用于大數(shù)據(jù)分類的KNN算法研究[J]. 耿麗娟,李星毅. 計(jì)算機(jī)應(yīng)用研究. 2014(05)
碩士論文
[1]基于蚱蜢優(yōu)化和最小二乘支持向量機(jī)的電力負(fù)荷預(yù)測(cè)研究[D]. 張育凡.蘭州大學(xué) 2018
[2]基于互信息的屬性選擇算法研究[D]. 郭衍奎.北京交通大學(xué) 2015
本文編號(hào):3193473
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3193473.html
最近更新
教材專著