基于改進KNN算法的圖像分類研究
發(fā)布時間:2021-06-30 06:59
機器學習是當前大數(shù)據(jù)處理中的重要方法和手段,利用機器學習來處理圖像分類是當前學者們研究的熱點。在圖像分類處理技術方面已經(jīng)催生了許多成熟而有效的機器學習算法,其中K近鄰算法(KNN)簡單、直觀且理論上比較成熟,是最簡易的機器學習方法之一,但也存在處理圖像分類時分類準確率不夠高、運算效率較低等缺點。本研究旨在提高圖像分類算法的分類準確率和運算效率,分別提出了三種基于改進KNN算法的圖像分類算法。首先提出了一種基于K值選取策略的改進KNN算法。在改進算法中增加了兩種分類決策規(guī)則,達到提高分類準確率的效果。其次提出了一種基于K均值聚類模型的KNN算法。在分類處理前對訓練樣本進行優(yōu)化處理,然后通過K均值聚類方法把樣本聚為不同的子類,每一個子類以聚類中心為新樣本點構建新數(shù)據(jù)集,達到壓縮樣本量的效果,從而減少了運算量提高了運算效率。最后提出了一種基于并行計算模式的改進KNN算法。該算法構建并行計算模式,讓整個分類算法分布式并行進行,在保持或提高分類準確率的情況下大幅度提高了運算速度。
【文章來源】:貴州民族大學貴州省
【文章頁數(shù)】:53 頁
【學位級別】:碩士
【部分圖文】:
pd距離間關系圖
貴州民族大學2020屆碩士研究生學位論文29續(xù)圖4.2基于K均值聚類的改進KNN算法流程圖(新訓練數(shù)據(jù)分類)2.改進算法原理步驟:(1)收集、準備數(shù)據(jù),提取特征;(2)將數(shù)據(jù)集中大部分數(shù)據(jù)作為訓練數(shù)據(jù)集,并構建訓練樣本集合X,nixXR,其中nR為n維空間,ix為第i個樣本,i=1,2,,N,余下少部分數(shù)據(jù)作為測試樣本,用于驗證訓練好的模型;(3)統(tǒng)計訓練數(shù)據(jù)集中樣本類別c的數(shù)量及每類樣本個數(shù)m,記為12{,,,}kc=ccc,12{,,,}km=mmm,共k類;(4)計算每類樣本中心u,11jmljjluxm==,其中jm為第j類的樣本個數(shù),lx表示屬于ju(即jc)這個類別的樣本點。所有類的中心點記為12{,,,}ku=uuu;(5)遍歷每類里所有樣本,計算每類所有樣本到其樣本中心的距離,(,)llljjjd=dux=ux,其中l(wèi)jd表示jc類中第l個樣本lx與中心點ju的距離,在每類中刪除少部份與該類中心點距離大的該類里的樣本;(6)從1~k中遍歷每類所有樣本,對每類通過k均值聚類方法聚成n類(n值大小根據(jù)訓練集本樣數(shù)量及分類效果確定和調(diào)整),即得到每大類的樣本子類,記為{1,2,,n}jjjjc=ccc,即2jc表示第jc大類的第2子類;差優(yōu)設定K的初始值計算K個鄰居確定樣本點類別判斷分類效果最終分類結果修改K值
貴州民族大學2020屆碩士研究生學位論文34圖5.1傳統(tǒng)KNN算法架構圖5.2并行KNN算法架構圖5.1為傳統(tǒng)的KNN算法架構,所有分類過程都在同一臺計算機上的單程序單線程中完成,圖5.2為改進后的并行算法架構,需先準備n臺計算機,把數(shù)據(jù)集樣本平均分成n份,即12,X,nijX=XXXX=ij,并每一臺計算機送一份,每臺計算機同時計算出K個鄰居樣本后把計算結果送回主機,主機將收到的n*K個近鄰選出K個最近鄰,在K個近鄰中判定最多的類別為新數(shù)據(jù)類別。新數(shù)據(jù)全體訓練集合X計算機AK個最近鄰新數(shù)據(jù)K個最近鄰計算機B訓練集X1計算機B1訓練集X2計算機B2計算機Bn訓練集Xn
【參考文獻】:
期刊論文
[1]一種基于特征聚類分析的商品評論系統(tǒng)設計[J]. 尹積棟,劉紅,謝茶花,張慧,曾炎. 信息技術與信息化. 2019(10)
[2]基于非負矩陣分解算法的人臉識別方法[J]. 彭夢冉. 長春工程學院學報(自然科學版). 2019(03)
[3]基于改進K-modes聚類的KNN分類算法[J]. 王志華,劉紹廷,羅齊. 計算機工程與設計. 2019(08)
[4]基于聚類的環(huán)形kNN算法[J]. 匡振曦,武繼剛,李嘉興. 計算機工程與科學. 2019(05)
[5]基于KNN算法的學生貸款風險模型[J]. 范睿智. 電子測試. 2019(Z1)
[6]K近鄰分類指導的區(qū)域迭代圖割算法研究[J]. 管建,王亞娟,王立功. 計算機應用與軟件. 2018(11)
[7]結合文本信息量和聚類的文本裁剪算法[J]. 謝攀,鄧珍榮,朱益立. 計算機工程與設計. 2018(03)
[8]基于模糊C-Means的改進型KNN分類算法[J]. 朱付保,謝利杰,湯萌萌,朱顥東. 華中師范大學學報(自然科學版). 2017(06)
[9]K最近鄰算法理論與應用綜述[J]. 毋雪雁,王水花,張煜東. 計算機工程與應用. 2017(21)
[10]一種基于樣本有效性和KNN分類標記的采樣傳播型摳圖方法[J]. 陳曉,何發(fā)智,章生冬. 計算機輔助設計與圖形學學報. 2016(12)
碩士論文
[1]基于優(yōu)化分割與提取的西夏古籍文字識別研究[D]. 李小璐.寧夏大學 2019
[2]基于K近鄰的分類算法研究[D]. 桑應賓.重慶大學 2009
本文編號:3257276
【文章來源】:貴州民族大學貴州省
【文章頁數(shù)】:53 頁
【學位級別】:碩士
【部分圖文】:
pd距離間關系圖
貴州民族大學2020屆碩士研究生學位論文29續(xù)圖4.2基于K均值聚類的改進KNN算法流程圖(新訓練數(shù)據(jù)分類)2.改進算法原理步驟:(1)收集、準備數(shù)據(jù),提取特征;(2)將數(shù)據(jù)集中大部分數(shù)據(jù)作為訓練數(shù)據(jù)集,并構建訓練樣本集合X,nixXR,其中nR為n維空間,ix為第i個樣本,i=1,2,,N,余下少部分數(shù)據(jù)作為測試樣本,用于驗證訓練好的模型;(3)統(tǒng)計訓練數(shù)據(jù)集中樣本類別c的數(shù)量及每類樣本個數(shù)m,記為12{,,,}kc=ccc,12{,,,}km=mmm,共k類;(4)計算每類樣本中心u,11jmljjluxm==,其中jm為第j類的樣本個數(shù),lx表示屬于ju(即jc)這個類別的樣本點。所有類的中心點記為12{,,,}ku=uuu;(5)遍歷每類里所有樣本,計算每類所有樣本到其樣本中心的距離,(,)llljjjd=dux=ux,其中l(wèi)jd表示jc類中第l個樣本lx與中心點ju的距離,在每類中刪除少部份與該類中心點距離大的該類里的樣本;(6)從1~k中遍歷每類所有樣本,對每類通過k均值聚類方法聚成n類(n值大小根據(jù)訓練集本樣數(shù)量及分類效果確定和調(diào)整),即得到每大類的樣本子類,記為{1,2,,n}jjjjc=ccc,即2jc表示第jc大類的第2子類;差優(yōu)設定K的初始值計算K個鄰居確定樣本點類別判斷分類效果最終分類結果修改K值
貴州民族大學2020屆碩士研究生學位論文34圖5.1傳統(tǒng)KNN算法架構圖5.2并行KNN算法架構圖5.1為傳統(tǒng)的KNN算法架構,所有分類過程都在同一臺計算機上的單程序單線程中完成,圖5.2為改進后的并行算法架構,需先準備n臺計算機,把數(shù)據(jù)集樣本平均分成n份,即12,X,nijX=XXXX=ij,并每一臺計算機送一份,每臺計算機同時計算出K個鄰居樣本后把計算結果送回主機,主機將收到的n*K個近鄰選出K個最近鄰,在K個近鄰中判定最多的類別為新數(shù)據(jù)類別。新數(shù)據(jù)全體訓練集合X計算機AK個最近鄰新數(shù)據(jù)K個最近鄰計算機B訓練集X1計算機B1訓練集X2計算機B2計算機Bn訓練集Xn
【參考文獻】:
期刊論文
[1]一種基于特征聚類分析的商品評論系統(tǒng)設計[J]. 尹積棟,劉紅,謝茶花,張慧,曾炎. 信息技術與信息化. 2019(10)
[2]基于非負矩陣分解算法的人臉識別方法[J]. 彭夢冉. 長春工程學院學報(自然科學版). 2019(03)
[3]基于改進K-modes聚類的KNN分類算法[J]. 王志華,劉紹廷,羅齊. 計算機工程與設計. 2019(08)
[4]基于聚類的環(huán)形kNN算法[J]. 匡振曦,武繼剛,李嘉興. 計算機工程與科學. 2019(05)
[5]基于KNN算法的學生貸款風險模型[J]. 范睿智. 電子測試. 2019(Z1)
[6]K近鄰分類指導的區(qū)域迭代圖割算法研究[J]. 管建,王亞娟,王立功. 計算機應用與軟件. 2018(11)
[7]結合文本信息量和聚類的文本裁剪算法[J]. 謝攀,鄧珍榮,朱益立. 計算機工程與設計. 2018(03)
[8]基于模糊C-Means的改進型KNN分類算法[J]. 朱付保,謝利杰,湯萌萌,朱顥東. 華中師范大學學報(自然科學版). 2017(06)
[9]K最近鄰算法理論與應用綜述[J]. 毋雪雁,王水花,張煜東. 計算機工程與應用. 2017(21)
[10]一種基于樣本有效性和KNN分類標記的采樣傳播型摳圖方法[J]. 陳曉,何發(fā)智,章生冬. 計算機輔助設計與圖形學學報. 2016(12)
碩士論文
[1]基于優(yōu)化分割與提取的西夏古籍文字識別研究[D]. 李小璐.寧夏大學 2019
[2]基于K近鄰的分類算法研究[D]. 桑應賓.重慶大學 2009
本文編號:3257276
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3257276.html
最近更新
教材專著