高維數(shù)據(jù)集降維優(yōu)化研究
發(fā)布時間:2021-06-22 03:12
在日益發(fā)展的網(wǎng)絡(luò)信息化時代,高維數(shù)據(jù)處理已然成為數(shù)據(jù)處理的一個新難點(diǎn)。一方面,高維數(shù)據(jù)易存在冗余信息,導(dǎo)致數(shù)據(jù)分析的開銷增大并影響數(shù)據(jù)分類。另一方面,高維數(shù)據(jù)的處理仍然停留在經(jīng)典方法的使用已經(jīng)難以應(yīng)對當(dāng)前日益復(fù)雜的數(shù)據(jù)集。針對上述難點(diǎn),論文提出一種高準(zhǔn)確率的降維優(yōu)化方法KPCA-LDA-BPNN。論文主要有以下幾個方面的創(chuàng)新之處:1.對基于核函數(shù)的主成分分析KPCA中的核函數(shù)和核參數(shù)的選取進(jìn)行研究,論文用全局最優(yōu)解的粒子群優(yōu)化算法PSO選取核參數(shù)。2.提出特征提取方法KPCA-LDA,首先在KPCA算法中引入信息熵做特征篩選,降低數(shù)據(jù)特征數(shù)量,其次對線性判別分析LDA算法進(jìn)行加權(quán)處理保留數(shù)據(jù)最具辨別力信息,加強(qiáng)數(shù)據(jù)監(jiān)督特性,最后將兩類改進(jìn)的算法相結(jié)合即KPCA-LDA對數(shù)據(jù)進(jìn)行特征提取。3.擇優(yōu)選取分類器,在KPCA-LDA特征提取的基礎(chǔ)上擇優(yōu)選取BP神經(jīng)網(wǎng)絡(luò)BPNN對數(shù)據(jù)進(jìn)行分類識別,最后論文用代表性數(shù)據(jù)集手寫數(shù)字?jǐn)?shù)據(jù)集驗(yàn)證該降維優(yōu)化方法KPCA-LDA-BPNN。論文提出的降維優(yōu)化方法,不僅可以應(yīng)對當(dāng)前日益復(fù)雜的高維數(shù)據(jù)集,而且基本滿足當(dāng)前數(shù)據(jù)處理中數(shù)據(jù)分類高準(zhǔn)確率的應(yīng)用需求。
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
Poly核函數(shù)鳶尾花數(shù)據(jù)集樣本分布
內(nèi)蒙古大學(xué)碩士學(xué)位論文22圖3.2Sigmoid核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.2SigmoidKernelFunctionIrisDatasetSampleDistribution實(shí)驗(yàn)中RBF核函數(shù)中的參數(shù)為σ(σ≠0)。高斯核是徑向基函數(shù)核(RBF)的一個典型代表。高斯核在計(jì)算中涉及到兩個向量的歐式距離計(jì)算,可調(diào)參數(shù)只有一個,它控制著函數(shù)的作用范圍。數(shù)據(jù)集具體分布如圖3.3所示,其中σ分別選取0.1,1,10,50,從圖中可以看出隨著σ值選取的逐漸增大,數(shù)據(jù)則越來越線性不可分。圖3.3RBF核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.3RBFKernelFunctionIrisDatasetSampleDistribution表3.1總結(jié)上述實(shí)驗(yàn)結(jié)果,對三個核函數(shù)進(jìn)行比較。表3.1不同核函數(shù)的比較Table3.1.ComparisonofDifferentKernelFunctions
內(nèi)蒙古大學(xué)碩士學(xué)位論文22圖3.2Sigmoid核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.2SigmoidKernelFunctionIrisDatasetSampleDistribution實(shí)驗(yàn)中RBF核函數(shù)中的參數(shù)為σ(σ≠0)。高斯核是徑向基函數(shù)核(RBF)的一個典型代表。高斯核在計(jì)算中涉及到兩個向量的歐式距離計(jì)算,可調(diào)參數(shù)只有一個,它控制著函數(shù)的作用范圍。數(shù)據(jù)集具體分布如圖3.3所示,其中σ分別選取0.1,1,10,50,從圖中可以看出隨著σ值選取的逐漸增大,數(shù)據(jù)則越來越線性不可分。圖3.3RBF核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.3RBFKernelFunctionIrisDatasetSampleDistribution表3.1總結(jié)上述實(shí)驗(yàn)結(jié)果,對三個核函數(shù)進(jìn)行比較。表3.1不同核函數(shù)的比較Table3.1.ComparisonofDifferentKernelFunctions
【參考文獻(xiàn)】:
期刊論文
[1]基于主題模型和關(guān)聯(lián)規(guī)則的專利文本數(shù)據(jù)挖掘研究[J]. 艾楚涵,姜迪,吳建德. 中北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[2]融合PCA降維的改進(jìn)深度神經(jīng)網(wǎng)絡(luò)工控安全算法[J]. 劉慶華,吳昊天. 計(jì)算機(jī)與數(shù)字工程. 2019(07)
[3]基于詞袋模型的林業(yè)業(yè)務(wù)圖像分類[J]. 張廣群,李英杰,汪杭軍. 浙江農(nóng)林大學(xué)學(xué)報(bào). 2017(05)
[4]自適應(yīng)多核組合相關(guān)向量機(jī)預(yù)測方法及其在機(jī)械設(shè)備剩余壽命預(yù)測中的應(yīng)用[J]. 雷亞國,陳吳,李乃鵬,林京. 機(jī)械工程學(xué)報(bào). 2016(01)
[5]半監(jiān)督邊緣判別嵌入與局部保持的維度約簡[J]. 蘭遠(yuǎn)東,高蕾,曾少寧,曾樹洪. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2014(10)
[6]RBF-SVM的核參數(shù)選擇方法及其在故障診斷中的應(yīng)用[J]. 周紹磊,廖劍,史賢俊. 電子測量與儀器學(xué)報(bào). 2014(03)
[7]均勻分布的四舍五入數(shù)據(jù)對參數(shù)估計(jì)的影響[J]. 唐美燕,謝海斌. 吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(01)
[8]對稱陣稀疏主成分分析及其在充分降維問題中的應(yīng)用[J]. 邵偉,祝麗萍,劉福國,王秋平. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2012(04)
[9]矩陣奇異值分解及其在高維數(shù)據(jù)處理中的應(yīng)用[J]. 尹芳黎,楊雁瑩,王傳棟,王士鵬. 數(shù)學(xué)的實(shí)踐與認(rèn)識. 2011(15)
[10]高維數(shù)據(jù)聚類方法綜述[J]. 賀玲,蔡益朝,楊征. 計(jì)算機(jī)應(yīng)用研究. 2010(01)
博士論文
[1]幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計(jì)分析[D]. 祝麗萍.山東大學(xué) 2012
[2]基于流形學(xué)習(xí)的數(shù)據(jù)降維方法及其在人臉識別中的應(yīng)用[D]. 王建中.東北師范大學(xué) 2010
[3]流形學(xué)習(xí)的理論與方法研究[D]. 王靖.浙江大學(xué) 2006
碩士論文
[1]數(shù)據(jù)挖掘技術(shù)在污水處理系統(tǒng)中的應(yīng)用[D]. 徐迪磊.華中科技大學(xué) 2018
[2]基于高維空間的非線性降維的局部線性嵌入LLE方法[D]. 馬宇.西南交通大學(xué) 2017
[3]微博評論信息的聚類分析[D]. 范佳健.安徽大學(xué) 2017
[4]基于數(shù)據(jù)降維的機(jī)器學(xué)習(xí)分類應(yīng)用研究[D]. 胡天宇.吉林大學(xué) 2017
[5]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[6]基于KPCA的生態(tài)效率評價與預(yù)測模型研究[D]. 王紅蓮.華北理工大學(xué) 2017
[7]白酒識別電子鼻系統(tǒng)特征降維與分類器設(shè)計(jì)[D]. 賈雪梅.天津大學(xué) 2017
[8]基于RVM的混合氣體識別與濃度檢測算法研究[D]. 張銘.哈爾濱工業(yè)大學(xué) 2016
[9]基于時頻分析的特征提取與模式分類方法研究[D]. 趙衛(wèi)峰.重慶大學(xué) 2016
[10]分布式數(shù)據(jù)流聚類算法研究[D]. 何穎.北京交通大學(xué) 2015
本文編號:3241995
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
Poly核函數(shù)鳶尾花數(shù)據(jù)集樣本分布
內(nèi)蒙古大學(xué)碩士學(xué)位論文22圖3.2Sigmoid核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.2SigmoidKernelFunctionIrisDatasetSampleDistribution實(shí)驗(yàn)中RBF核函數(shù)中的參數(shù)為σ(σ≠0)。高斯核是徑向基函數(shù)核(RBF)的一個典型代表。高斯核在計(jì)算中涉及到兩個向量的歐式距離計(jì)算,可調(diào)參數(shù)只有一個,它控制著函數(shù)的作用范圍。數(shù)據(jù)集具體分布如圖3.3所示,其中σ分別選取0.1,1,10,50,從圖中可以看出隨著σ值選取的逐漸增大,數(shù)據(jù)則越來越線性不可分。圖3.3RBF核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.3RBFKernelFunctionIrisDatasetSampleDistribution表3.1總結(jié)上述實(shí)驗(yàn)結(jié)果,對三個核函數(shù)進(jìn)行比較。表3.1不同核函數(shù)的比較Table3.1.ComparisonofDifferentKernelFunctions
內(nèi)蒙古大學(xué)碩士學(xué)位論文22圖3.2Sigmoid核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.2SigmoidKernelFunctionIrisDatasetSampleDistribution實(shí)驗(yàn)中RBF核函數(shù)中的參數(shù)為σ(σ≠0)。高斯核是徑向基函數(shù)核(RBF)的一個典型代表。高斯核在計(jì)算中涉及到兩個向量的歐式距離計(jì)算,可調(diào)參數(shù)只有一個,它控制著函數(shù)的作用范圍。數(shù)據(jù)集具體分布如圖3.3所示,其中σ分別選取0.1,1,10,50,從圖中可以看出隨著σ值選取的逐漸增大,數(shù)據(jù)則越來越線性不可分。圖3.3RBF核函數(shù)鳶尾花數(shù)據(jù)集樣本分布Figure3.3RBFKernelFunctionIrisDatasetSampleDistribution表3.1總結(jié)上述實(shí)驗(yàn)結(jié)果,對三個核函數(shù)進(jìn)行比較。表3.1不同核函數(shù)的比較Table3.1.ComparisonofDifferentKernelFunctions
【參考文獻(xiàn)】:
期刊論文
[1]基于主題模型和關(guān)聯(lián)規(guī)則的專利文本數(shù)據(jù)挖掘研究[J]. 艾楚涵,姜迪,吳建德. 中北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[2]融合PCA降維的改進(jìn)深度神經(jīng)網(wǎng)絡(luò)工控安全算法[J]. 劉慶華,吳昊天. 計(jì)算機(jī)與數(shù)字工程. 2019(07)
[3]基于詞袋模型的林業(yè)業(yè)務(wù)圖像分類[J]. 張廣群,李英杰,汪杭軍. 浙江農(nóng)林大學(xué)學(xué)報(bào). 2017(05)
[4]自適應(yīng)多核組合相關(guān)向量機(jī)預(yù)測方法及其在機(jī)械設(shè)備剩余壽命預(yù)測中的應(yīng)用[J]. 雷亞國,陳吳,李乃鵬,林京. 機(jī)械工程學(xué)報(bào). 2016(01)
[5]半監(jiān)督邊緣判別嵌入與局部保持的維度約簡[J]. 蘭遠(yuǎn)東,高蕾,曾少寧,曾樹洪. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2014(10)
[6]RBF-SVM的核參數(shù)選擇方法及其在故障診斷中的應(yīng)用[J]. 周紹磊,廖劍,史賢俊. 電子測量與儀器學(xué)報(bào). 2014(03)
[7]均勻分布的四舍五入數(shù)據(jù)對參數(shù)估計(jì)的影響[J]. 唐美燕,謝海斌. 吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(01)
[8]對稱陣稀疏主成分分析及其在充分降維問題中的應(yīng)用[J]. 邵偉,祝麗萍,劉福國,王秋平. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2012(04)
[9]矩陣奇異值分解及其在高維數(shù)據(jù)處理中的應(yīng)用[J]. 尹芳黎,楊雁瑩,王傳棟,王士鵬. 數(shù)學(xué)的實(shí)踐與認(rèn)識. 2011(15)
[10]高維數(shù)據(jù)聚類方法綜述[J]. 賀玲,蔡益朝,楊征. 計(jì)算機(jī)應(yīng)用研究. 2010(01)
博士論文
[1]幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計(jì)分析[D]. 祝麗萍.山東大學(xué) 2012
[2]基于流形學(xué)習(xí)的數(shù)據(jù)降維方法及其在人臉識別中的應(yīng)用[D]. 王建中.東北師范大學(xué) 2010
[3]流形學(xué)習(xí)的理論與方法研究[D]. 王靖.浙江大學(xué) 2006
碩士論文
[1]數(shù)據(jù)挖掘技術(shù)在污水處理系統(tǒng)中的應(yīng)用[D]. 徐迪磊.華中科技大學(xué) 2018
[2]基于高維空間的非線性降維的局部線性嵌入LLE方法[D]. 馬宇.西南交通大學(xué) 2017
[3]微博評論信息的聚類分析[D]. 范佳健.安徽大學(xué) 2017
[4]基于數(shù)據(jù)降維的機(jī)器學(xué)習(xí)分類應(yīng)用研究[D]. 胡天宇.吉林大學(xué) 2017
[5]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[6]基于KPCA的生態(tài)效率評價與預(yù)測模型研究[D]. 王紅蓮.華北理工大學(xué) 2017
[7]白酒識別電子鼻系統(tǒng)特征降維與分類器設(shè)計(jì)[D]. 賈雪梅.天津大學(xué) 2017
[8]基于RVM的混合氣體識別與濃度檢測算法研究[D]. 張銘.哈爾濱工業(yè)大學(xué) 2016
[9]基于時頻分析的特征提取與模式分類方法研究[D]. 趙衛(wèi)峰.重慶大學(xué) 2016
[10]分布式數(shù)據(jù)流聚類算法研究[D]. 何穎.北京交通大學(xué) 2015
本文編號:3241995
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3241995.html
最近更新
教材專著