天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

基于SIR的數(shù)據(jù)降維算法研究及其應(yīng)用

發(fā)布時間:2022-02-09 01:26
  隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,很多領(lǐng)域都產(chǎn)生了大量的高維數(shù)據(jù),如何刻畫高維數(shù)據(jù)的內(nèi)在結(jié)構(gòu)并從中提取出對自己有用的信息顯得非常重要。充分降維方法正是解決這一問題的有效手段之一,目前評價充分降維方法的好壞(降維效果)通常是用平方多重相關(guān)系數(shù)的大小來表示的。針對充分降維,本文主要以應(yīng)用為主,對三種不同類型數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集提出了改進的降維方法,主要工作如下。一,以含有離群點的數(shù)據(jù)集為研究對象,本文將K-medoids聚類算法與切片逆回歸方法相結(jié)合,提出了K-medoids逆回歸算法。通過對由線性模型和非線性模型產(chǎn)生出的模擬數(shù)據(jù)所進行的仿真實驗發(fā)現(xiàn),該算法相比于切片逆回歸、切片平均方差估計和海森主方向等傳統(tǒng)的充分降維方法不僅有較高的降維正確率,而且有很好的降維效果。本文將上述方法應(yīng)用于實際數(shù)據(jù),數(shù)據(jù)分析進一步說明了新方法的有效性。二,以響應(yīng)變量為二分變量的數(shù)據(jù)集為研究對象,以切片逆回歸為代表的傳統(tǒng)充分降維方法大多不可用。本文對切片逆回歸、切片平均方差估計和海森主方向三種方法進行了研究,給出了三種方法的核矩陣的具體形式和其相對應(yīng)的檢驗方法。通過研究發(fā)現(xiàn),改進的方法可應(yīng)用于響應(yīng)變量為二分變量的數(shù)據(jù)集,并... 

【文章來源】:南京郵電大學(xué)江蘇省

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于SIR的數(shù)據(jù)降維算法研究及其應(yīng)用


模型3.2的數(shù)據(jù)分布情況

數(shù)據(jù)分布,數(shù)據(jù)分布,模型,降維


圖 3.2 模型 3.3 的數(shù)據(jù)分布情況圖 3.2 截取的是樣本量為 n 200時的一個數(shù)據(jù)分布情況,可以清楚地看到該模型在二維和三維空間內(nèi)沒有顯著的線性關(guān)系,并且可以看到其中是含有很多離群點的。接下來使用 SIR、SAVE、PHD 和 K -medoids IR 對其進行降維分析。表 3.3 描述了在不同樣本數(shù) 和不同切片數(shù) 下 SIR、SAVE、PHD 和 IR四種降維算法在重復(fù)試驗 100 次時的降維正確率。通過上表可以發(fā)現(xiàn),對于非線性模型,SIR 方法的降維正確率很低,說明該方法對非線性模型的降維效果不好。對于 SAVE 方法,離群點對它的影響最大,其每次的降維正確率都不確定,時高時低。對于 PHD 方法,可以看出隨著樣本量的增多,其降維正確率有顯著的提升。而改進的 IR方法仍保持較高的正確率。表 3.3 非線性模型 3.3 下四種算法的降維正確率Method HN100 200 400SIR10 0.07 0.25 0.4415 0.06 0.18 0.37

數(shù)據(jù)分布,數(shù)據(jù)分布,降維,情況


圖 3.4 BHP 的數(shù)據(jù)分布情況表 3.5 和表 3.6 描述了當(dāng)聚類數(shù)或切片數(shù)為 15 時,SIR、SAVE、PHD 和 K -medoidIR 四種方法對波士頓房價數(shù)據(jù)集的降維結(jié)果及降維效果。取顯著性水平為 0.05,從卡方檢驗結(jié)果可以看出,當(dāng)原假設(shè)為 d 0 vs. d 1時,前三種方法的P值=0.00<0.05,拒絕原假設(shè),所以繼續(xù)向下檢驗。對于 SIR 方法一直檢驗到 d 6 vs. d 7時,其P值=0.328>0.05 ,接受原假設(shè),所以認(rèn)為最終將 13 維模型降維到 6 維,并且2R=0.990說明降維效果很好。對于 SAVE 方法其檢驗不通過,降維失敗。對于 PHD 方法,其降維到 11 維,其降維結(jié)果也不理想。而對于本章提出的方法,其最終降到 3 維,與最開始數(shù)據(jù)集的預(yù)測維數(shù)一樣,而且2R =0.8793可以看出降維效果是比較好的。表 3.5 切片數(shù)為 15 時的降維結(jié)果0 1H vs.HP_values P_valuesSIR SAVE PHD K -medoids d 0 vs. d 10.00e+00 0.00e+00 0.00e+00 d 12 vs. d 110.00e+00d 1v s. d 20.00e+00 0.00e+00 0.00e+00 d 11v s. d 107.75e-153d 2 vs. d 30.00e+00 0.00e+00 0.00e+00 d 10 vs. d 98.94e-95

【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)降維方法分析與研究[J]. 吳曉婷,閆德勤.  計算機應(yīng)用研究. 2009(08)
[2]分段逆回歸與神經(jīng)網(wǎng)絡(luò)組合建模方法[J]. 黃薇,王惠文,張志慧.  系統(tǒng)工程. 2004(04)
[3]SIR方法在小型二次電池市場分析上的應(yīng)用[J]. 周文琴,馮鳴鳴,王惠文.  數(shù)理統(tǒng)計與管理. 2001(06)
[4]虛擬變量在線性回歸模型中的應(yīng)用[J]. 章曉英.  重慶工業(yè)管理學(xué)院學(xué)報. 1998(02)

博士論文
[1]充分降維理論和方法的拓展研究[D]. 於州.華東師范大學(xué) 2010

碩士論文
[1]SIR降維方法與半?yún)?shù)可加回歸的應(yīng)用研究[D]. 李巖巖.重慶工商大學(xué) 2016
[2]Isomap與LLE在降維方面的優(yōu)劣分析[D]. 何博睿.首都經(jīng)濟貿(mào)易大學(xué) 2016
[3]充分降維理論中PHD方法的局部影響分析[D]. 王智慧.云南財經(jīng)大學(xué) 2015
[4]聚類分析中K-均值與K-中心點算法的研究[D]. 吳文亮.華南理工大學(xué) 2011



本文編號:3616123

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3616123.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶be77f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com