雙指標(biāo)重要性優(yōu)先法在分類問題中的應(yīng)用

發(fā)布時間：2018-12-11 07:59

【摘要】：本文的目的是對微矩陣數(shù)據(jù)Leukemia 72進行變量選擇和類預(yù)測,首次將和雙指標(biāo)重要性優(yōu)先降維的思想應(yīng)用到分類數(shù)據(jù)的變量選擇中來.文章首先采用假設(shè)檢驗的方法,驗證了Robert Tibshirani文獻[15]中提出的原假設(shè)是不合理的,并針對這些不合理之處進行修改提出了新的統(tǒng)計量(94)6),進而結(jié)合該統(tǒng)計量的統(tǒng)計意義和Sure Independent Screening()思想,針對不同的數(shù)據(jù)類型,不同的樣本量提出了新的變量選擇模型、、,由于思想忽略了變量間的相關(guān)性這一缺點,所以又進一步在之前提出的模型基礎(chǔ)上加入重要性優(yōu)先思想創(chuàng)造了雙指標(biāo)重要性優(yōu)先降維方法().然后,選擇支撐向量機((1),樸素貝葉斯法()和最近鄰法()作為變量選擇后的數(shù)據(jù)的分類器,利用錯分率指標(biāo)找到最佳的分類模型.最后,將上述模型分別應(yīng)用到模擬數(shù)據(jù)和實際數(shù)據(jù)中,通過與秩和檢驗變量選擇,快速篩選變量法的分類效果進行比較,證明了我們提出的模型的可行性與穩(wěn)定性.
[Abstract]:The purpose of this paper is to select variables and predict classes for Leukemia 72 of micromatrix data. For the first time, the idea of priority reduction of the importance of sum and two indexes is applied to variable selection of classified data. In this paper, the hypothesis test method is used to verify that the original hypothesis proposed in Robert Tibshirani [15] is unreasonable, and a new statistic (94) 6 is proposed to correct these irrationality. Combined with the statistical significance of the statistic and the Sure Independent Screening () thought, a new variable selection model is proposed for different data types and different sample sizes. Therefore, the importance priority idea is added to the previous model to create a two-index importance priority dimensionality reduction method (). Then, support vector machine (1), naive Bayesian method () and nearest neighbor method () are selected as the classifiers of the data after variable selection, and the best classification model is found by using the error rate index. Finally, the above models are applied to the simulation data and the actual data respectively. The feasibility and stability of the proposed model are proved by comparing the classification effect of the method with the selection of rank sum test variables and the fast screening variable method.
【學(xué)位授予單位】：蘭州大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2017
【分類號】：O212

【相似文獻】

相關(guān)期刊論文前10條

1 白雪梅,趙松山;由指標(biāo)重要性確定權(quán)重的方法探討[J];江蘇統(tǒng)計;1998年03期

2 秦肖;王秀麗;;銷售人員勝任素質(zhì)指標(biāo)重要性的測評[J];統(tǒng)計與咨詢;2007年02期

3 戴伯新;;回歸變量選擇中的數(shù)據(jù)診斷[J];應(yīng)用概率統(tǒng)計;1992年04期

4 楊麗霞;魏立力;;基于粗糙集方法的有序尺度變量選擇[J];寧夏大學(xué)學(xué)報(自然科學(xué)版);2009年02期

5 趙宇;黃思明;;帶有變量選擇過程的分類模型誤差分析[J];數(shù)學(xué)的實踐與認(rèn)識;2010年17期

6 樊亞莉;徐群芳;;穩(wěn)健的變量選擇方法及其應(yīng)用[J];上海理工大學(xué)學(xué)報;2013年03期

7 陶靖軒;多元分析中的變量選擇問題研究[J];中國計量學(xué)院學(xué)報;2001年01期

8 李樹軍,紀(jì)宏金;對應(yīng)聚類分析與變量選擇[J];地球物理學(xué)進展;2005年03期

9 陳黎明;趙永紅;;轉(zhuǎn)換函數(shù)未知時轉(zhuǎn)換模型的變量選擇[J];四川大學(xué)學(xué)報(自然科學(xué)版);2011年05期

10 劉民千,張潤楚;超飽和設(shè)計的變量選擇[J];南開大學(xué)學(xué)報(自然科學(xué)版);2000年03期

相關(guān)會議論文前4條

1 張俊華;方偉武;;調(diào)查表分析中變量選擇的一些方法(英文)[A];中國運籌學(xué)會第六屆學(xué)術(shù)交流會論文集（下卷）[C];2000年

2 李洪東;梁逸曾;;高維數(shù)據(jù)變量選擇新方法研究[A];中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C];2010年

3 李慷;席裕庚;;復(fù)雜過程系統(tǒng)中操作變量選擇與定位的方法研究[A];1993年控制理論及其應(yīng)用年會論文集[C];1993年

4 云永歡;王為婷;梁逸曾;;迭代的保留有信息變量來篩選最佳變量子集的一種多元校正變量選擇方法[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會：化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年

相關(guān)博士學(xué)位論文前10條

1 呂晶;幾類半?yún)?shù)回歸模型的穩(wěn)健估計與變量選擇[D];重慶大學(xué);2015年

2 王康寧;幾類高維復(fù)雜數(shù)據(jù)半?yún)?shù)模型的結(jié)構(gòu)識別、變量選擇及穩(wěn)健估計[D];山東大學(xué);2016年

3 李子林;高維基因數(shù)據(jù)中的統(tǒng)計方法[D];清華大學(xué);2016年

4 王大榮;分散度量模型中的變量選擇[D];北京工業(yè)大學(xué);2009年

5 王明秋;高維數(shù)據(jù)下若干回歸模型的變量選擇問題研究[D];大連理工大學(xué);2012年

6 劉吉彩;生存數(shù)據(jù)統(tǒng)計模型的變量選擇方法[D];華東師范大學(xué);2014年

7 樊亞莉;穩(wěn)健變量選擇方法的若干問題研究[D];復(fù)旦大學(xué);2013年

8 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學(xué);2008年

9 董瑩;高維共線性統(tǒng)計模型的參數(shù)估計與變量選擇[D];大連理工大學(xué);2014年

10 葉飛;相對誤差準(zhǔn)則下的估計理論和變量選擇方法的研究[D];清華大學(xué);2013年

相關(guān)碩士學(xué)位論文前10條

1 戚敏敏;雙指標(biāo)重要性優(yōu)先法在分類問題中的應(yīng)用[D];蘭州大學(xué);2017年

2 趙冬琦;基于變量選擇的股指期貨對股票市場影響的實證研究[D];蘭州大學(xué);2015年

3 程勇;多水平模型的變量選擇在農(nóng)戶人均收入數(shù)據(jù)中的應(yīng)用[D];云南財經(jīng)大學(xué);2015年

4 鄧秋玲;SCAD和ADS方法在比例風(fēng)險模型中的應(yīng)用[D];廣西大學(xué);2015年

5 韋新星;幾種變量選擇方法在Cox模型中的應(yīng)用[D];廣西大學(xué);2015年

6 王唯;部分線性模型的變量選擇問題研究[D];湘潭大學(xué);2015年

7 潘玉婷;含多元非線性結(jié)構(gòu)的高維Logistic模型的同時變量選擇及半?yún)?shù)估計[D];中國科學(xué)技術(shù)大學(xué);2016年

8 劉丹;Cox模型及變系數(shù)Cox模型中的變量選擇問題研究[D];暨南大學(xué);2016年

9 羅昊;基于自適應(yīng)LASSO變量選擇的Logistic信用評分模型研究[D];東南大學(xué);2016年

10 王雙寶;基于變量選擇偏差的變量選擇過程[D];電子科技大學(xué);2016年

，

本文編號：2372184

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/yysx/2372184.html

上一篇：Euler商中的p次方冪
下一篇：基于局部聯(lián)合矩陣轉(zhuǎn)移的PageRank圖個性化分析

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

雙指標(biāo)重要性優(yōu)先法在分類問題中的應(yīng)用