雙指標(biāo)重要性優(yōu)先法在分類問題中的應(yīng)用
[Abstract]:The purpose of this paper is to select variables and predict classes for Leukemia 72 of micromatrix data. For the first time, the idea of priority reduction of the importance of sum and two indexes is applied to variable selection of classified data. In this paper, the hypothesis test method is used to verify that the original hypothesis proposed in Robert Tibshirani [15] is unreasonable, and a new statistic (94) 6 is proposed to correct these irrationality. Combined with the statistical significance of the statistic and the Sure Independent Screening () thought, a new variable selection model is proposed for different data types and different sample sizes. Therefore, the importance priority idea is added to the previous model to create a two-index importance priority dimensionality reduction method (). Then, support vector machine (1), naive Bayesian method () and nearest neighbor method () are selected as the classifiers of the data after variable selection, and the best classification model is found by using the error rate index. Finally, the above models are applied to the simulation data and the actual data respectively. The feasibility and stability of the proposed model are proved by comparing the classification effect of the method with the selection of rank sum test variables and the fast screening variable method.
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:O212
【相似文獻】
相關(guān)期刊論文 前10條
1 白雪梅,趙松山;由指標(biāo)重要性確定權(quán)重的方法探討[J];江蘇統(tǒng)計;1998年03期
2 秦肖;王秀麗;;銷售人員勝任素質(zhì)指標(biāo)重要性的測評[J];統(tǒng)計與咨詢;2007年02期
3 戴伯新;;回歸變量選擇中的數(shù)據(jù)診斷[J];應(yīng)用概率統(tǒng)計;1992年04期
4 楊麗霞;魏立力;;基于粗糙集方法的有序尺度變量選擇[J];寧夏大學(xué)學(xué)報(自然科學(xué)版);2009年02期
5 趙宇;黃思明;;帶有變量選擇過程的分類模型誤差分析[J];數(shù)學(xué)的實踐與認(rèn)識;2010年17期
6 樊亞莉;徐群芳;;穩(wěn)健的變量選擇方法及其應(yīng)用[J];上海理工大學(xué)學(xué)報;2013年03期
7 陶靖軒;多元分析中的變量選擇問題研究[J];中國計量學(xué)院學(xué)報;2001年01期
8 李樹軍,紀(jì)宏金;對應(yīng)聚類分析與變量選擇[J];地球物理學(xué)進展;2005年03期
9 陳黎明;趙永紅;;轉(zhuǎn)換函數(shù)未知時轉(zhuǎn)換模型的變量選擇[J];四川大學(xué)學(xué)報(自然科學(xué)版);2011年05期
10 劉民千,張潤楚;超飽和設(shè)計的變量選擇[J];南開大學(xué)學(xué)報(自然科學(xué)版);2000年03期
相關(guān)會議論文 前4條
1 張俊華;方偉武;;調(diào)查表分析中變量選擇的一些方法(英文)[A];中國運籌學(xué)會第六屆學(xué)術(shù)交流會論文集(下卷)[C];2000年
2 李洪東;梁逸曾;;高維數(shù)據(jù)變量選擇新方法研究[A];中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C];2010年
3 李慷;席裕庚;;復(fù)雜過程系統(tǒng)中操作變量選擇與定位的方法研究[A];1993年控制理論及其應(yīng)用年會論文集[C];1993年
4 云永歡;王為婷;梁逸曾;;迭代的保留有信息變量來篩選最佳變量子集的一種多元校正變量選擇方法[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年
相關(guān)博士學(xué)位論文 前10條
1 呂晶;幾類半?yún)?shù)回歸模型的穩(wěn)健估計與變量選擇[D];重慶大學(xué);2015年
2 王康寧;幾類高維復(fù)雜數(shù)據(jù)半?yún)?shù)模型的結(jié)構(gòu)識別、變量選擇及穩(wěn)健估計[D];山東大學(xué);2016年
3 李子林;高維基因數(shù)據(jù)中的統(tǒng)計方法[D];清華大學(xué);2016年
4 王大榮;分散度量模型中的變量選擇[D];北京工業(yè)大學(xué);2009年
5 王明秋;高維數(shù)據(jù)下若干回歸模型的變量選擇問題研究[D];大連理工大學(xué);2012年
6 劉吉彩;生存數(shù)據(jù)統(tǒng)計模型的變量選擇方法[D];華東師范大學(xué);2014年
7 樊亞莉;穩(wěn)健變量選擇方法的若干問題研究[D];復(fù)旦大學(xué);2013年
8 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學(xué);2008年
9 董瑩;高維共線性統(tǒng)計模型的參數(shù)估計與變量選擇[D];大連理工大學(xué);2014年
10 葉飛;相對誤差準(zhǔn)則下的估計理論和變量選擇方法的研究[D];清華大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 戚敏敏;雙指標(biāo)重要性優(yōu)先法在分類問題中的應(yīng)用[D];蘭州大學(xué);2017年
2 趙冬琦;基于變量選擇的股指期貨對股票市場影響的實證研究[D];蘭州大學(xué);2015年
3 程勇;多水平模型的變量選擇在農(nóng)戶人均收入數(shù)據(jù)中的應(yīng)用[D];云南財經(jīng)大學(xué);2015年
4 鄧秋玲;SCAD和ADS方法在比例風(fēng)險模型中的應(yīng)用[D];廣西大學(xué);2015年
5 韋新星;幾種變量選擇方法在Cox模型中的應(yīng)用[D];廣西大學(xué);2015年
6 王唯;部分線性模型的變量選擇問題研究[D];湘潭大學(xué);2015年
7 潘玉婷;含多元非線性結(jié)構(gòu)的高維Logistic模型的同時變量選擇及半?yún)?shù)估計[D];中國科學(xué)技術(shù)大學(xué);2016年
8 劉丹;Cox模型及變系數(shù)Cox模型中的變量選擇問題研究[D];暨南大學(xué);2016年
9 羅昊;基于自適應(yīng)LASSO變量選擇的Logistic信用評分模型研究[D];東南大學(xué);2016年
10 王雙寶;基于變量選擇偏差的變量選擇過程[D];電子科技大學(xué);2016年
,本文編號:2372184
本文鏈接:http://sikaile.net/kejilunwen/yysx/2372184.html