基于旋轉(zhuǎn)森林的基因數(shù)據(jù)分類算法研究
本文關(guān)鍵詞:基于旋轉(zhuǎn)森林的基因數(shù)據(jù)分類算法研究
更多相關(guān)文章: 基因表達(dá)數(shù)據(jù) 決策樹 旋轉(zhuǎn)森林 核主成分分析 代價敏感
【摘要】:利用基因表達(dá)數(shù)據(jù)分類對癌癥等惡性疾病進(jìn)行識別,是數(shù)據(jù)挖掘技術(shù)在生物醫(yī)學(xué)領(lǐng)域內(nèi)的一個典型應(yīng)用。決策樹算法作為一種基礎(chǔ)的機器學(xué)習(xí)算法,由于存在著理解性強,算法結(jié)構(gòu)簡單等優(yōu)點被廣泛運用,因此也產(chǎn)生了許多變體和集成方法。由于旋轉(zhuǎn)森林算法在精度和集成度方面的優(yōu)勢而在近些年引起了研究者的關(guān)注。然而由于基因表達(dá)數(shù)據(jù)存在非線性和不平衡的特點,使得旋轉(zhuǎn)森林算法的性能還需要進(jìn)一步提高。當(dāng)考慮到所有的樣本存在不一樣的分類代價時,除了追求分類精度外,對代價因素的處理也是一個必須面臨的問題。針對以上問題,本文結(jié)合基因表達(dá)數(shù)據(jù)的特點,進(jìn)行了以下方面的研究:(1)提出了一種基于核主成分分析的旋轉(zhuǎn)森林算法(KPCA-Ro F)。利用核主成分分析實現(xiàn)數(shù)據(jù)從樣本空間到特征空間的非線性變換以及數(shù)據(jù)的差異性變換。借鑒支持向量機的思想和旋轉(zhuǎn)森林的集成方法,實現(xiàn)了基于核函數(shù)的旋轉(zhuǎn)森林算法。選擇高斯徑向基核函數(shù)為映射函數(shù),并且對其中的參數(shù)進(jìn)行了分析和選擇。實驗證明基于核主成分分析的旋轉(zhuǎn)森林在算法精度方面優(yōu)于原始的算法,并且在較小的集成度時就可以達(dá)到良好的效果。(2)結(jié)合幾種常用的代價因素類型,提出了嵌入代價敏感因素的旋轉(zhuǎn)森林學(xué)習(xí)算法(CS-Ro F)。首先,通過改變EG2代價敏感決策樹屬性分裂的度量方法,嵌入誤分類代價和測試代價;其次,在C4.5_cs代價敏感決策樹的基礎(chǔ)上嵌入拒識代價,形成了同時具有誤分類代價和拒識代價的旋轉(zhuǎn)森林算法。實驗結(jié)論表明,代價敏感學(xué)習(xí)方法是解決數(shù)據(jù)不平衡性的良好途徑;同時嵌入代價敏感因素可以降低平均分類代價并且保證了精度。
【學(xué)位授予單位】:中國計量大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:Q811.4;TP311.13;TP18
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭靜靜;王延光;杜磊;印興耀;張廣智;;基于概率核主成分分析的屬性優(yōu)化方法及其應(yīng)用[J];石油地球物理勘探;2014年03期
2 李磊;金菊良;梁忠民;;核主成分分析的參數(shù)優(yōu)化及其在水資源可持續(xù)利用綜合評價中的應(yīng)用[J];水利水電科技進(jìn)展;2009年04期
3 陳高波;楊小紅;;基于核主成分分析的大學(xué)生綜合素質(zhì)測評[J];科技信息;2010年07期
4 朱惠倩;;基于KPCA的中部六市綜合經(jīng)濟實力評價[J];科技廣場;2006年10期
5 陳斌;陸從德;劉光鼎;;基于核主成分分析的時間域航空電磁去噪方法[J];地球物理學(xué)報;2014年01期
6 李明月;任九泉;;基于核主成分分析和加權(quán)聚類分析的綜合評價方法[J];統(tǒng)計與決策;2010年16期
7 陳永良;林楠;李學(xué)斌;;求解大樣本核主成分分析模型的Lanczos算法[J];吉林大學(xué)學(xué)報(地球科學(xué)版);2010年01期
8 梁勝杰;張志華;崔立林;;主成分分析法與核主成分分析法在機械噪聲數(shù)據(jù)降維中的應(yīng)用比較[J];中國機械工程;2011年01期
9 萬星火;鄭俊玲;金永超;;基于KPCA的高校學(xué)業(yè)預(yù)警模型及其應(yīng)用[J];數(shù)學(xué)理論與應(yīng)用;2013年04期
10 彭令;牛瑞卿;趙艷南;鄧清祿;;基于核主成分分析和粒子群優(yōu)化支持向量機的滑坡位移預(yù)測[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2013年02期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
2 薛永剛;朱靖波;魏剛;;基于核主成分分析的文本分類[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 徐揚;陳實;田玉敏;;基于核主成分分析的步態(tài)識別[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 楊勝凱;基于核主成分分析的特征變換研究[D];浙江大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 徐東曙;蛋白質(zhì)亞細(xì)胞定位中的非線性核熵成分分析和核主成分分析方法對比研究[D];云南大學(xué);2016年
2 常燕芝;基于概率核學(xué)習(xí)方法的短期風(fēng)電功率預(yù)測[D];蘭州交通大學(xué);2016年
3 劉亞卿;基于旋轉(zhuǎn)森林的基因數(shù)據(jù)分類算法研究[D];中國計量大學(xué);2016年
4 馬文青;一種加權(quán)核主成分分析及其相關(guān)參數(shù)的選取[D];大連海事大學(xué);2009年
5 劉素京;基于核主成分分析和支持向量機的飛機艙音信號的識別[D];南京航空航天大學(xué);2009年
6 賈亞瓊;基于核主成分分析的圖像降噪方法研究[D];華南理工大學(xué);2010年
7 萬康康;基于核主成分分析的原像問題研究[D];南京理工大學(xué);2014年
8 孫宗寶;基于軟間隔支持向量機和核主成分分析的入侵檢測研究[D];哈爾濱理工大學(xué);2007年
9 王輝;基于核主成分分析特征提取及支持向量機的人臉識別應(yīng)用研究[D];合肥工業(yè)大學(xué);2006年
10 沈徐輝;基于核主成分與支持向量機的體內(nèi)藥物代謝預(yù)測[D];浙江大學(xué);2011年
,本文編號:1166419
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1166419.html