基于R的分類器模型在多藥耐藥性逆轉(zhuǎn)研究中的應(yīng)用
發(fā)布時(shí)間:2021-06-14 10:34
本文主要基于數(shù)據(jù)挖掘中的決策樹(shù)及支持向量機(jī)建立單分類器、組合分類器、隨機(jī)組合分類器和支持向量分類機(jī)模型,對(duì)白血病細(xì)胞的多藥耐藥性數(shù)據(jù)進(jìn)行分類,判斷白血病細(xì)胞其多藥耐藥性是否得到逆轉(zhuǎn).研究主要內(nèi)容包括.數(shù)據(jù)的降維處理.建立多種分類器模型、優(yōu)化模型參數(shù),降低模型預(yù)測(cè)誤差,對(duì)比各模型預(yù)測(cè)精度,選取最優(yōu)模型.本文先針對(duì)白血病細(xì)胞的多藥耐藥性在逆轉(zhuǎn)劑的作用下的細(xì)胞特征數(shù)據(jù)進(jìn)行預(yù)處理,然后在處理后的數(shù)據(jù)集上應(yīng)用和比較決策樹(shù)、支持向量機(jī)、隨機(jī)森林模型等多種分類算法.數(shù)據(jù)預(yù)處理中,使用去除取值接近于常數(shù)的變量、去除高相關(guān)性的自變量、剔除異常值、數(shù)據(jù)標(biāo)準(zhǔn)化處理等方式降低數(shù)據(jù)維度以優(yōu)化樣本集.在預(yù)處理后的數(shù)據(jù)集上建立單棵決策樹(shù)模型,比較C4.5、C5.0、CART、Rpart決策樹(shù)模型預(yù)測(cè)精度,并可視化操作;建立組合分類器模型,使用Bagging、adaboost算法構(gòu)建模型,比較構(gòu)建模型的效率及預(yù)測(cè)精度,使用加權(quán)投票的方式來(lái)探究預(yù)測(cè)結(jié)果;建立隨機(jī)組合分類器,使用隨機(jī)森林分類算法,通過(guò)隨機(jī)選取測(cè)試樣本集及單棵決策樹(shù),對(duì)測(cè)試樣本集進(jìn)行預(yù)測(cè);建立支持向量分類機(jī)模型,尋找一個(gè)超平面來(lái)對(duì)樣本集進(jìn)行分割,尋找到一個(gè)...
【文章來(lái)源】:云南師范大學(xué)云南省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
論文結(jié)構(gòu)框架
第 2 章 多藥耐藥性數(shù)據(jù)及預(yù)處理定是異常值.采用蓋帽法處理這些異常值,其原理是替換數(shù)據(jù)框里 99%以上和 1%以下,將 99%以上的點(diǎn)值變更為 99%的點(diǎn)值;小于 1%的點(diǎn)值變更為 1%的點(diǎn)值圖 2.1、2.2 給出了前四個(gè)自變量采用蓋帽法處理前后的箱線圖.
將 99%以上的點(diǎn)值變更為 99%的點(diǎn)值;小于 1%的點(diǎn)值變更為 1%的點(diǎn)值圖 2.1、2.2 給出了前四個(gè)自變量采用蓋帽法處理前后的箱線圖.圖 2.1 前四個(gè)自變量箱線圖
【參考文獻(xiàn)】:
期刊論文
[1]芍藥苷對(duì)慢性髓系白血病耐阿霉素細(xì)胞株K562/ADR多藥耐藥性的逆轉(zhuǎn)作用及機(jī)制[J]. 朱聰,賈秀紅,劉迎雪. 山東醫(yī)藥. 2018(47)
[2]基于R語(yǔ)言rpart包與party包的分類樹(shù)建模研究[J]. 徐萬(wàn)佶,曾慶. 科技資訊. 2018(11)
[3]基于邊際的組合分類器選擇算法[J]. 魏濤,郭華平,季新生. 信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2017(03)
[4]基于依賴決策熵的決策樹(shù)分類算法[J]. 王希玲,江峰,張友強(qiáng),劉國(guó)柱. 青島科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(06)
[5]基于雙屬性節(jié)點(diǎn)部分匹配的決策樹(shù)改進(jìn)算法[J]. 何田中,黃再祥. 閩南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(04)
[6]R軟件3個(gè)常用決策樹(shù)包的應(yīng)用比較[J]. 帥健,張艷,方瑤,李麗萍. 傷害醫(yī)學(xué)(電子版). 2015(03)
[7]基于隨機(jī)森林方法的滑坡災(zāi)害危險(xiǎn)性區(qū)劃[J]. 李亭,田原,鄔倫,劉亮. 地理與地理信息科學(xué). 2014(06)
[8]一種新的組合分類器學(xué)習(xí)方法[J]. 郭華平,袁俊紅,張帆,鄔長(zhǎng)安,范明. 計(jì)算機(jī)科學(xué). 2014(07)
[9]隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 李欣海. 應(yīng)用昆蟲(chóng)學(xué)報(bào). 2013(04)
[10]用于分類的隨機(jī)森林和Bagging分類樹(shù)比較[J]. 馬景義,謝邦昌. 統(tǒng)計(jì)與信息論壇. 2010(10)
碩士論文
[1]分類器在員工離職預(yù)測(cè)中的應(yīng)用[D]. 劉婷婷.廣西大學(xué) 2018
[2]決策樹(shù)分類算法優(yōu)化研究[D]. 陳沛玲.中南大學(xué) 2007
本文編號(hào):3229650
【文章來(lái)源】:云南師范大學(xué)云南省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
論文結(jié)構(gòu)框架
第 2 章 多藥耐藥性數(shù)據(jù)及預(yù)處理定是異常值.采用蓋帽法處理這些異常值,其原理是替換數(shù)據(jù)框里 99%以上和 1%以下,將 99%以上的點(diǎn)值變更為 99%的點(diǎn)值;小于 1%的點(diǎn)值變更為 1%的點(diǎn)值圖 2.1、2.2 給出了前四個(gè)自變量采用蓋帽法處理前后的箱線圖.
將 99%以上的點(diǎn)值變更為 99%的點(diǎn)值;小于 1%的點(diǎn)值變更為 1%的點(diǎn)值圖 2.1、2.2 給出了前四個(gè)自變量采用蓋帽法處理前后的箱線圖.圖 2.1 前四個(gè)自變量箱線圖
【參考文獻(xiàn)】:
期刊論文
[1]芍藥苷對(duì)慢性髓系白血病耐阿霉素細(xì)胞株K562/ADR多藥耐藥性的逆轉(zhuǎn)作用及機(jī)制[J]. 朱聰,賈秀紅,劉迎雪. 山東醫(yī)藥. 2018(47)
[2]基于R語(yǔ)言rpart包與party包的分類樹(shù)建模研究[J]. 徐萬(wàn)佶,曾慶. 科技資訊. 2018(11)
[3]基于邊際的組合分類器選擇算法[J]. 魏濤,郭華平,季新生. 信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2017(03)
[4]基于依賴決策熵的決策樹(shù)分類算法[J]. 王希玲,江峰,張友強(qiáng),劉國(guó)柱. 青島科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(06)
[5]基于雙屬性節(jié)點(diǎn)部分匹配的決策樹(shù)改進(jìn)算法[J]. 何田中,黃再祥. 閩南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(04)
[6]R軟件3個(gè)常用決策樹(shù)包的應(yīng)用比較[J]. 帥健,張艷,方瑤,李麗萍. 傷害醫(yī)學(xué)(電子版). 2015(03)
[7]基于隨機(jī)森林方法的滑坡災(zāi)害危險(xiǎn)性區(qū)劃[J]. 李亭,田原,鄔倫,劉亮. 地理與地理信息科學(xué). 2014(06)
[8]一種新的組合分類器學(xué)習(xí)方法[J]. 郭華平,袁俊紅,張帆,鄔長(zhǎng)安,范明. 計(jì)算機(jī)科學(xué). 2014(07)
[9]隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 李欣海. 應(yīng)用昆蟲(chóng)學(xué)報(bào). 2013(04)
[10]用于分類的隨機(jī)森林和Bagging分類樹(shù)比較[J]. 馬景義,謝邦昌. 統(tǒng)計(jì)與信息論壇. 2010(10)
碩士論文
[1]分類器在員工離職預(yù)測(cè)中的應(yīng)用[D]. 劉婷婷.廣西大學(xué) 2018
[2]決策樹(shù)分類算法優(yōu)化研究[D]. 陳沛玲.中南大學(xué) 2007
本文編號(hào):3229650
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3229650.html
最近更新
教材專著