基于結(jié)核病的基因芯片數(shù)據(jù)挖掘及生物信息學(xué)分析
發(fā)布時(shí)間:2021-10-20 21:00
本文旨在尋找可用于結(jié)核病診斷和治療的潛在分子標(biāo)志物.首先借助分析活動(dòng)性結(jié)核病患者和潛伏性結(jié)核病的基因表達(dá)譜,利用隨機(jī)森林算法建立預(yù)測(cè)模型識(shí)別出跟結(jié)核病感染狀態(tài)相關(guān)的易感基因.其次對(duì)結(jié)核病患者的外周血單核細(xì)胞與健康人的基因進(jìn)行了比較分析以及生物信息學(xué)分析,發(fā)現(xiàn)了結(jié)核病患者與健康對(duì)照組個(gè)體之間可能存在的生物標(biāo)志物.第一章,介紹了結(jié)核分枝桿菌的背景知識(shí)、結(jié)核病的致病機(jī)制,國(guó)內(nèi)外用于結(jié)核病診斷識(shí)別的分子標(biāo)志物的研究進(jìn)展及本文所需的理論基礎(chǔ)知識(shí).第二章,分析活動(dòng)性結(jié)核病和潛伏性結(jié)核病患者的基因表達(dá)譜,首先采用方差過(guò)濾篩選出差異表達(dá)的基因,其次利用隨機(jī)森林算法建立模型預(yù)測(cè)跟結(jié)核病感染狀態(tài)相關(guān)的基因,并選出排序靠前的相關(guān)基因,通過(guò)對(duì)比參考以前的文獻(xiàn)和生物分析說(shuō)明這些基因都跟結(jié)核病感染狀態(tài)密切相關(guān).與其它模型預(yù)測(cè)方法相比,隨機(jī)森林模型方法使用更簡(jiǎn)單、速度更快,并且擬合效果也較好.第三章,對(duì)來(lái)源于結(jié)核病患者外周血單核細(xì)胞和健康對(duì)照組的基因進(jìn)行了比較,隨后對(duì)篩選出的差異表達(dá)基因進(jìn)行GO功能富集分析和KEGG通路富集分析,同時(shí)通過(guò)構(gòu)建蛋白互作網(wǎng)絡(luò)以及模塊分析,我們發(fā)現(xiàn)了可用于識(shí)別結(jié)核病的潛在生物標(biāo)志物,最后...
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2?不同數(shù)目隨機(jī)森林對(duì)預(yù)測(cè)準(zhǔn)確率的影響??rf??
?MeanDecreaseGini??圖3?特征基因的重要性排序??同時(shí),如圖3隨機(jī)森林算法可以給出自變量的童栗性排序.隨機(jī)森林模型中的變量轚要??性排序的主要原理為:隨機(jī)的在特征鸞羹中加入噪聲?模型準(zhǔn)確率變動(dòng)越大說(shuō)明變量就越童要???MeanDecrea§eAccuracy是指隨機(jī)地在所含的變量里面加入嗓聲影響后9模型的推確率發(fā)生??增加的均3S_s而?:泡=重要性也與增加的均畫差成正比.??§2.2.4模型的驗(yàn)證??為了說(shuō)明隨機(jī)森林模型的預(yù)測(cè)性能,將此與傳統(tǒng)的支持鍾鳳歸模型(SVM)的R0C曲??線繪制在同一個(gè)圖中進(jìn)行性能比較.首先,設(shè)置訓(xùn)練過(guò)程的控制參數(shù)為黨復(fù)三次的10倍交叉??驗(yàn)怔^分別使用Random?Forest和SVM兩神不隊(duì)的方法建立預(yù)測(cè)犠型進(jìn)行預(yù)測(cè),然再根??據(jù)預(yù)測(cè)結(jié)果繪制出與之相對(duì)應(yīng)的R0C曲線圖〔圖4),從結(jié)果可知,基于隨機(jī)森林(紅色.)方法訓(xùn)??練得到的分類模型R0C曲線的AUC值較大,為0.923;基于SVM_色:)方法得到的分類模??
線繪制在同一個(gè)圖中進(jìn)行性能比較.首先,設(shè)置訓(xùn)練過(guò)程的控制參數(shù)為黨復(fù)三次的10倍交叉??驗(yàn)怔^分別使用Random?Forest和SVM兩神不隊(duì)的方法建立預(yù)測(cè)犠型進(jìn)行預(yù)測(cè),然再根??據(jù)預(yù)測(cè)結(jié)果繪制出與之相對(duì)應(yīng)的R0C曲線圖〔圖4),從結(jié)果可知,基于隨機(jī)森林(紅色.)方法訓(xùn)??練得到的分類模型R0C曲線的AUC值較大,為0.923;基于SVM_色:)方法得到的分類模??
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)核分枝桿菌臨床檢測(cè)技術(shù)的研究進(jìn)展[J]. 金福姝,薛強(qiáng),鄒明強(qiáng),傅迎,孫福軍,李莉. 中國(guó)冶金工業(yè)醫(yī)學(xué)雜志. 2015(02)
[2]基于隨機(jī)森林的亞健康狀態(tài)預(yù)測(cè)與特征選擇方法研究[J]. 王小強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[3]隨機(jī)森林方法在醫(yī)學(xué)中的應(yīng)用[J]. 韓玉,施海龍,曲波,武玉欣,劉潔. 中國(guó)預(yù)防醫(yī)學(xué)雜志. 2014(01)
[4]結(jié)核病臨床診治進(jìn)展年度報(bào)告(2011年)(第一部分 結(jié)核病臨床診斷)[J]. 唐神結(jié),胡忠義,張青,范琳,崔振玲,劉一典,張宗德,謝汝明,白連啟,陸宇,張延安,侯代倫,金鋒,張廣宇,陳志,胡族瓊,閆世明,趙云虹,邢勇,孫炳奇. 中國(guó)防癆雜志. 2012(06)
[5]初診肺結(jié)核病人流行病學(xué)特征及分析[J]. 辛秀梅,吳英杰,張海濤,于秀萍. 中國(guó)公共衛(wèi)生. 2012(01)
[6]不同檢測(cè)方法對(duì)肺結(jié)核診斷價(jià)值的探討[J]. 李秋根,劉江紅,邊澤源. 中國(guó)危重病急救醫(yī)學(xué). 2002(09)
碩士論文
[1]基于R語(yǔ)言的差異表達(dá)基因檢測(cè)研究[D]. 紀(jì)相禹.吉林大學(xué) 2011
本文編號(hào):3447595
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2?不同數(shù)目隨機(jī)森林對(duì)預(yù)測(cè)準(zhǔn)確率的影響??rf??
?MeanDecreaseGini??圖3?特征基因的重要性排序??同時(shí),如圖3隨機(jī)森林算法可以給出自變量的童栗性排序.隨機(jī)森林模型中的變量轚要??性排序的主要原理為:隨機(jī)的在特征鸞羹中加入噪聲?模型準(zhǔn)確率變動(dòng)越大說(shuō)明變量就越童要???MeanDecrea§eAccuracy是指隨機(jī)地在所含的變量里面加入嗓聲影響后9模型的推確率發(fā)生??增加的均3S_s而?:泡=重要性也與增加的均畫差成正比.??§2.2.4模型的驗(yàn)證??為了說(shuō)明隨機(jī)森林模型的預(yù)測(cè)性能,將此與傳統(tǒng)的支持鍾鳳歸模型(SVM)的R0C曲??線繪制在同一個(gè)圖中進(jìn)行性能比較.首先,設(shè)置訓(xùn)練過(guò)程的控制參數(shù)為黨復(fù)三次的10倍交叉??驗(yàn)怔^分別使用Random?Forest和SVM兩神不隊(duì)的方法建立預(yù)測(cè)犠型進(jìn)行預(yù)測(cè),然再根??據(jù)預(yù)測(cè)結(jié)果繪制出與之相對(duì)應(yīng)的R0C曲線圖〔圖4),從結(jié)果可知,基于隨機(jī)森林(紅色.)方法訓(xùn)??練得到的分類模型R0C曲線的AUC值較大,為0.923;基于SVM_色:)方法得到的分類模??
線繪制在同一個(gè)圖中進(jìn)行性能比較.首先,設(shè)置訓(xùn)練過(guò)程的控制參數(shù)為黨復(fù)三次的10倍交叉??驗(yàn)怔^分別使用Random?Forest和SVM兩神不隊(duì)的方法建立預(yù)測(cè)犠型進(jìn)行預(yù)測(cè),然再根??據(jù)預(yù)測(cè)結(jié)果繪制出與之相對(duì)應(yīng)的R0C曲線圖〔圖4),從結(jié)果可知,基于隨機(jī)森林(紅色.)方法訓(xùn)??練得到的分類模型R0C曲線的AUC值較大,為0.923;基于SVM_色:)方法得到的分類模??
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)核分枝桿菌臨床檢測(cè)技術(shù)的研究進(jìn)展[J]. 金福姝,薛強(qiáng),鄒明強(qiáng),傅迎,孫福軍,李莉. 中國(guó)冶金工業(yè)醫(yī)學(xué)雜志. 2015(02)
[2]基于隨機(jī)森林的亞健康狀態(tài)預(yù)測(cè)與特征選擇方法研究[J]. 王小強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[3]隨機(jī)森林方法在醫(yī)學(xué)中的應(yīng)用[J]. 韓玉,施海龍,曲波,武玉欣,劉潔. 中國(guó)預(yù)防醫(yī)學(xué)雜志. 2014(01)
[4]結(jié)核病臨床診治進(jìn)展年度報(bào)告(2011年)(第一部分 結(jié)核病臨床診斷)[J]. 唐神結(jié),胡忠義,張青,范琳,崔振玲,劉一典,張宗德,謝汝明,白連啟,陸宇,張延安,侯代倫,金鋒,張廣宇,陳志,胡族瓊,閆世明,趙云虹,邢勇,孫炳奇. 中國(guó)防癆雜志. 2012(06)
[5]初診肺結(jié)核病人流行病學(xué)特征及分析[J]. 辛秀梅,吳英杰,張海濤,于秀萍. 中國(guó)公共衛(wèi)生. 2012(01)
[6]不同檢測(cè)方法對(duì)肺結(jié)核診斷價(jià)值的探討[J]. 李秋根,劉江紅,邊澤源. 中國(guó)危重病急救醫(yī)學(xué). 2002(09)
碩士論文
[1]基于R語(yǔ)言的差異表達(dá)基因檢測(cè)研究[D]. 紀(jì)相禹.吉林大學(xué) 2011
本文編號(hào):3447595
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/3447595.html
最近更新
教材專著