基于DNA序列特征的必需基因判定研究
發(fā)布時間:2021-11-07 18:08
近年來,伴隨生物信息技術(shù)的迅猛發(fā)展,可用生物數(shù)據(jù)量正呈指數(shù)增長。從各公共生物數(shù)據(jù)庫中可以獲得大量、準(zhǔn)確的生物數(shù)據(jù)信息,而如何準(zhǔn)確、高效地對這些數(shù)據(jù)進(jìn)行分析與挖掘,發(fā)掘其中蘊含的內(nèi)在信息也成為研究熱點。作為活體細(xì)胞所需的最小基因組,“必需基因”在維持生物體進(jìn)行正常生命活動和繁殖過程中充當(dāng)重要角色,該類基因的缺失將導(dǎo)致生物體死亡或喪失繁殖能力,后果嚴(yán)重。醫(yī)學(xué)上,必需基因在生物體存活方面發(fā)揮著重要基礎(chǔ)作用,已成為許多抗生素和抗癌化合物中的潛在靶點,被廣泛應(yīng)用于病原體和癌細(xì)胞的消除,在抗生素和疫苗研制中意義重大;合成生物學(xué)上,可以有針對性地選擇目標(biāo)細(xì)胞的最小基因組,合成活細(xì)胞“底盤”;進(jìn)化生物學(xué)上,研究必需基因可以加深對生物進(jìn)化過程的理解,通過對常見同類必需基因的研究,實現(xiàn)對物種的同源性分析。然而,目前常用的通過生物實驗篩選必需基因的方法存在諸如成本高、耗時長、工作量大、適用范圍小等缺點,為提高必需基因判定效率,適應(yīng)生物“大數(shù)據(jù)”時代的需求,論文從信息科學(xué)學(xué)角度出發(fā),對基于DNA序列特征的必需基因判定算法進(jìn)行研究,提出了4種判別基因必需性的有效分類器。首先,對DNA 一級序列進(jìn)行特征提取,其中...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
同種分類器下羞于各特征提取的AUC值
由表3-11與圖3-2對各分類器的縱向比較結(jié)果,即各分類器的AUC平均值??與圖3-1中各分類器評價結(jié)果可知,隨機森林(RF)與邏輯回歸(LR)分類器??的AUC平均值較高,分別為0.778和0.767,且在圖3-1與圖3-2中較高;而決??策樹(C4.5)與h近鄰算法(NN)分類器在這個問題上的AUC平均值較低,分??別為0.651和0.648,在圖3-1與圖3-2中較低。因此隨機森林(RF)分類器與??-25-??
Hi?|?lilH??圖4-2.各分類器AUC值指標(biāo)與對比??如表4-10與圖4-2所示,論文提出的幾種主要的判別必需基因分類器取得??了平均為0.8254的AUC值,其中表現(xiàn)最好的多特征分類器為LR-3-LR,取得了??0.834的AUC值,優(yōu)于表中所示的其他五種參考分類器,且如圖4-2所示,論文??提出的幾種分類器的整體AUC值也優(yōu)于其他五種參考分類器。說明論文所提出??的分類方法具有良好的潛力,可以成為判別基因必需性的有效工具。??-37-??
本文編號:3482315
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
同種分類器下羞于各特征提取的AUC值
由表3-11與圖3-2對各分類器的縱向比較結(jié)果,即各分類器的AUC平均值??與圖3-1中各分類器評價結(jié)果可知,隨機森林(RF)與邏輯回歸(LR)分類器??的AUC平均值較高,分別為0.778和0.767,且在圖3-1與圖3-2中較高;而決??策樹(C4.5)與h近鄰算法(NN)分類器在這個問題上的AUC平均值較低,分??別為0.651和0.648,在圖3-1與圖3-2中較低。因此隨機森林(RF)分類器與??-25-??
Hi?|?lilH??圖4-2.各分類器AUC值指標(biāo)與對比??如表4-10與圖4-2所示,論文提出的幾種主要的判別必需基因分類器取得??了平均為0.8254的AUC值,其中表現(xiàn)最好的多特征分類器為LR-3-LR,取得了??0.834的AUC值,優(yōu)于表中所示的其他五種參考分類器,且如圖4-2所示,論文??提出的幾種分類器的整體AUC值也優(yōu)于其他五種參考分類器。說明論文所提出??的分類方法具有良好的潛力,可以成為判別基因必需性的有效工具。??-37-??
本文編號:3482315
本文鏈接:http://sikaile.net/projectlw/swxlw/3482315.html
最近更新
教材專著