基于基因表達譜的樣本分型與分類研究
發(fā)布時間:2020-12-08 05:39
基于基因芯片技術(shù),可以同時觀察在某一生命現(xiàn)象中成千上萬個基因的動態(tài)表達水平,使得人們能夠在基因組水平上以系統(tǒng)的、全局的觀念去研究生命現(xiàn)象及其本質(zhì);但是,通過基因芯片實驗直接獲得的是一個基因表達譜,其實際應(yīng)用要通過對基因表達譜的生物信息學(xué)處理來實現(xiàn),而樣本分型與分類研究是其中的核心環(huán)節(jié),為此,我們對這兩方面進行了系統(tǒng)研究,分別構(gòu)建了基于基因表達譜的樣本分型系統(tǒng)Samcluster和分類系統(tǒng)Tclass。 在Samcluster系統(tǒng)中,整合了下列聚類算法:譜系聚類、K-平均值聚類和自組圖聚類與變異系數(shù)計算和T-檢驗等基因變量選擇方法,并提出了一致的樣本分型概念,通過對四個基因表達譜的數(shù)據(jù)集COLON、LEUKEMIA72、LEUKEMIA38和OVARIAN的測試,結(jié)果表明:誤判的樣本數(shù)分別為5、1、0和0個,因此,基因水平的樣本分型與樣本的臨床分型高度一致。 在Tclass系統(tǒng)中,整合了Fisher線性判別分析與全組合、逐步優(yōu)化和Monte-Carlo模擬等基因變量選擇方法,并提出了分類穩(wěn)定性概念,通過對COLON等基因表達譜數(shù)據(jù)集的分析,結(jié)果表明:運用3到10個基因,可將不...
【文章來源】:中國人民解放軍軍事科學(xué)院北京市
【文章頁數(shù)】:64 頁
【學(xué)位級別】:博士
【部分圖文】:
基于P值的基因個數(shù)與樣本分類精度之間的關(guān)系
圖11:基于Monte一C盯lo模擬的基因個數(shù)與分類精度的關(guān)系1.5、基于逐步優(yōu)化選擇的基因個數(shù)與分類精度的關(guān)系首先,從基因集合中選擇分類效果最好的若干個基因,然后,以此若干個基因為基礎(chǔ),考慮其它基因與這些基因的組合,并以分類精度為指標,選擇一定數(shù)目且給出較好分類效果的包含兩個基因的集合,該過程反復(fù)進行,直到最后獲得包含指定基因數(shù)目的基因集合。最后,對這些基因集合進行穩(wěn)定性分析,找出最好的基因集合。圖12即為用逐步優(yōu)化方法進行基因變量選擇時的基因個數(shù)與分類精度之間的關(guān)系。從圖12中可以看出,當基因個數(shù)為6或7時,分類精度最高,約為95.0%。
定數(shù)目且給出較好分類效果的包含兩個基因的集合,該過程反復(fù)進行,直到最后獲得包含指定基因數(shù)目的基因集合。最后,對這些基因集合進行穩(wěn)定性分析,找出最好的基因集合。圖12即為用逐步優(yōu)化方法進行基因變量選擇時的基因個數(shù)與分類精度之間的關(guān)系。從圖12中可以看出,當基因個數(shù)為6或7時,分類精度最高,約為95.0%。
本文編號:2904553
【文章來源】:中國人民解放軍軍事科學(xué)院北京市
【文章頁數(shù)】:64 頁
【學(xué)位級別】:博士
【部分圖文】:
基于P值的基因個數(shù)與樣本分類精度之間的關(guān)系
圖11:基于Monte一C盯lo模擬的基因個數(shù)與分類精度的關(guān)系1.5、基于逐步優(yōu)化選擇的基因個數(shù)與分類精度的關(guān)系首先,從基因集合中選擇分類效果最好的若干個基因,然后,以此若干個基因為基礎(chǔ),考慮其它基因與這些基因的組合,并以分類精度為指標,選擇一定數(shù)目且給出較好分類效果的包含兩個基因的集合,該過程反復(fù)進行,直到最后獲得包含指定基因數(shù)目的基因集合。最后,對這些基因集合進行穩(wěn)定性分析,找出最好的基因集合。圖12即為用逐步優(yōu)化方法進行基因變量選擇時的基因個數(shù)與分類精度之間的關(guān)系。從圖12中可以看出,當基因個數(shù)為6或7時,分類精度最高,約為95.0%。
定數(shù)目且給出較好分類效果的包含兩個基因的集合,該過程反復(fù)進行,直到最后獲得包含指定基因數(shù)目的基因集合。最后,對這些基因集合進行穩(wěn)定性分析,找出最好的基因集合。圖12即為用逐步優(yōu)化方法進行基因變量選擇時的基因個數(shù)與分類精度之間的關(guān)系。從圖12中可以看出,當基因個數(shù)為6或7時,分類精度最高,約為95.0%。
本文編號:2904553
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/2904553.html
最近更新
教材專著