基于蛋白質(zhì)側(cè)鏈信息的B細(xì)胞表位預(yù)測(cè)的機(jī)器學(xué)習(xí)方法
發(fā)布時(shí)間:2017-12-29 02:08
本文關(guān)鍵詞:基于蛋白質(zhì)側(cè)鏈信息的B細(xì)胞表位預(yù)測(cè)的機(jī)器學(xué)習(xí)方法 出處:《東北師范大學(xué)》2012年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 構(gòu)象性B細(xì)胞表位預(yù)測(cè) 蛋白質(zhì)氨基酸側(cè)鏈信息 機(jī)器學(xué)習(xí) 支持向量機(jī)
【摘要】:B細(xì)胞表位預(yù)測(cè)是免疫信息學(xué)中非常重要的一個(gè)研究方面。B細(xì)胞表位是一組有自身特征性的位點(diǎn),它們分布在抗原表面,依照線性或者構(gòu)象性的方式排列,從而來(lái)引起抗原-抗體的相互綁定、介導(dǎo)體液免疫應(yīng)答,因此表位的預(yù)測(cè)對(duì)于疫苗的開(kāi)發(fā)和疾病的診斷都具有非常重要的作用。根據(jù)結(jié)構(gòu)不同,B細(xì)胞表位分為線性表位和構(gòu)象性表位兩種,目前線性B細(xì)胞表位預(yù)測(cè)方面已經(jīng)取得很多的成績(jī),,而構(gòu)象性B細(xì)胞表位預(yù)測(cè)方面的研究則相對(duì)緩慢,隨著實(shí)際應(yīng)用需求的增加和實(shí)驗(yàn)手段的進(jìn)步,越來(lái)越多的研究人員開(kāi)始專注于構(gòu)象性B細(xì)胞表位的預(yù)測(cè)研究,一些預(yù)測(cè)算法和軟件相繼發(fā)布。 本文提出了一種基于劃分的策略來(lái)進(jìn)行構(gòu)象性B細(xì)胞表位預(yù)測(cè),方法選取抗原的六個(gè)基于蛋白質(zhì)氨基酸側(cè)鏈信息的表位特征,使用支持向量機(jī)的方法對(duì)抗原氨基酸進(jìn)行分類,進(jìn)而預(yù)測(cè)可能的表位。該方法的有效性在161條包含了抗原-抗體復(fù)合體結(jié)構(gòu)的數(shù)據(jù)集以及非復(fù)合體的抗原數(shù)據(jù)集上得到驗(yàn)證,使用非復(fù)合體的抗原數(shù)據(jù)集,算法預(yù)測(cè)的準(zhǔn)確性可以達(dá)到:敏感性53.6%、準(zhǔn)確性20.5%、曲線下面積(AUC)的值為0.627;對(duì)于復(fù)合體結(jié)構(gòu)的數(shù)據(jù)集,算法的AUC值下降到0.609,但是在敏感性、準(zhǔn)確性上略有提高。本文預(yù)測(cè)結(jié)果與EPCES進(jìn)行比較發(fā)現(xiàn),預(yù)測(cè)性能較高于EPCES,這個(gè)結(jié)果說(shuō)明了結(jié)合機(jī)器學(xué)習(xí)和特征選擇的方法進(jìn)行表位預(yù)測(cè)是有效的;另一方面,方法整體預(yù)測(cè)性能仍然不能令人滿意,還有待建立更全面的表位和非表位數(shù)據(jù)集、尋找或結(jié)合更多更有效的表位特征、開(kāi)發(fā)更有效的算法來(lái)進(jìn)一步提高預(yù)測(cè)性能。
[Abstract]:......
【學(xué)位授予單位】:東北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:R392
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 劉胥影;吳建鑫;周志華;;一種基于級(jí)聯(lián)模型的類別不平衡數(shù)據(jù)分類方法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年02期
本文編號(hào):1348352
本文鏈接:http://sikaile.net/xiyixuelunwen/1348352.html
最近更新
教材專著