基于子圖擴(kuò)展的抗原表位發(fā)現(xiàn)
發(fā)布時間:2020-06-12 23:25
【摘要】:子圖擴(kuò)展就是對子圖進(jìn)行重疊聚類的過程,這是為了解決傳統(tǒng)聚類算法無法聚出重疊聚簇的缺陷而提出。本文利用網(wǎng)絡(luò)中子圖的結(jié)構(gòu)特征以及子圖的點(diǎn)邊屬性,對傳統(tǒng)非重疊圖聚類算法的非重疊聚簇進(jìn)行再擴(kuò)展,使得最終的聚類結(jié)果具有重疊性質(zhì)。基于以上思路,本文先后提出兩個子圖擴(kuò)展模型Glep和GKCE,其中Glep首先通過構(gòu)建非重疊聚簇的14維圖屬性特征來近似描述一個子圖的結(jié)構(gòu)信息,然后使用詞頻-逆文本技術(shù)來優(yōu)化這14維特征的權(quán)重。最后在經(jīng)過優(yōu)化的14維特征基礎(chǔ)上,基于14維特征的穩(wěn)定性完成對非重疊聚簇的重疊擴(kuò)展。而GKCE不僅利用了子圖的結(jié)構(gòu)特征,更進(jìn)一步地結(jié)合了子圖的點(diǎn)邊屬性,通過圖核技術(shù)分析了擴(kuò)展過程中子圖之間的相似程度,完成對非重疊聚簇的重疊擴(kuò)展,最終得到具有重疊性質(zhì)的聚類結(jié)果?乖砦皇强乖媳豢贵w接觸的部分氨基酸殘基,抗原表位的發(fā)現(xiàn)即是定位那些位于抗原鏈上被抗體鏈接觸的氨基酸殘基位置。對于一條抗原鏈而言,根據(jù)其上的抗原表位的數(shù)量差異和位置關(guān)系這兩方面信息,可將抗原表位劃分為單個分開,多個分開和多個重疊這三種情況。目前大部分抗原表位預(yù)測模型集中在單個抗原表位的預(yù)測上,很少有模型能實(shí)現(xiàn)對多個分開抗原表位的預(yù)測,至于能實(shí)現(xiàn)對多個重疊抗原表位預(yù)測的模型就更少了。目前的研究已經(jīng)表明抗原表位在抗原鏈的空間結(jié)構(gòu)上具有特異性,表面化,聚集性和重疊性這四個特性,這些特性使得目前基于結(jié)構(gòu)的預(yù)測模型是抗原表位預(yù)測研究領(lǐng)域的熱門方向。本文從抗原鏈上氨基酸殘基的結(jié)構(gòu)網(wǎng)絡(luò)入手,設(shè)計(jì)了兩個重疊子圖聚類模型,從不同的角度分析抗原鏈上的抗原表位,很好地解決目前大多數(shù)抗原表位預(yù)測模型預(yù)測情況單一、預(yù)測效果不佳這兩大問題。實(shí)驗(yàn)結(jié)果顯示,相比較目前最好的同類模型,本文表現(xiàn)最好的重疊子圖聚類模型GKCE的Fl分?jǐn)?shù)平均值在單個抗原表位,多個分開抗原表位和多個重疊抗原表位上有67%,81%,37%的提升。
【圖文】:
重原子有多條不同的邊連接,如此便只保留一條。經(jīng)過以上的過程,可以提取每個抗原逡逑鏈上的氨基酸殘基網(wǎng)絡(luò),,為了直觀觀察抗原鏈上的氨基酸殘基網(wǎng)絡(luò),現(xiàn)對一個網(wǎng)絡(luò)規(guī)模逡逑較小的抗原鏈氨基酸殘基網(wǎng)絡(luò)進(jìn)行可視化,其網(wǎng)絡(luò)情況看圖2-2。逡逑2273-TW逡逑\邐|/NB一逡逑一邐了’逡逑^vT7T2*?-GUI邐233A4BJ逡逑2mw逡逑2X84^逡逑1邐刀',丨逡逑邐^邋^邐邐邐逡逑咖似邐ama逡逑圖2-2復(fù)合物liqd抗原鏈C鏈的氨基酸殘基網(wǎng)絡(luò)逡逑Fig.邋2-2邋Amino邋acid邋network邋of邋complex邋1邋iqd邋antigen邋C邋chain逡逑圖2-2中是復(fù)合物liqd的抗原鏈C鏈上的氨基酸殘基網(wǎng)絡(luò),網(wǎng)絡(luò)中每個節(jié)點(diǎn)標(biāo)簽由逡逑兩部分組成,第一部分表示該氨基酸殘基在抗原鏈上的編號,第二部分指明氨基酸殘基逡逑11逡逑
分析子結(jié)構(gòu)的信息,鄰居圖核分析了節(jié)點(diǎn)的周圍信息,最終的分類結(jié)果是不同圖核對子逡逑圖在不同方向上分析的綜合。逡逑圖3-1直觀展示了使用多圖核機(jī)制對重疊聚簇進(jìn)行分類的過程,從圖中我們可以看逡逑出,該分類的過程一共分為三步,第一步是使用包括真實(shí)抗原表位在內(nèi)的數(shù)據(jù)作為訓(xùn)練逡逑集,用該數(shù)據(jù)集訓(xùn)練多個圖核;第二步是在完成多圖核訓(xùn)練后,初步得到對每個圖核對逡逑重疊聚簇的分類結(jié)果,根據(jù)每個圖核的分類的效果選擇優(yōu)秀的圖核作為投票員;第三步逡逑是使用投票員的“一票決定制”對預(yù)測進(jìn)行投票?偟膩碚f,前面兩步是對多圖核進(jìn)行逡逑篩選,這是因?yàn)槲覀儾磺宄男﹫D核能在具體的氨基酸殘基網(wǎng)絡(luò)中起作用,最后一步是逡逑驗(yàn)證該分類機(jī)制的準(zhǔn)確性。逡逑在分類過程中需要注意的是,對于某個抗原的分類處理時,并不是所有圖核都能參逡逑與投票,一個圖核在該抗原上的表現(xiàn)必須優(yōu)秀才可以被選為投票員,所謂足夠優(yōu)秀可以逡逑是圖核在該抗原上的分類效果達(dá)到一定的比例
【學(xué)位授予單位】:廣西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R392;O157.5
本文編號:2710261
【圖文】:
重原子有多條不同的邊連接,如此便只保留一條。經(jīng)過以上的過程,可以提取每個抗原逡逑鏈上的氨基酸殘基網(wǎng)絡(luò),,為了直觀觀察抗原鏈上的氨基酸殘基網(wǎng)絡(luò),現(xiàn)對一個網(wǎng)絡(luò)規(guī)模逡逑較小的抗原鏈氨基酸殘基網(wǎng)絡(luò)進(jìn)行可視化,其網(wǎng)絡(luò)情況看圖2-2。逡逑2273-TW逡逑\邐|/NB一逡逑一邐了’逡逑^vT7T2*?-GUI邐233A4BJ逡逑2mw逡逑2X84^逡逑1邐刀',丨逡逑邐^邋^邐邐邐逡逑咖似邐ama逡逑圖2-2復(fù)合物liqd抗原鏈C鏈的氨基酸殘基網(wǎng)絡(luò)逡逑Fig.邋2-2邋Amino邋acid邋network邋of邋complex邋1邋iqd邋antigen邋C邋chain逡逑圖2-2中是復(fù)合物liqd的抗原鏈C鏈上的氨基酸殘基網(wǎng)絡(luò),網(wǎng)絡(luò)中每個節(jié)點(diǎn)標(biāo)簽由逡逑兩部分組成,第一部分表示該氨基酸殘基在抗原鏈上的編號,第二部分指明氨基酸殘基逡逑11逡逑
分析子結(jié)構(gòu)的信息,鄰居圖核分析了節(jié)點(diǎn)的周圍信息,最終的分類結(jié)果是不同圖核對子逡逑圖在不同方向上分析的綜合。逡逑圖3-1直觀展示了使用多圖核機(jī)制對重疊聚簇進(jìn)行分類的過程,從圖中我們可以看逡逑出,該分類的過程一共分為三步,第一步是使用包括真實(shí)抗原表位在內(nèi)的數(shù)據(jù)作為訓(xùn)練逡逑集,用該數(shù)據(jù)集訓(xùn)練多個圖核;第二步是在完成多圖核訓(xùn)練后,初步得到對每個圖核對逡逑重疊聚簇的分類結(jié)果,根據(jù)每個圖核的分類的效果選擇優(yōu)秀的圖核作為投票員;第三步逡逑是使用投票員的“一票決定制”對預(yù)測進(jìn)行投票?偟膩碚f,前面兩步是對多圖核進(jìn)行逡逑篩選,這是因?yàn)槲覀儾磺宄男﹫D核能在具體的氨基酸殘基網(wǎng)絡(luò)中起作用,最后一步是逡逑驗(yàn)證該分類機(jī)制的準(zhǔn)確性。逡逑在分類過程中需要注意的是,對于某個抗原的分類處理時,并不是所有圖核都能參逡逑與投票,一個圖核在該抗原上的表現(xiàn)必須優(yōu)秀才可以被選為投票員,所謂足夠優(yōu)秀可以逡逑是圖核在該抗原上的分類效果達(dá)到一定的比例
【學(xué)位授予單位】:廣西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R392;O157.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 肖夢晴;;個體化癌癥疫苗通過黑色素瘤早期試驗(yàn)[J];國際生物制品學(xué)雜志;2018年01期
2 胡慶生;雷秀娟;;PPI網(wǎng)絡(luò)的改進(jìn)馬爾科夫聚類算法[J];計(jì)算機(jī)科學(xué);2015年07期
3 田浩兵;朱嘉鋼;陸曉;;基于特征貢獻(xiàn)度加權(quán)高斯核函數(shù)的粗糙one-class支持向量機(jī)[J];計(jì)算機(jī)科學(xué);2015年06期
4 李淑芳;王芬;;人SFRP1基因及其編碼蛋白基本特性及抗原表位的生物信息學(xué)分析[J];現(xiàn)代腫瘤醫(yī)學(xué);2013年05期
5 黃艷新;鮑永利;李玉新;;抗原表位預(yù)測的免疫信息學(xué)方法研究進(jìn)展[J];中國免疫學(xué)雜志;2008年09期
6 印春生;支海兵;;合成肽ELISA試驗(yàn)中肽抗原序列的篩選[J];中國獸藥雜志;2007年03期
本文編號:2710261
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2710261.html
最近更新
教材專著