基于多特征信息融合的癌癥凝集素的鑒定方法研究
發(fā)布時間:2021-06-08 11:00
隨著后基因時代的來臨,越來越多的未知功能的蛋白質(zhì)序列也在被迅速的被發(fā)現(xiàn),預(yù)測蛋白質(zhì)的功能是后基因時代的主要挑戰(zhàn)之一。癌癥凝集素是一種在腫瘤細(xì)胞分化和轉(zhuǎn)移中發(fā)揮重要作用的蛋白質(zhì),準(zhǔn)確鑒定出癌癥凝集素有助于明確癌癥治療發(fā)展的方向。然而,傳統(tǒng)的生物化學(xué)實驗方法既費錢又耗時,現(xiàn)有的基于計算機的鑒定方法也不盡如人意。鑒定效果不夠好的主要原因是輸入分類模型的特征沒能很好的表達(dá)出蛋白質(zhì)的復(fù)雜性與序列多樣性。因此,本文提出了一種將多特征信息相融合的特征表達(dá)算法來區(qū)分癌癥和非癌癥凝集素,主要內(nèi)容如下:(1)基于多信息融合的兩步特征提取算法。具體地,基于幾種常用的單特征表達(dá)算法進行融合:包含序列信息的三肽組成(Tripeptide Composition,TipC)、包含序列信息和物理化學(xué)信息的聯(lián)合三元組(conjointtriad)和包含功能信息的基因本體論(Gene Ontology,GO)注釋。兩部特征提取算法結(jié)合了序列信息與GO注釋信息:首先使用將TipC和蛋白相互作用網(wǎng)絡(luò)(PPI網(wǎng)絡(luò))融合的DeepGO算法得到GO注釋,然后將所得GO注釋轉(zhuǎn)化為特征向量。實驗結(jié)果表明,相對于單特征表達(dá),該方法包含...
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1癌癥凝集素鑒定一般流程圖??
2.4.2K近鄰算法(KNN)??KNN是一種非參數(shù)算法,用于處理分類和回歸問題。在分類中,KNN使用k個最近??鄰居提供的信息來預(yù)測新實例的類。如圖2.?2所示,紅色圓點為測試樣本;訓(xùn)練樣共有??,?v?j測試樣本??丨破??'、、、一:???????圖2.2?K近鄰分類器示意圖??14??
數(shù)據(jù)集上分別使用BLAST和DeepGO進行對比實驗,即第一步特征提取結(jié)果的比較;??其次,使用分別基于BLAST和DeepGO的GO注釋特征的提取,即第二步特征提取結(jié)??果的比較。具體實驗流程圖如圖3.1所示。??3.4.?1不同特征表達(dá)的性能對比??首先,我們針對上述兩步特征提取模型中的第一步進行實驗。表3.3展示了同為預(yù)??22??
【參考文獻(xiàn)】:
期刊論文
[1]基于SVM的蛋白質(zhì)亞細(xì)胞定位預(yù)測[J]. 劉清華,賴裕平,丁洪偉,楊志軍,崔曉龍. 計算機工程與應(yīng)用. 2019(11)
[2]蛋白亞細(xì)胞定位與腫瘤關(guān)系的研究進展[J]. 宋勇飛,張衍梅,方夢蝶,王孝舉. 腫瘤. 2017(06)
博士論文
[1]高維生物數(shù)據(jù)的分類與預(yù)測研究[D]. 王彤.上海交通大學(xué) 2009
碩士論文
[1]分枝桿菌蛋白質(zhì)亞細(xì)胞定位的預(yù)測研究[D]. 丁辰.電子科技大學(xué) 2013
本文編號:3218304
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1癌癥凝集素鑒定一般流程圖??
2.4.2K近鄰算法(KNN)??KNN是一種非參數(shù)算法,用于處理分類和回歸問題。在分類中,KNN使用k個最近??鄰居提供的信息來預(yù)測新實例的類。如圖2.?2所示,紅色圓點為測試樣本;訓(xùn)練樣共有??,?v?j測試樣本??丨破??'、、、一:???????圖2.2?K近鄰分類器示意圖??14??
數(shù)據(jù)集上分別使用BLAST和DeepGO進行對比實驗,即第一步特征提取結(jié)果的比較;??其次,使用分別基于BLAST和DeepGO的GO注釋特征的提取,即第二步特征提取結(jié)??果的比較。具體實驗流程圖如圖3.1所示。??3.4.?1不同特征表達(dá)的性能對比??首先,我們針對上述兩步特征提取模型中的第一步進行實驗。表3.3展示了同為預(yù)??22??
【參考文獻(xiàn)】:
期刊論文
[1]基于SVM的蛋白質(zhì)亞細(xì)胞定位預(yù)測[J]. 劉清華,賴裕平,丁洪偉,楊志軍,崔曉龍. 計算機工程與應(yīng)用. 2019(11)
[2]蛋白亞細(xì)胞定位與腫瘤關(guān)系的研究進展[J]. 宋勇飛,張衍梅,方夢蝶,王孝舉. 腫瘤. 2017(06)
博士論文
[1]高維生物數(shù)據(jù)的分類與預(yù)測研究[D]. 王彤.上海交通大學(xué) 2009
碩士論文
[1]分枝桿菌蛋白質(zhì)亞細(xì)胞定位的預(yù)測研究[D]. 丁辰.電子科技大學(xué) 2013
本文編號:3218304
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3218304.html
最近更新
教材專著