隨著人類基因組計(jì)劃的順利進(jìn)展,越來越多的蛋白質(zhì)序列被測定出來;而通過實(shí)驗(yàn)確定其結(jié)構(gòu)與功能的蛋白質(zhì)序列則相對(duì)較少,且兩者之間的差距有迅速擴(kuò)大的趨勢。由于通過實(shí)驗(yàn)確定蛋白質(zhì)的結(jié)構(gòu)和功能費(fèi)時(shí)、費(fèi)力、費(fèi)財(cái),且實(shí)驗(yàn)中可能還會(huì)遇到一些目前無法解決的困難,因此探索利用理論及計(jì)算方法來研究蛋白質(zhì)結(jié)構(gòu)和功能具有重要意義。本文從蛋白質(zhì)的一級(jí)序列出發(fā),研究了蛋白質(zhì)的結(jié)構(gòu)、功能分類預(yù)測,其主要貢獻(xiàn)如下: 1.提出一種新的組合分類思想,即將氨基酸組成成分、自相關(guān)函數(shù)二種特征提取法與支持向量機(jī)恰當(dāng)組合,首次對(duì)蛋白質(zhì)同源二聚體和非同源二聚體進(jìn)行分類研究,并與國際上現(xiàn)有的Garian方法進(jìn)行了對(duì)比。在10CV檢驗(yàn)下,本文方法的分類總精度比Garian方法最大可提高17.1個(gè)百分點(diǎn)。 2.提出二種新的特征提取法,并引入以前已有的二種特征提取法,與支持向量機(jī)和不同的分類策略,進(jìn)行恰當(dāng)?shù)慕M合構(gòu)成分類系統(tǒng),首次對(duì)蛋白質(zhì)同源二聚體、同源三聚體、同源四聚體和同源六聚體進(jìn)行分類研究。結(jié)果表明整合了氨基酸殘基序列順序信息的三種特征提取法,其分類能力均好于氨基酸組成成分特征提取法,尤以我們提出的加權(quán)自相關(guān)函數(shù)特征提取法的分類效果最好,其分類總精度可比氨基酸組成成分特征提取法最大可提高6.39個(gè)百分點(diǎn),比Chou的特征提取法提高2.41個(gè)百分點(diǎn);采用“一對(duì)一”策略的分類能力明顯優(yōu)于“一對(duì)多”策略,其分類總精度最大可提高17.69個(gè)百分點(diǎn)。 3.一種新的組合分類方法,即將自相關(guān)函數(shù)特征提取法和支持向量機(jī)、以及本文提出的“改進(jìn)的唯一的一對(duì)多”分類策略恰當(dāng)組合,應(yīng)用于蛋白質(zhì)折疊子分類研究。結(jié)果顯示:對(duì)于獨(dú)立測試樣本,自相關(guān)函數(shù)特征提取法的分類總精度比氨基酸組成成分特征提取法,大約可提高7個(gè)百分點(diǎn);“改進(jìn)的唯一的一對(duì)多”分類策略優(yōu)于“一對(duì)多”策略,其獨(dú)立測試和5CV檢驗(yàn)的分類總精度,比“一對(duì)多”策略最大可分別提高約18和12個(gè)百分點(diǎn)。 4.引入加權(quán)思想,以一種新的特征提取法—加權(quán)自相關(guān)函數(shù),表示蛋白質(zhì)序列,并采用“一對(duì)多”、“一對(duì)一”分類策略對(duì)膜蛋白和亞細(xì)胞定位進(jìn)行了分類和預(yù)測研究,結(jié)果有明顯改善: 1).對(duì)于膜蛋白分類,在采用支持向量機(jī)算法及“一對(duì)多”分類策略下,加權(quán)自相關(guān)函數(shù)特征提取法的分類總精度為87.98%,比氨基酸組成成分特征提取
【學(xué)位單位】:西北工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2004
【中圖分類】:Q51
【部分圖文】:
三級(jí)結(jié)構(gòu)的概念【川,才使得蛋白質(zhì)結(jié)構(gòu)的研究有了質(zhì)的飛躍。后來隨著越來越多的蛋白質(zhì)結(jié)構(gòu)被測定,又提出了四級(jí)結(jié)構(gòu)、超二級(jí)結(jié)構(gòu)和結(jié)構(gòu)域等概念[’2一,3]。圖1.1為蛋白質(zhì)四個(gè)層次結(jié)構(gòu)示意圖,圖1.2以樹狀表示了蛋白質(zhì)的結(jié)構(gòu)層次及其關(guān)系。圖1.2蛋自質(zhì)結(jié)構(gòu)層次關(guān)系示意圖
【引證文獻(xiàn)】
相關(guān)期刊論文 前1條
1 張振慧;王正華;王勇獻(xiàn);;基于分組重量編碼的蛋白質(zhì)同源寡聚體分類研究[J];國防科技大學(xué)學(xué)報(bào);2007年02期
相關(guān)博士學(xué)位論文 前5條
1 李宏;面向應(yīng)用領(lǐng)域的分類方法研究[D];中南大學(xué);2007年
2 施建宇;蛋白質(zhì)亞細(xì)胞定位特征表達(dá)與分類算法研究[D];西北工業(yè)大學(xué);2006年
3 李鳳敏;核蛋白的亞核定位和植物、非植物及小鼠蛋白質(zhì)的亞細(xì)胞定位預(yù)測研究[D];內(nèi)蒙古大學(xué);2007年
4 胡秀珍;蛋白質(zhì)的β-發(fā)夾、β(γ)-轉(zhuǎn)角及四類簡單超二級(jí)結(jié)構(gòu)預(yù)測[D];內(nèi)蒙古大學(xué);2007年
5 劉輝;miRNA靶標(biāo)預(yù)測的系統(tǒng)生物學(xué)方法研究[D];中國礦業(yè)大學(xué);2009年
相關(guān)碩士學(xué)位論文 前6條
1 安文娟;Fisher和支持向量綜合分類器[D];遼寧師范大學(xué);2010年
2 曾聰;膜蛋白分類的特征提取算法和數(shù)據(jù)集構(gòu)建技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
3 曲娟;同源寡聚蛋白質(zhì)的信息熵分類方法[D];大連理工大學(xué);2006年
4 姜彬;膜蛋白分類問題的特征提取算法研究[D];國防科學(xué)技術(shù)大學(xué);2008年
5 溫歡;抗凍蛋白序列的模體分析與預(yù)測[D];內(nèi)蒙古大學(xué);2013年
6 紅英;用支持向量機(jī)和離散增量方法預(yù)測人類血液分泌蛋白質(zhì)[D];內(nèi)蒙古大學(xué);2013年
本文編號(hào):
2808814
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/2808814.html