細菌必需基因自訓(xùn)練算法的研究及實現(xiàn)
發(fā)布時間:2017-09-04 23:05
本文關(guān)鍵詞:細菌必需基因自訓(xùn)練算法的研究及實現(xiàn)
更多相關(guān)文章: 細菌 必需基因 蛋白質(zhì)結(jié)構(gòu)域
【摘要】:必需基因是生物體中非常重要的一類基因,如果缺少這種基因,生物將無法存活。對于必需基因的確認,現(xiàn)在主要有兩種方法,一種就是使用實驗方法進行確認,但是這種方法耗時長,并且消耗巨大,由于實驗方法的缺陷與局限性,至今也只有很少的細菌必需基因被大規(guī)模實驗確定;另一種方法是利用計算機進行必需基因預(yù)測,這種方法解決了實驗方法的缺陷,現(xiàn)今的預(yù)測方法大部分使用的是整合方法,但是這種方法非常依賴實驗數(shù)據(jù),在缺乏實驗數(shù)據(jù)的時候很難對細菌必需基因進行預(yù)測。為了擺脫實驗數(shù)據(jù)的限制,我們決定開發(fā)基于基因本身特征的必需基因預(yù)測算法。首先我們選擇了蛋白質(zhì)結(jié)構(gòu)域作為預(yù)測必需基因的特征,通過實驗驗證,我們發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)域在必需基因的預(yù)測中起到了非常大的作用。之后,我們選擇了25個物種作為實驗物種,通過物種間的親緣距離將不同物種間的結(jié)構(gòu)域聯(lián)系起來,設(shè)計了基于蛋白質(zhì)結(jié)構(gòu)域的必需基因預(yù)測算法。通過對25個實驗物種進行多重交叉檢驗并計算結(jié)果AUC值,最終結(jié)果有5個物種超過了0.9;而在0.75到0.9之間的物種,也有14個;低于0.75的物種只有6個,最低的也有0.66,說明了我們的這種算法效果非常的好。然后,對于同樣基于基因序列特征的必需基因預(yù)測工具Geptop,我們對其進行了改進。改進的地方如下:(1)對參考集由最初的19個物種擴充到25個;(2)對不易讓人理解的評分公式進行了簡化,使之簡單易懂同時不降低必需基因預(yù)測準確度;(3)對預(yù)測程序進行了優(yōu)化,使之效率提升。通過這三面的改進過后,Geptop的預(yù)測準確度得到了一定的提升,通過和之前的版本進行比較,19個物種中,有12個物種的結(jié)果均有所提高。同時,以大腸桿菌為例,程序的運行速度從107分鐘縮減到了26分鐘,效率提高了接近4倍。最后,我們嘗試將基于蛋白質(zhì)結(jié)構(gòu)域的必需基因預(yù)測方法和Geptop結(jié)合起來,期望得到更好的預(yù)測結(jié)果。由于時間關(guān)系,我們沒能找到提高預(yù)測結(jié)果的結(jié)合方式,但是我們已探索的結(jié)合方式也能給繼續(xù)研究這方面的學(xué)者提供經(jīng)驗。
【關(guān)鍵詞】:細菌 必需基因 蛋白質(zhì)結(jié)構(gòu)域
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:Q811.4
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-14
- 1.1 研究背景10
- 1.2 必需基因的識別10-12
- 1.3 本論文的結(jié)構(gòu)安排12-14
- 第二章 基于蛋白質(zhì)結(jié)構(gòu)域的必需基因預(yù)測算法14-25
- 2.1 引言14
- 2.2 蛋白質(zhì)結(jié)構(gòu)域知識14-15
- 2.3 基于蛋白質(zhì)結(jié)構(gòu)域的必需基因預(yù)測算法15-20
- 2.3.1 實驗數(shù)據(jù)的選擇16-17
- 2.3.2 實驗方法17-18
- 2.3.3 實驗結(jié)果及分析18-20
- 2.4 基于物種親緣性及蛋白質(zhì)結(jié)構(gòu)域的必需基因預(yù)測算法20-25
- 2.4.1 Cvtree理論21
- 2.4.2 算法的實現(xiàn)21-23
- 2.4.3 實驗結(jié)果23-25
- 第三章 對Geptop軟件的改進25-38
- 3.1 引言25
- 3.2 Geptop的改進25-34
- 3.2.1 參考集的篩選26-30
- 3.2.2 評分公式的改進30-31
- 3.2.3 對程序運行效率的改進31-34
- 3.3 閾值的選擇34-37
- 3.4 小結(jié)37-38
- 第四章 Geptop與蛋白質(zhì)結(jié)構(gòu)域的結(jié)合預(yù)測方法38-48
- 4.1 引言38
- 4.2 Geptop與蛋白質(zhì)結(jié)構(gòu)域結(jié)合預(yù)測算法38-47
- 4.2.1 參考集的選擇38
- 4.2.2 結(jié)合方法38-47
- 4.3 小結(jié)47-48
- 第五章 全文總結(jié)及展望48-50
- 致謝50-51
- 參考文獻51-55
- 攻讀碩士學(xué)位期間取得的成果55-56
本文編號:794366
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/794366.html
最近更新
教材專著