天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 基因論文 >

細菌蛋白質(zhì)編碼基因識別系統(tǒng)的研究

發(fā)布時間:2020-03-20 05:47
【摘要】:基因識別是對DNA序列進行分析,獲取其中重要信息的第一步。目前測序技術(shù)的發(fā)展使得測序數(shù)據(jù)呈爆發(fā)式增漲,然而實驗方法無法快速有效的從海量信息中獲取知識,基于此運用計算機技術(shù)來識別基因的方法應(yīng)運而生。在2015年,我們課題組研發(fā)了原核生物基因識別程序ZCURVE3.0,該算法是基于Z曲線理論,采用新的機器學(xué)習(xí)算法SVM,增加新的特征變量,并且對內(nèi)部參數(shù)進行進一步的優(yōu)化,使得該識別算法更加快速準(zhǔn)確高效。在預(yù)測出基因后,還需要知道其相應(yīng)編碼的蛋白質(zhì),于是我們基于ZCURVE3.0算法,對其進行進一步的升級,添加相關(guān)的功能,使得其成為完善的可視化集成系統(tǒng)。在本基因識別可視化系統(tǒng)中,第一部分是對ZCUREV3.0的功能進行可視化(BAGA)實現(xiàn),其保留了相應(yīng)識別算法的所有功能。在通過對50個原核生物的全基因組進行測試,選取比對閾值,排除偽基因,同時使得刪除的正確基因數(shù)盡可能少,那樣基本保持正確的基因數(shù)不變。在與GenBank提供的總的基因數(shù)相比,BAGA的預(yù)測基因識別率為97.60%,預(yù)測結(jié)果的特異度為96.74%,與ZCURVE3.0的特異度94.21%相比有2%的提升。BAGA附加預(yù)測率為3.34%,比ZCURVE3.0(6.08%)下降接近3%。附加預(yù)測率的降低,表明其預(yù)測錯誤的基因數(shù)目相比ZCURVE3.0有更進一步的減少。第二部分是對于ZCURVE3.0和Prodigal兩個基因預(yù)測軟件聯(lián)合方法(BAGA2.0)的實現(xiàn),通過保留兩者預(yù)測相同的基因,對不同的基因進行序列比對,調(diào)節(jié)合適的參數(shù),保留比對得分較高的基因,將這兩部分的基因作為最終聯(lián)合預(yù)測的基因。BAGA2.0對應(yīng)的識別率為98.73%,特異度為96.09%。這兩者性能,都比ZCURVE3.0效果要好。另一方面,BAGA2.0的附加預(yù)測率為4.08%比ZCURVE3.0(6.08%)要低。綜合來看,聯(lián)合兩者來識別細菌的基因性能要更優(yōu)。此外,雖然BAGA2.0的特異度比BAGA要低,其附加預(yù)測率要大,但是其識別率和準(zhǔn)確度卻更佳。在本文中采用BLAST序列比對實現(xiàn)了對于預(yù)測的基因進行功能注釋,對于系統(tǒng)中實現(xiàn)的兩部分的預(yù)測結(jié)果都能夠?qū)崿F(xiàn)注釋,而且能夠選擇快速注釋和完全注釋兩者不同方式。同時,集成基因組島預(yù)測程序。我們將此完善的集成軟件編譯成各種不同系統(tǒng)的版本,使用者能夠訪問http://cefg.cn/zcurve-visualization/下載,并免費使用。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:Q78

【相似文獻】

相關(guān)期刊論文 前10條

1 陳建明;人的基因數(shù)到底是多少?[J];生命的化學(xué);2000年05期

2 周海廷;基因識別計算方法的回顧與展望[J];綿陽經(jīng)濟技術(shù)高等?茖W(xué)校學(xué)報;2002年04期

3 曹勝玉;劉來福;;隱馬模型及其在基因識別中的應(yīng)用[J];數(shù)學(xué)的實踐與認識;2006年09期

4 徐婭;葛成偉;趙禮翔;饒鳳;程浩;;雙特征參數(shù)基因識別算法實現(xiàn)[J];數(shù)學(xué)的實踐與認識;2013年14期

5 范宗理;;人類基因數(shù)為何如此少?[J];自然雜志;2006年01期

6 吳佳楠;周春光;夏雪飛;劉桂霞;沈薇;周柚;;基于簡單統(tǒng)計排名模型的差異表達基因識別[J];吉林大學(xué)學(xué)報(工學(xué)版);2013年04期

7 吳佳楠;周春光;劉桂霞;沈薇;鄭明;周柚;;基于元分析的差異表達基因識別[J];吉林大學(xué)學(xué)報(工學(xué)版);2012年05期

8 楊東;張洋;宋陽;;基因識別問題及其算法實現(xiàn)[J];數(shù)學(xué)的實踐與認識;2013年14期

9 石磊;人類的基因數(shù)為何如此之少?[J];世界科學(xué);2005年09期

10 古毅偉;王松;張旭;張茹;劉建毅;仝輝;;基因識別及其算法研究[J];數(shù)學(xué)的實踐與認識;2013年14期

相關(guān)會議論文 前1條

1 王婷;明媚;萬芷君;閻宗帥;;基因識別中的閾值確定算法[A];廣西計算機學(xué)會2012年學(xué)術(shù)年會論文集[C];2012年

相關(guān)重要報紙文章 前2條

1 李訊;細菌蛋白質(zhì)有保護消化道作用[N];中國醫(yī)藥報;2008年

2 劉霞;美成功干預(yù)細菌蛋白質(zhì)制造過程[N];科技日報;2011年

相關(guān)博士學(xué)位論文 前2條

1 周柚;基因識別和微陣列數(shù)據(jù)識別算法研究[D];吉林大學(xué);2008年

2 邢鋒;秈稻珍汕97和明恢63基因組的注釋和比較分析[D];華中農(nóng)業(yè)大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 袁亞洲;細菌蛋白質(zhì)編碼基因識別系統(tǒng)的研究[D];電子科技大學(xué);2017年

2 KALYKOVA NURGUL;對外漢語初級教材俄文注釋研究[D];上海外國語大學(xué);2017年

3 張倩;高中語文教科書現(xiàn)代文注釋問題研究[D];上海師范大學(xué);2017年

4 王璐;基于統(tǒng)計的基因識別問題及其算法研究[D];西安建筑科技大學(xué);2014年

5 趙吉云;語境視角下的對外漢語教材注釋設(shè)置研究[D];廣西大學(xué);2017年

6 張怡蕾;人教版高中語文文言文篇目注釋研究[D];寧夏大學(xué);2017年

7 何海峰;基于新型特征的基因識別方法研究[D];湖南大學(xué);2011年

8 房穎;基于統(tǒng)計的基因識別算法研究[D];吉林大學(xué);2007年

9 陳愛明;基于頻譜分析的基因識別算法研究[D];華南理工大學(xué);2014年

10 郭睿;基于序列統(tǒng)計特征的基因識別算法研究[D];哈爾濱工業(yè)大學(xué);2017年

,

本文編號:2591346

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2591346.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶123dd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com