天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 基因論文 >

細(xì)菌蛋白質(zhì)編碼基因識(shí)別系統(tǒng)的研究

發(fā)布時(shí)間:2020-03-20 05:47
【摘要】:基因識(shí)別是對(duì)DNA序列進(jìn)行分析,獲取其中重要信息的第一步。目前測(cè)序技術(shù)的發(fā)展使得測(cè)序數(shù)據(jù)呈爆發(fā)式增漲,然而實(shí)驗(yàn)方法無(wú)法快速有效的從海量信息中獲取知識(shí),基于此運(yùn)用計(jì)算機(jī)技術(shù)來(lái)識(shí)別基因的方法應(yīng)運(yùn)而生。在2015年,我們課題組研發(fā)了原核生物基因識(shí)別程序ZCURVE3.0,該算法是基于Z曲線理論,采用新的機(jī)器學(xué)習(xí)算法SVM,增加新的特征變量,并且對(duì)內(nèi)部參數(shù)進(jìn)行進(jìn)一步的優(yōu)化,使得該識(shí)別算法更加快速準(zhǔn)確高效。在預(yù)測(cè)出基因后,還需要知道其相應(yīng)編碼的蛋白質(zhì),于是我們基于ZCURVE3.0算法,對(duì)其進(jìn)行進(jìn)一步的升級(jí),添加相關(guān)的功能,使得其成為完善的可視化集成系統(tǒng)。在本基因識(shí)別可視化系統(tǒng)中,第一部分是對(duì)ZCUREV3.0的功能進(jìn)行可視化(BAGA)實(shí)現(xiàn),其保留了相應(yīng)識(shí)別算法的所有功能。在通過(guò)對(duì)50個(gè)原核生物的全基因組進(jìn)行測(cè)試,選取比對(duì)閾值,排除偽基因,同時(shí)使得刪除的正確基因數(shù)盡可能少,那樣基本保持正確的基因數(shù)不變。在與GenBank提供的總的基因數(shù)相比,BAGA的預(yù)測(cè)基因識(shí)別率為97.60%,預(yù)測(cè)結(jié)果的特異度為96.74%,與ZCURVE3.0的特異度94.21%相比有2%的提升。BAGA附加預(yù)測(cè)率為3.34%,比ZCURVE3.0(6.08%)下降接近3%。附加預(yù)測(cè)率的降低,表明其預(yù)測(cè)錯(cuò)誤的基因數(shù)目相比ZCURVE3.0有更進(jìn)一步的減少。第二部分是對(duì)于ZCURVE3.0和Prodigal兩個(gè)基因預(yù)測(cè)軟件聯(lián)合方法(BAGA2.0)的實(shí)現(xiàn),通過(guò)保留兩者預(yù)測(cè)相同的基因,對(duì)不同的基因進(jìn)行序列比對(duì),調(diào)節(jié)合適的參數(shù),保留比對(duì)得分較高的基因,將這兩部分的基因作為最終聯(lián)合預(yù)測(cè)的基因。BAGA2.0對(duì)應(yīng)的識(shí)別率為98.73%,特異度為96.09%。這兩者性能,都比ZCURVE3.0效果要好。另一方面,BAGA2.0的附加預(yù)測(cè)率為4.08%比ZCURVE3.0(6.08%)要低。綜合來(lái)看,聯(lián)合兩者來(lái)識(shí)別細(xì)菌的基因性能要更優(yōu)。此外,雖然BAGA2.0的特異度比BAGA要低,其附加預(yù)測(cè)率要大,但是其識(shí)別率和準(zhǔn)確度卻更佳。在本文中采用BLAST序列比對(duì)實(shí)現(xiàn)了對(duì)于預(yù)測(cè)的基因進(jìn)行功能注釋,對(duì)于系統(tǒng)中實(shí)現(xiàn)的兩部分的預(yù)測(cè)結(jié)果都能夠?qū)崿F(xiàn)注釋,而且能夠選擇快速注釋和完全注釋兩者不同方式。同時(shí),集成基因組島預(yù)測(cè)程序。我們將此完善的集成軟件編譯成各種不同系統(tǒng)的版本,使用者能夠訪問(wèn)http://cefg.cn/zcurve-visualization/下載,并免費(fèi)使用。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q78

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳建明;人的基因數(shù)到底是多少?[J];生命的化學(xué);2000年05期

2 周海廷;基因識(shí)別計(jì)算方法的回顧與展望[J];綿陽(yáng)經(jīng)濟(jì)技術(shù)高等?茖W(xué)校學(xué)報(bào);2002年04期

3 曹勝玉;劉來(lái)福;;隱馬模型及其在基因識(shí)別中的應(yīng)用[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2006年09期

4 徐婭;葛成偉;趙禮翔;饒鳳;程浩;;雙特征參數(shù)基因識(shí)別算法實(shí)現(xiàn)[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2013年14期

5 范宗理;;人類基因數(shù)為何如此少?[J];自然雜志;2006年01期

6 吳佳楠;周春光;夏雪飛;劉桂霞;沈薇;周柚;;基于簡(jiǎn)單統(tǒng)計(jì)排名模型的差異表達(dá)基因識(shí)別[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2013年04期

7 吳佳楠;周春光;劉桂霞;沈薇;鄭明;周柚;;基于元分析的差異表達(dá)基因識(shí)別[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2012年05期

8 楊東;張洋;宋陽(yáng);;基因識(shí)別問(wèn)題及其算法實(shí)現(xiàn)[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2013年14期

9 石磊;人類的基因數(shù)為何如此之少?[J];世界科學(xué);2005年09期

10 古毅偉;王松;張旭;張茹;劉建毅;仝輝;;基因識(shí)別及其算法研究[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2013年14期

相關(guān)會(huì)議論文 前1條

1 王婷;明媚;萬(wàn)芷君;閻宗帥;;基因識(shí)別中的閾值確定算法[A];廣西計(jì)算機(jī)學(xué)會(huì)2012年學(xué)術(shù)年會(huì)論文集[C];2012年

相關(guān)重要報(bào)紙文章 前2條

1 李訊;細(xì)菌蛋白質(zhì)有保護(hù)消化道作用[N];中國(guó)醫(yī)藥報(bào);2008年

2 劉霞;美成功干預(yù)細(xì)菌蛋白質(zhì)制造過(guò)程[N];科技日?qǐng)?bào);2011年

相關(guān)博士學(xué)位論文 前2條

1 周柚;基因識(shí)別和微陣列數(shù)據(jù)識(shí)別算法研究[D];吉林大學(xué);2008年

2 邢鋒;秈稻珍汕97和明恢63基因組的注釋和比較分析[D];華中農(nóng)業(yè)大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 袁亞洲;細(xì)菌蛋白質(zhì)編碼基因識(shí)別系統(tǒng)的研究[D];電子科技大學(xué);2017年

2 KALYKOVA NURGUL;對(duì)外漢語(yǔ)初級(jí)教材俄文注釋研究[D];上海外國(guó)語(yǔ)大學(xué);2017年

3 張倩;高中語(yǔ)文教科書(shū)現(xiàn)代文注釋問(wèn)題研究[D];上海師范大學(xué);2017年

4 王璐;基于統(tǒng)計(jì)的基因識(shí)別問(wèn)題及其算法研究[D];西安建筑科技大學(xué);2014年

5 趙吉云;語(yǔ)境視角下的對(duì)外漢語(yǔ)教材注釋設(shè)置研究[D];廣西大學(xué);2017年

6 張怡蕾;人教版高中語(yǔ)文文言文篇目注釋研究[D];寧夏大學(xué);2017年

7 何海峰;基于新型特征的基因識(shí)別方法研究[D];湖南大學(xué);2011年

8 房穎;基于統(tǒng)計(jì)的基因識(shí)別算法研究[D];吉林大學(xué);2007年

9 陳愛(ài)明;基于頻譜分析的基因識(shí)別算法研究[D];華南理工大學(xué);2014年

10 郭睿;基于序列統(tǒng)計(jì)特征的基因識(shí)別算法研究[D];哈爾濱工業(yè)大學(xué);2017年

,

本文編號(hào):2591346

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2591346.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶123dd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com