天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 理工論文 > 生物學(xué)論文 >

基于序列的細(xì)菌終止子識(shí)別

發(fā)布時(shí)間:2020-11-18 08:42
   轉(zhuǎn)錄終止是基因表達(dá)的重要調(diào)節(jié)步驟,而轉(zhuǎn)錄的結(jié)束由終止子決定。如果基因中沒(méi)有終止子,則轉(zhuǎn)錄不能停止,從而導(dǎo)致基因表達(dá)異常。檢測(cè)細(xì)菌中的終止子不僅可以確定細(xì)菌生物中的操縱子結(jié)構(gòu),還可以改善基因組的注釋。因此,準(zhǔn)確識(shí)別轉(zhuǎn)錄終止子對(duì)于轉(zhuǎn)錄調(diào)控的研究來(lái)說(shuō)是非常重要的。雖然生物化學(xué)實(shí)驗(yàn)方法可以清楚準(zhǔn)確地識(shí)別終止子序列,但是非常耗時(shí)且昂貴。為提高效率,人們已提出一些計(jì)算方法。這些方法主要分為兩類(lèi):(1)使用核酸組成信息來(lái)描述終止子。(2)將發(fā)夾結(jié)構(gòu)特征以及下游的T富含區(qū)域作為特征用于描述終止子。由于這些方法不能反映終止子的統(tǒng)計(jì)特征,所以本文提出了基于序列信息,用機(jī)器學(xué)習(xí)的方法來(lái)識(shí)別細(xì)菌終止子。本文基于低冗余性基準(zhǔn)數(shù)據(jù)集構(gòu)建了用于識(shí)別細(xì)菌轉(zhuǎn)錄終止子的“iTerm-PseKNC”模型和“DeepTerm”模型。(1)“iTerm-PseKNC”是基于支持向量機(jī)(SVM)開(kāi)發(fā)的終止子預(yù)測(cè)模型,該模型使用二項(xiàng)分布特征篩選技術(shù)得到偽K-元組核苷酸組成(PseKNC)的最佳特征子集,利用五重交叉檢驗(yàn)來(lái)測(cè)試模型的預(yù)測(cè)性能,結(jié)果顯示,該模型的預(yù)測(cè)精度達(dá)到了95%的準(zhǔn)確率。(2)“DeepTerm”是一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的終止子預(yù)測(cè)模型。該模型使用One-Hot編碼作為輸入特征,五重交叉驗(yàn)證測(cè)試結(jié)果顯示“DeepTerm”能夠獲得99.40%的準(zhǔn)確度。為了進(jìn)一步評(píng)估“iTerm-PseKNC”模型和“DeepTerm”模型的泛化能力,本文構(gòu)建了兩個(gè)獨(dú)立測(cè)試集,分別是經(jīng)實(shí)驗(yàn)驗(yàn)證了的大腸桿菌和枯草芽孢桿菌Rho非依賴終止子序列。結(jié)果表明“iTerm-PseKNC”模型和“DeepTerm”模型都可以識(shí)別大腸桿菌獨(dú)立測(cè)試集中的所有終止子序列,在枯草芽孢桿菌獨(dú)立測(cè)試集上的測(cè)試精度分別為87.5%和99.24%。本文基于“iTerm-PseKNC”模型建立了的服務(wù)網(wǎng)站http://lin-group.cn/server/iTerm-PseKNC/,實(shí)驗(yàn)人員不需要做復(fù)雜的計(jì)算,可以直接使用該網(wǎng)站很輕松的預(yù)測(cè)序列是否為終止子。
【學(xué)位單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:Q78;TP18
【部分圖文】:

示意圖,細(xì)菌,終止子,示意圖


第一章 緒論第一章 緒論1.1 細(xì)菌終止子簡(jiǎn)介在細(xì)菌中,當(dāng) RNA 聚合酶與啟動(dòng)子結(jié)合時(shí),從 DNA 到 RNA 的轉(zhuǎn)錄開(kāi)始并持續(xù)直到 RNA 聚合酶遇到轉(zhuǎn)錄終止子。所有 RNA 聚合酶必須終止,解離并在終止子處釋放產(chǎn)物 RNA。所以如果基因中沒(méi)有終止子,則轉(zhuǎn)錄不會(huì)停止,從而導(dǎo)致基因表達(dá)異常,因此,終止子是極其重要的 DNA 調(diào)節(jié)元件。在細(xì)菌中主要有兩類(lèi)終止子:Rho 獨(dú)立終止子(也稱為因子非依賴性或內(nèi)在終止子)和 Rho 依賴性終止子(也稱為因子依賴性終止子),如圖 1-1 所示。非 Rho依賴終止子由于包含對(duì)稱的 GC 子序列從而形成了莖環(huán),而 Rho 依賴性終止子不包含莖環(huán)。前者僅需要 DNA 模板和 RNA 聚合酶即可實(shí)現(xiàn)轉(zhuǎn)錄終止功能,但后者還需要其他元素如 Rho 蛋白來(lái)實(shí)現(xiàn)功能。

示意圖,堿基對(duì),二聯(lián)體,核苷酸序列


圖2-1(a)表示的是長(zhǎng)度為 L 的 DNA/RNA 序列最臨近的二聯(lián)體堿基對(duì)(n=2)之間反映出來(lái)的序列結(jié)構(gòu)相關(guān)因子的第一層關(guān)系,同理,圖 2-1(b)和圖 2-1(c)分別表示的是第二臨近和第三臨近堿基對(duì)之間反映出來(lái)的序列結(jié)構(gòu)相關(guān)因子的第二層和第三層關(guān)系,以此類(lèi)推可以計(jì)算得到 。圖 2-1 提取核苷酸序列二聯(lián)體堿基對(duì)長(zhǎng)程信息相關(guān)示意圖在本文使用了六種 DNA 的結(jié)構(gòu)屬性,分別是上下、左右、前后、先后卷動(dòng)、左右傾斜、旋轉(zhuǎn)扭曲,對(duì)應(yīng)的堿基對(duì)空間位置如圖 2-2 所示。對(duì)應(yīng)的堿基對(duì)結(jié)構(gòu)屬性值[39]還需要通過(guò)以下公式(2-7)進(jìn)行標(biāo)準(zhǔn)變換,其中 符號(hào)表示在 A、T、C、G 的 16 種不同組合中取對(duì)應(yīng)數(shù)量的平均值,而 SD 表示相應(yīng)的標(biāo)準(zhǔn)偏差。 ( ) = 0( 1) 0( 1) 0( 1) (2-7)

序列,堿基對(duì),特征向量,序列信息


圖 2-2 堿基對(duì)空間位置關(guān)系征篩選公式(2-3)可知,特征向量的維數(shù)主要由 k 值決定,k 值越大,可序列信息。易知 4643= , 410245= , 4104857610= ,即隨著 k 值征向量維數(shù)呈指數(shù)增加,這不僅會(huì)給計(jì)算機(jī)造成很大的計(jì)算壓力,所謂的“高維災(zāi)難”。并且基于高維度特征向量表示的序列訓(xùn)練得可能不適用于其他的數(shù)據(jù),對(duì)于其他相異性較大的樣本不能做出很模型過(guò)擬合的現(xiàn)象。但是如果 k 值過(guò)小,特征向量包含的序列信息全面的表征 DNA 序列,得到的模型會(huì)處于欠擬合狀態(tài),即模型在訓(xùn)有良好的性能,便更不能對(duì)其他數(shù)據(jù)進(jìn)行預(yù)測(cè)。為解決這一問(wèn)題,式是當(dāng)特征向量維度很大時(shí),對(duì)特征進(jìn)行篩選,留下正相關(guān)特征,冗余的特征,從而減輕計(jì)算機(jī)的計(jì)算壓力,減少訓(xùn)練時(shí)間,并且還性能,提高模型的偏差容差[39]。
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陸軍,趙雯;T_(32)終止子在棒狀桿菌基因表達(dá)中的功能[J];常熟高專(zhuān)學(xué)報(bào);1999年04期

2 ;HBV S基因終止子突變導(dǎo)致HBsAg檢測(cè)陰性[J];中西醫(yī)結(jié)合肝病雜志;2002年01期

3 宋君;常麗娟;張富麗;王東;李潔;;采用蒙特卡洛法評(píng)定轉(zhuǎn)基因水稻樣品中NOS終止子的測(cè)量不確定度[J];計(jì)量學(xué)報(bào);2019年01期

4 李文靜;馮雪;孫艷香;;水稻GluB-4終止子的克隆與功能分析[J];植物生理學(xué)報(bào);2018年10期

5 張嵩元;邱建輝;王宣;董一名;李昱龍;張益豪;歐陽(yáng)頎;;基于重組酶和終止子的狀態(tài)調(diào)控開(kāi)關(guān)設(shè)計(jì)[J];生物工程學(xué)報(bào);2018年12期

6 王東;宋君;葉先林;雷紹榮;劉文娟;常麗娟;尹全;張富麗;;轉(zhuǎn)基因大豆外源基因NOS終止子定量測(cè)定的不確定度分析[J];大豆科學(xué);2013年05期

7 鄧子新,Tobias Kieser,David A.Hopwood;鏈霉菌高拷貝質(zhì)粒pIJ101 DNA的研究 Ⅱ.在大腸桿菌中具有終止子活性片段的克隆和分析[J];華中農(nóng)業(yè)大學(xué)學(xué)報(bào);1990年02期

8 賈建軍,周曉黎,董俊,花群義,李文貴,周力兵,徐自忠;轉(zhuǎn)基因煙草檢測(cè)技術(shù)研究[J];生物技術(shù)通訊;2002年04期

9 王東;宋君;雍彬;葉先林;常麗娟;尹全;張富麗;劉文娟;雷紹榮;;轉(zhuǎn)基因水稻外源基因NOS終止子定量測(cè)定的不確定度分析[J];江西農(nóng)業(yè)學(xué)報(bào);2013年10期

10 蘇軍;管其龍;陳子強(qiáng);陳在杰;;水稻arf1基因3′-UTR片段的克隆和驗(yàn)證[J];應(yīng)用與環(huán)境生物學(xué)報(bào);2019年02期


相關(guān)碩士學(xué)位論文 前7條

1 馮朝琴;基于序列的細(xì)菌終止子識(shí)別[D];電子科技大學(xué);2019年

2 王召霞;釀酒酵母終止子的人工設(shè)計(jì)及在途徑優(yōu)化中的應(yīng)用[D];石河子大學(xué);2019年

3 李陳孟;T7轉(zhuǎn)錄篩選器的構(gòu)建及應(yīng)用[D];北京化工大學(xué);2018年

4 魏琳娜;釀酒酵母終止子的表征及在番茄紅素合成途徑中的應(yīng)用[D];石河子大學(xué);2018年

5 謝程程;玉米α-淀粉酶基因花粉特異表達(dá)載體構(gòu)建及愈傷組織的遺傳轉(zhuǎn)化[D];四川農(nóng)業(yè)大學(xué);2014年

6 蔡翠雅;煙草安全抗青枯病基因工程研究[D];福建農(nóng)林大學(xué);2014年

7 王林;飼料生產(chǎn)工藝對(duì)轉(zhuǎn)基因豆粕的影響[D];河南科技大學(xué);2011年



本文編號(hào):2888536

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2888536.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b0785***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
插进她的身体里在线观看骚| 国产又猛又黄又粗又爽无遮挡 | 久久精品国产第一区二区三区| 欧美日韩综合综合久久久| 91人人妻人人爽人人狠狠| 久草视频这里只是精品| 美女露小粉嫩91精品久久久| 91精品国自产拍老熟女露脸| av免费视屏在线观看| 欧美做爰猛烈叫床大尺度| 欧美久久一区二区精品| 国产成人精品午夜福利av免费| 男人操女人下面国产剧情| 中文字幕亚洲人妻在线视频| 日本三区不卡高清更新二区| 国产欧美高清精品一区| 青青免费操手机在线视频| 深夜视频在线观看免费你懂 | 国产午夜福利一区二区| 日韩免费av一区二区三区| 东北女人的逼操的舒服吗| 99免费人成看国产片| 欧美日韩三区在线观看| 美女黄色三级深夜福利| 五月的丁香婷婷综合网| 最好看的人妻中文字幕| 自拍偷拍福利视频在线观看| 久久91精品国产亚洲| 日韩精品少妇人妻一区二区| 欧美日韩欧美国产另类| 老鸭窝老鸭窝一区二区| 日韩中文高清在线专区| 91香蕉视频精品在线看| 夫妻性生活一级黄色录像| 国产乱淫av一区二区三区| 国产日本欧美韩国在线| 91偷拍裸体一区二区三区| 1024你懂的在线视频| 国产日韩中文视频一区| 国产日韩欧美专区一区| 国产对白老熟女正在播放|