天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于信息通道模型的轉(zhuǎn)錄組重建與分析關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2017-12-28 05:42

  本文關(guān)鍵詞:基于信息通道模型的轉(zhuǎn)錄組重建與分析關(guān)鍵技術(shù)研究 出處:《清華大學(xué)》2015年碩士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 剪接異構(gòu)體識別 轉(zhuǎn)錄豐度估計(jì) 信息傳導(dǎo)量 自動(dòng)組裝 轉(zhuǎn)錄組分析軟件


【摘要】:基于高通量RNA測序(RNA-Seq)數(shù)據(jù)的自動(dòng)的剪接異構(gòu)體識別和轉(zhuǎn)錄豐度估計(jì)是有關(guān)下一代測序技術(shù)的研究中的重要課題。這兩項(xiàng)任務(wù)有助于人們分析物種基因組和轉(zhuǎn)錄組的全貌,在基因差異表達(dá)分析、基因調(diào)控機(jī)制研究等方面有重要應(yīng)用。然而,目前兩項(xiàng)任務(wù)仍然存在較大挑戰(zhàn)。RNA-Seq技術(shù)僅對轉(zhuǎn)錄組進(jìn)行部分測序,存在難以預(yù)測的信息損失。使用局部的觀測值進(jìn)行全轉(zhuǎn)錄組的重建具有高度的不確定性,F(xiàn)有的方法普遍面臨著重建準(zhǔn)確度低、依賴輔助標(biāo)注等問題。針對以上問題,本文結(jié)合RNA-Seq的技術(shù)特點(diǎn),將RNA-Seq建模為信息傳遞系統(tǒng),轉(zhuǎn)錄組和讀段分別建模為信號源與觀測信號,使用信息論的方法對系統(tǒng)中的不確定度進(jìn)行分析。提出基于信息通道的方法,通過優(yōu)化信息傳導(dǎo)量降低數(shù)據(jù)不確定度,進(jìn)行轉(zhuǎn)錄組的重建和分析。本文所提出方法的主要內(nèi)容如下:首先進(jìn)行基因結(jié)構(gòu)單元的自動(dòng)組裝和剪接異構(gòu)體的重建。在無標(biāo)注模式下,自動(dòng)組裝工作包括:逐級地完成表達(dá)區(qū)域的粗略劃分,基因位點(diǎn)識別,亞外顯子識別結(jié)果的修正等環(huán)節(jié)。構(gòu)建有向圖進(jìn)行候選剪接異構(gòu)體的重建,利用圖的結(jié)構(gòu)特點(diǎn)計(jì)算不同性質(zhì)的路徑代價(jià),對路徑進(jìn)行有效篩選。其次,基于最大信息傳導(dǎo)量模型,進(jìn)行同時(shí)的剪接異構(gòu)體識別和轉(zhuǎn)錄豐度估計(jì)。本文將RNA-Seq的過程建模為信息傳遞通道,使用互信息度量測序讀段和可行的剪接異構(gòu)體之間的關(guān)聯(lián)度,并對信息通道容量進(jìn)行估計(jì)。我們對由于信息缺失和讀段歧義匹配造成的數(shù)據(jù)不確定度進(jìn)行直接的建模和控制,通過最大化信息傳導(dǎo)量,對信號源進(jìn)行恢復(fù)。實(shí)驗(yàn)結(jié)果證明本文所提出的方法對于識別復(fù)雜結(jié)構(gòu)的基因/剪接異構(gòu)體具有突出的效果。最后,我們將算法框架擴(kuò)展至給定基因標(biāo)注的情形,對于有標(biāo)注模式下的轉(zhuǎn)錄組重建進(jìn)行實(shí)現(xiàn)。同時(shí),基于綜合算法開發(fā)了用于轉(zhuǎn)錄組分析的軟件。在給定標(biāo)注的條件下,我們將基因/剪接異構(gòu)體自動(dòng)組裝的結(jié)果與現(xiàn)有標(biāo)注進(jìn)行比對和融合,進(jìn)而識別新的基因位點(diǎn)和可變剪接結(jié)構(gòu)。軟件可用于無標(biāo)注模式和有標(biāo)注模式,適合不同的應(yīng)用。
[Abstract]:Based on high-throughput RNA sequencing (RNA-Seq) data, automatic recognition of splicing isoforms and estimation of transcriptional abundance are important topics in the next generation sequencing technology research. These two tasks are helpful for us to analyze the panorama of species genome and transcriptome, and have important applications in gene differential expression analysis, gene regulation mechanism research and so on. However, there are still big challenges for the present two tasks. RNA-Seq technology only partially sequenced the transcriptional group, and there was an unpredictable loss of information. The reconstruction of the whole transcriptional group with a local observation value has a high degree of uncertainty. The existing methods are generally faced with the problems of low reconstruction accuracy and relying on auxiliary annotation. In view of the above problems, combined with the technical characteristics of RNA-Seq, RNA-Seq is modeled as an information transfer system, and transcripts and segments are modeled as signal sources and observation signals, respectively. The uncertainty of the system is analyzed by information theory. A method based on information channel is proposed to reconstruct and analyze the transcriptional group by optimizing the amount of information transmission to reduce the uncertainty of data. The main contents of the proposed method are as follows: first, the automatic assembly of the gene structural units and the reconstruction of the splicing isomers are carried out. In the annotation mode, the automatic assembly work includes: completing the rough division of expression area step by step, identifying gene loci, and modifying the result of sub exon recognition. The reconstruction of candidate splicing isomers is constructed with a directed graph, and the path costs of different properties are calculated by using the structure characteristics of the graph, and the path is screened effectively. Secondly, based on the maximum information conduction model, the simultaneous splicing isomer identification and the estimation of the transcriptional abundance are carried out. In this paper, the RNA-Seq process is modeled as an information transfer channel, and the mutual information is used to measure the correlation degree between the sequenced segments and the feasible splicing isomers, and the information channel capacity is estimated. We directly model and control the data uncertainty caused by information missing and segment ambiguity matching, and recover the signal source by maximizing information transmission. The experimental results show that the proposed method has a prominent effect on identifying the complex structure of the gene / splice isomer. Finally, we extend the algorithm framework to the case of a given gene tagging, and implement the reconstitution of the transcriptome in the labeled model. At the same time, the software for the analysis of the transcriptional group is developed based on the integrated algorithm. Under given labeling conditions, we compare and fuse the results of automatic assembly of gene / splice isoforms with existing annotations, and further identify new gene loci and alternative splicing structures. The software can be used for antagged mode and annotation mode, suitable for different applications.
【學(xué)位授予單位】:清華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:Q811.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前2條

1 王峰;黃璐圓;;人錳超氧化物歧化酶基因剪接異構(gòu)體的表達(dá)分析[J];生物技術(shù)通報(bào);2010年03期

2 ;[J];;年期

相關(guān)會議論文 前7條

1 任偉;陸超;張永梅;周國平;;兩種新的干擾素調(diào)節(jié)因子-3剪接異構(gòu)體的結(jié)構(gòu)及表達(dá)[A];中華醫(yī)學(xué)會第五次全國兒科中青年學(xué)術(shù)交流大會論文匯編(上冊)[C];2008年

2 柴祥;何濤;倪海波;殷文江;李亨;高殿帥;;GDNF剪接異構(gòu)體在小鼠中樞神經(jīng)系統(tǒng)中表達(dá)的研究[A];中國解剖學(xué)會2013年年會論文文摘匯編[C];2013年

3 金蕊;周國平;袁文霄;徐華國;任偉;莊麗麗;;哮喘相關(guān)基因ORMDL3新剪接異構(gòu)體的克隆鑒定[A];中華醫(yī)學(xué)會呼吸病學(xué)年會——2011(第十二次全國呼吸病學(xué)學(xué)術(shù)會議)論文匯編[C];2011年

4 富顯果;張朵;張曉;柯龍鳳;嚴(yán)愛貞;朱忠勇;蘭風(fēng)華;;脆性X智力障礙1基因新型可變剪接外顯子和剪接異構(gòu)體的鑒定[A];第八次全國醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)會議(中華醫(yī)學(xué)會2009年醫(yī)學(xué)遺傳學(xué)年會)論文摘要匯編[C];2009年

5 劉永;胡成鈺;;草魚ADAR1剪接異構(gòu)體基因的鑒定與組織表達(dá)分析[A];中國水產(chǎn)學(xué)會魚病專業(yè)委員會2013年學(xué)術(shù)研討會論文摘要匯編[C];2013年

6 劉玉松;劉肖萍;張志遠(yuǎn);范旭;趙琳;張鳳華;徐紅運(yùn);段二珍;盧曉艷;夏平安;崔保安;;豬IgGIIB類Fc受體剪接異構(gòu)體的分子特征[A];中國畜牧獸醫(yī)學(xué)會動(dòng)物傳染病學(xué)分會第四次豬病防控學(xué)術(shù)研討會論文集[C];2010年

7 李軍華;余章龍;昌鳴先;;草魚PGRP6剪接異構(gòu)體的克隆與表達(dá)模式分析[A];中國水產(chǎn)學(xué)會魚病專業(yè)委員會2013年學(xué)術(shù)研討會論文摘要匯編[C];2013年

相關(guān)博士學(xué)位論文 前2條

1 任偉;干擾素調(diào)節(jié)因子3第二內(nèi)含子內(nèi)剪接異構(gòu)體1的轉(zhuǎn)錄調(diào)控[D];南京醫(yī)科大學(xué);2011年

2 覃艷紅;L型PML-RARα融合基因不同剪接異構(gòu)體對維甲酸誘導(dǎo)分化的影響及與剪接因子hnRNPA1、ASF/SF2的相關(guān)性研究[D];山西醫(yī)科大學(xué);2011年

相關(guān)碩士學(xué)位論文 前5條

1 羅超;TCF4N剪接異構(gòu)體在食管癌細(xì)胞中的表達(dá)研究[D];重慶醫(yī)科大學(xué);2015年

2 楊揚(yáng);基于信息通道模型的轉(zhuǎn)錄組重建與分析關(guān)鍵技術(shù)研究[D];清華大學(xué);2015年

3 王怡;干擾素調(diào)節(jié)因子3第二內(nèi)含子中新剪接異構(gòu)體2核心啟動(dòng)子的功能特征[D];南京醫(yī)科大學(xué);2011年

4 袁文霄;人ORMDL3基因第一內(nèi)含子內(nèi)剪接異構(gòu)體啟動(dòng)子的轉(zhuǎn)錄調(diào)控研究[D];南京醫(yī)科大學(xué);2012年

5 劉玉松;豬IgGⅡB類Fc受體剪接異構(gòu)體克隆與活性鑒定[D];河南農(nóng)業(yè)大學(xué);2010年



本文編號:1344812

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/1344812.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e6042***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
亚洲中文在线中文字幕91| 99久久精品免费精品国产| 精品熟女少妇一区二区三区| 亚洲二区欧美一区二区| 国产真人无遮挡免费视频一区| 日本三区不卡高清更新二区| 国产亚洲二区精品美女久久| 日韩人妻av中文字幕| 美国女大兵激情豪放视频播放| 国产一级内射麻豆91| 精品熟女少妇av免费久久野外 | 免费在线成人激情视频| 久久夜色精品国产高清不卡| 国产一区二区久久综合| 激情爱爱一区二区三区| 欧美自拍偷自拍亚洲精品| 六月丁香六月综合缴情| 欧美丝袜诱惑一区二区| 色婷婷国产精品视频一区二区保健| 日韩精品人妻少妇一区二区| 大香蕉久草网一区二区三区| 亚洲第一香蕉视频在线| 精品熟女少妇av免费久久野外| 日韩欧美国产高清在线| 国产日本欧美特黄在线观看| 免费福利午夜在线观看| 97人妻人人揉人人躁人人| 国产精品大秀视频日韩精品| 亚洲国产黄色精品在线观看| 中文字幕日产乱码一区二区| 九九九热视频最新在线| 国产精品香蕉免费手机视频| 中国少妇精品偷拍视频| 国产主播精品福利午夜二区| 精品少妇一区二区视频| 青青操精品视频在线观看| 亚洲淫片一区二区三区| 果冻传媒精选麻豆白晶晶| 亚洲性生活一区二区三区| 五月天丁香亚洲综合网| 日韩一级欧美一级久久|