天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

高通量全長轉(zhuǎn)錄組測序數(shù)據(jù)的表達水平計算研究

發(fā)布時間:2020-07-30 08:29
【摘要】:轉(zhuǎn)錄組表達水平測量計算是基因功能研究的重要手段,而真核生物選擇性剪切的存在給準確計算基因異構(gòu)體表達水平帶來了困難。近幾年誕生的第三代測序技術(shù)是轉(zhuǎn)錄組研究的一種新的實驗方法,其顯著特點是可以獲得超長讀段,彌補了第二代測序技術(shù)中的讀段過短,異構(gòu)體檢測較為困難的缺點。PacBio公司針對轉(zhuǎn)錄組提出的ISO-seq測序技術(shù),給轉(zhuǎn)錄組研究尤其是檢測新型異構(gòu)體領(lǐng)域帶來了新機遇。但目前對于ISO-seq數(shù)據(jù)在轉(zhuǎn)錄組研究的應(yīng)用中極少有工作涉及異構(gòu)體表達水平的計算,一部分研究工作通過結(jié)合RNA-seq技術(shù)數(shù)據(jù),使用ISO-seq與RNA-seq混合數(shù)據(jù)進行表達水平的計算。而這些研究工作大多只用到小部分的全長讀段數(shù)據(jù),丟失了大部分非全長讀段數(shù)據(jù)中較多有用信息,因而數(shù)據(jù)沒有得到充分利用,造成數(shù)據(jù)通量低。另外,使用ISO-seq和RNA-seq混合數(shù)據(jù)的方法雖同時兼顧了兩種測序技術(shù)的優(yōu)點,但其計算復(fù)雜程度高,且獲取同一樣本下兩種測序技術(shù)數(shù)據(jù)的成本高。本文針對這些問題,在保留非全長讀段的基礎(chǔ)上,提出了僅使用ISO-seq單一數(shù)據(jù)同時預(yù)測異構(gòu)體結(jié)構(gòu)和計算其表達比例的兩個模型DSIDP和MCIDP。具體完成的工作如下:1)鑒于現(xiàn)有的預(yù)處理框架并不能滿足本文保留非全長讀段的需求,本文首先提出了一套保留全長和非全長讀段的數(shù)據(jù)預(yù)處理方法。從ISO-seq原始數(shù)據(jù)出發(fā),經(jīng)過下機數(shù)據(jù)處理、讀段糾錯、讀段比對和外顯子序列整理四個步驟,最終獲得模型的輸入數(shù)據(jù)。2)針對具有全長讀段的異構(gòu)體表達水平計算問題,提出了DSIDP模型,從全長讀段中建立異構(gòu)體預(yù)測集,同時采用全長讀段和非全長讀段計算異構(gòu)體表達比例。DSIDP將所有讀段比對至異構(gòu)體預(yù)測集,并使用Dirichlet采樣解決多源映射問題。模型在模擬數(shù)據(jù)和真實數(shù)據(jù)上得到了有效驗證。3)針對沒有全長讀段的超長異構(gòu)體檢測問題,提出了MCIDP模型,采用馬爾科夫鏈模擬基因外顯子之間的選擇性剪接,該模型除了從全長讀段中建立異構(gòu)體預(yù)測集外,還能預(yù)測出數(shù)據(jù)中沒有全長讀段的超長異構(gòu)體,這對新型異構(gòu)體的發(fā)現(xiàn)具有重要意義。模型在模擬數(shù)據(jù)和真實數(shù)據(jù)上得到了有效驗證。
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:Q811.4
【圖文】:

遺傳信息,傳遞方式


南京航空航天大學(xué)碩士學(xué)位論文基因中外顯子與內(nèi)含子。在經(jīng)過選擇性剪接事件之后,內(nèi)含子被剪去,外顯子之間拼接成兩個成熟的 mRNA,指導(dǎo)不同蛋白質(zhì)的合成。一條 mRNA 指導(dǎo)翻譯出一個蛋白質(zhì),基轉(zhuǎn)錄出的 mRNA 數(shù)量越多,該基因表達出的蛋白質(zhì)越多。因此通常使用某一基因轉(zhuǎn)錄出mRNA 數(shù)量來量化該基因的表達情況,這一量化指標被稱為基因表達水平。圖 2.2 展示過程中一個基因轉(zhuǎn)錄生成出了兩個不同的 mRNA 分子,這樣的現(xiàn)象被稱為選擇性剪接,有極為重要的意義,具體描述將在后續(xù)章節(jié)給出。圖 2. 1 遺傳信息傳遞方式一

模式圖,測序,模式,逆轉(zhuǎn)錄


圖 2. 4 標準測序模式[31]圖 2. 5 環(huán)形一致測序模式[31]對轉(zhuǎn)錄組測序,PacBio 公司基于其單分子實時測序技術(shù)提出了全長轉(zhuǎn)錄組測eq 技術(shù),對 RNA 分子不做任何打斷處理直接逆轉(zhuǎn)錄出 cDNA 構(gòu)建測序文庫,利用上可超長測序的優(yōu)勢,能夠獲取到完整異構(gòu)體的堿基序列,為后續(xù)選擇性剪接、等位達、同源異構(gòu)體的研究提供精確數(shù)據(jù)保障。圖 2.6 展示了 ISO-seq 技術(shù)的整個實驗流程提取樣本中所有RNA提取PolyA尾的mRNA逆轉(zhuǎn)錄出cDNA序列

模式圖,測序,環(huán)形,模式


圖 2. 5 環(huán)形一致測序模式[31]對轉(zhuǎn)錄組測序,PacBio 公司基于其單分子實時測序技術(shù)提出了全長轉(zhuǎn)錄組測seq 技術(shù),對 RNA 分子不做任何打斷處理直接逆轉(zhuǎn)錄出 cDNA 構(gòu)建測序文庫,利用上可超長測序的優(yōu)勢,能夠獲取到完整異構(gòu)體的堿基序列,為后續(xù)選擇性剪接、等位達、同源異構(gòu)體的研究提供精確數(shù)據(jù)保障。圖 2.6 展示了 ISO-seq 技術(shù)的整個實驗流程提取樣本中所有RNA提取PolyA尾的mRNA逆轉(zhuǎn)錄出cDNA序列size-selection獲取不同長度范圍的cDNA序列構(gòu)建環(huán)狀I(lǐng)SO-seq測序文庫SMRT測序儀測序

【相似文獻】

相關(guān)期刊論文 前10條

1 李法君;;降解組測序技術(shù)及其研究進展[J];生物學(xué)教學(xué);2017年04期

2 彭桂蘭;陳嘉慧;榮丹箐;;第四代測序技術(shù)[J];農(nóng)村經(jīng)濟與科技;2017年10期

3 王海;;高通量測序技術(shù)新名詞的理解和辨析[J];中國科技術(shù)語;2017年04期

4 權(quán)冰娥;李樹;;新一代DNA測序技術(shù)在法醫(yī)實踐中的應(yīng)用及其研究進展[J];遼寧警察學(xué)院學(xué)報;2017年06期

5 鄭秋燕;李清;毛華明;冷靜;;測序技術(shù)的發(fā)展對瘤胃元基因組研究的影響[J];黑龍江畜牧獸醫(yī);2015年21期

6 韓齊;李媛媛;孫方達;孔保華;陳倩;;新一代測序技術(shù)在食品微生物學(xué)中的應(yīng)用[J];食品工業(yè);2016年01期

7 杜兵兵;;第二代高通量測序技術(shù)的原理及其在醫(yī)學(xué)中的應(yīng)用進展[J];中國繼續(xù)醫(yī)學(xué)教育;2016年03期

8 周瑩;許冰瑩;;二代測序技術(shù)在臨床醫(yī)學(xué)上的相關(guān)應(yīng)用[J];昆明醫(yī)科大學(xué)學(xué)報;2016年03期

9 烏日拉嘎;徐海燕;馮淑貞;孫志宏;孟和畢力格;張和平;;測序技術(shù)的研究進展及三代測序的應(yīng)用[J];中國乳品工業(yè);2016年04期

10 郭海燕;程國虎;李擁軍;張昊;秦康樂;;高通量測序技術(shù)及其在生物學(xué)中的應(yīng)用[J];當代畜牧;2016年12期

相關(guān)會議論文 前10條

1 趙潔;趙志軍;賈偉;師志云;趙穎;張玉英;趙s

本文編號:2775284


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2775284.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3898b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com