基于RNA-Seq數(shù)據(jù)識別神經(jīng)母細(xì)胞瘤中的環(huán)形RNA
發(fā)布時間:2017-04-27 16:04
本文關(guān)鍵詞:基于RNA-Seq數(shù)據(jù)識別神經(jīng)母細(xì)胞瘤中的環(huán)形RNA,由筆耕文化傳播整理發(fā)布。
【摘要】:環(huán)形RNA(circ RNA)是細(xì)胞內(nèi)一類非常特別的RNA,它來自外顯子異常剪切,即一個來自下游的剪切片段和來自上游的剪切片段非常規(guī)地結(jié)合成為環(huán)形。不同于線性RNA的是,circ RNA是通過共價結(jié)合形成的環(huán)形RNA,并且這種環(huán)形相比其線性結(jié)構(gòu)更加穩(wěn)定。在經(jīng)典的RNA測序中,由于環(huán)形RNA的末端結(jié)合在了一起,導(dǎo)致環(huán)形RNA缺少經(jīng)典RNA測序的重要特征分子“尾巴結(jié)構(gòu)”,因此這些環(huán)形RNA在過去的測序中并未引起普遍關(guān)注。但是新興的生物信息學(xué)方法的發(fā)展以及深度測序技術(shù)的大量應(yīng)用讓更多的研究都聚焦在環(huán)形RNA上。已有研究顯示環(huán)形RNA與基因轉(zhuǎn)錄后調(diào)控有密切聯(lián)系,關(guān)于環(huán)形RNA更多的功能仍有待探索。因此環(huán)形RNA的鑒別對于理解復(fù)雜基因表達(dá)中的調(diào)控以及細(xì)胞功能的分子機(jī)制都有著極其重要的意義。在這篇論文里,重點(diǎn)是研究神經(jīng)母細(xì)胞瘤的環(huán)形RNA鑒別以及相關(guān)生物統(tǒng)計分析。具體工作如下:我們對目前學(xué)術(shù)界流行的高通量測序技術(shù)和相關(guān)比對工具進(jìn)行了全面深入的比較和分析,開發(fā)了一種生物信息學(xué)的計算方法來識別人類神經(jīng)母細(xì)胞瘤中的環(huán)形RNA。選取神經(jīng)母細(xì)胞瘤的四類細(xì)胞系CHLA、COG、SK-N-BE以及SMS的高通量RNA-seq測序結(jié)果作為數(shù)據(jù)處理對象。利用已注釋的人類外顯子邊界序列構(gòu)建“錯序外顯子-外顯子連接數(shù)據(jù)庫”。我們通過Bowtie2二代測序數(shù)據(jù)分析工具,將RNA-seq雙端數(shù)據(jù)分別與ENSEMBL人類hg19全基因組參考序列以及“錯序外顯子-外顯子連接數(shù)據(jù)庫”進(jìn)行兩次比對。實(shí)驗(yàn)測序結(jié)果以及生物信息處理方法帶來的誤差可能會使得結(jié)果集中存在假陽性的環(huán)形轉(zhuǎn)錄本。因此我們利用統(tǒng)計學(xué)理論并使用使用R語言編程對候選數(shù)據(jù)集進(jìn)行假陽性(FDR)控制。利用候選數(shù)據(jù)集中讀片段分別構(gòu)建空分布和待檢驗(yàn)分布,將FDR控制在閾值以下。并對結(jié)果進(jìn)行去冗余篩選與整理,我們對神經(jīng)母細(xì)胞瘤的14個樣本的環(huán)形RNA做了相關(guān)鑒定。最后,對找到的環(huán)形RNA作相關(guān)生物統(tǒng)計分析。我們發(fā)現(xiàn),藥物對于染色體上環(huán)形RNA的數(shù)量有顯著影響,而對于母基因上環(huán)形RNA變體的數(shù)量影響不大;基因上環(huán)形RNA亞型的剪接位點(diǎn)大多數(shù)與基因的剪接位點(diǎn)是一致的。此外我們對能夠轉(zhuǎn)錄出環(huán)形RNA的基因做了GO分析,探究形成環(huán)的基因參與形成的蛋白質(zhì)在相關(guān)生物過程,分子功能以及細(xì)胞組件中的作用。
【關(guān)鍵詞】:環(huán)形RNA 神經(jīng)瘤母細(xì)胞 高通量測序 序列比對 假陽性
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:R739.4;Q811.4
【目錄】:
- 摘要4-5
- ABSTRACT5-11
- 注釋表11-12
- 第一章 緒論12-21
- 1.1 引言12-15
- 1.1.1 研究背景12-14
- 1.1.2 研究意義14-15
- 1.2 國內(nèi)外研究進(jìn)展15
- 1.3 本文的研究創(chuàng)新點(diǎn)15-16
- 1.4 本文的研究方案及關(guān)鍵問題16-19
- 1.4.1 研究方案16-18
- 1.4.2 擬解決的關(guān)鍵問題18-19
- 1.5 內(nèi)容安排19-21
- 第二章 第二代測序序列比對方法研究現(xiàn)狀21-28
- 2.1 引言21
- 2.2 新一代高通量測序技術(shù)簡介21-23
- 2.2.1 高通量測序平臺21
- 2.2.2 Illumina測序結(jié)果格式說明21-23
- 2.3 第二代測序數(shù)據(jù)比對工具23-24
- 2.4 Bowtie2 比對工具介紹24-27
- 2.4.1 Bowtie2 安裝與使用24-25
- 2.4.2 Bowtie2 比對原理25-26
- 2.4.3 Bowtie2 與Bowtie1 的對比26-27
- 2.5 本章小結(jié)27-28
- 第三章 基于人類RNA-SEQ高通量測序數(shù)據(jù)篩選環(huán)形RNA28-43
- 3.1 引言28
- 3.2 錯序外顯子的形成28-29
- 3.2.1 錯序外顯子形成的兩種機(jī)制28-29
- 3.2.2 環(huán)形模型篩選特征29
- 3.3 環(huán)形RNA鑒別——兩次比對算法29-34
- 3.3.1 數(shù)據(jù)來源30
- 3.3.2 第一輪比對30-32
- 3.3.3 構(gòu)建自建外顯子-外顯子數(shù)據(jù)庫32-33
- 3.3.4 第二輪比對33-34
- 3.4 控制FDR與數(shù)據(jù)篩選34-42
- 3.4.1 假設(shè)檢驗(yàn)34-35
- 3.4.2 FDR控制定義35
- 3.4.3 空分布和p-value35-37
- 3.4.4 多重檢驗(yàn)校驗(yàn)37-41
- 3.4.5 環(huán)形RNA篩選和去冗余41-42
- 3.5 本章小結(jié)42-43
- 第四章 基于人類RNA-SEQ數(shù)據(jù)篩選環(huán)形RNA結(jié)果的統(tǒng)計分析43-72
- 4.1 引言43
- 4.2 環(huán)形RNA關(guān)于染色體的相關(guān)統(tǒng)計43-60
- 4.2.1 各細(xì)胞系環(huán)形RNA個數(shù)關(guān)于染色體分布43-46
- 4.2.2 染色體關(guān)于環(huán)形RNA分類46-53
- 4.2.3 藥物對染色體——環(huán)形RNA個數(shù)分布的影響分析53-60
- 4.3 環(huán)形RNA關(guān)于基因的相關(guān)統(tǒng)計60-69
- 4.3.1 各細(xì)胞系環(huán)形RNA個數(shù)關(guān)于基因分布60-62
- 4.3.2 基因關(guān)于環(huán)形RNA的分類62-63
- 4.3.3 藥物對基因——環(huán)形RNA個數(shù)分布的影響分析63-65
- 4.3.4 基因上環(huán)形RNA亞型剪切點(diǎn)選擇的的研究65-67
- 4.3.5 轉(zhuǎn)錄環(huán)形RNA的基因的GO分析67-69
- 4.4 環(huán)形RNA外顯子組成個數(shù)的統(tǒng)計69-70
- 4.5 本章小結(jié)70-72
- 第五章 總結(jié)與展望72-74
- 5.1 本文工作總結(jié)72
- 5.2 后續(xù)工作展望72-74
- 參考文獻(xiàn)74-81
- 致謝81-82
- 在學(xué)期間的研究成果及學(xué)術(shù)論文情況82
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 劉學(xué)軍;李蒙;張禮;;一種針對RNA-Seq數(shù)據(jù)的基因異構(gòu)體表達(dá)水平計算方法[J];中國生物醫(yī)學(xué)工程學(xué)報;2013年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 曾p瑤;基于小鼠15個組織RNA-seq數(shù)據(jù)的全基因組重注釋[D];中國科學(xué)院北京基因組研究所;2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 陳\,
本文編號:330923
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/330923.html
最近更新
教材專著