基于組學及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究
發(fā)布時間:2017-05-24 08:21
本文關鍵詞:基于組學及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:步入新世紀以來,隨著生物研究的不斷深入與新一代測序技術的快速發(fā)展,生物研究與生物信息研究逐漸深入到分子水平上,越來越多的生物大分子的功能被進一步揭示出來。起初,人們專注于研究蛋白質分子與編碼蛋白的編碼RNA,然而,慢慢地人們逐漸認識到之前被看成“轉錄垃圾”的非編碼RNA也扮演著很多重要的角色。lnc RNA是非常重要的一類非編碼RNA,它與生命體的多種生命過程密切相關,它的重要性逐漸被廣大生物信息研究人員所認識,并且吸引了越來越多的生物與生物信息研究人員投身其中。本文主要研究基于組學及臨床數(shù)據(jù)的疾病預后相關的lnc RNA挖掘方法。首先綜合分析了國內外的研究現(xiàn)狀,并詳細介紹了TCGA相關數(shù)據(jù)。然后對數(shù)據(jù)進行了有效的整合,通過對當前的變量選擇方法的詳細介紹與比較分析,最終確定了以lasso變量選擇為核心的研究方法。接著,利用最小二乘法對lnc RNA的權重系數(shù)進行計算,并據(jù)此對病人的生存時間進行有效的評估。隨后,對訓練組和測試組進行生存分析,通過生存分析與訓練對照的方法來證實挖掘出的lnc RNA的有效性。最后,借助m RNA對lnc RNA挖掘結果進行GO和Pathway的功能富集分析,探究這部分lnc RNA的潛在功能,進而驗證挖掘方法的正確性。此外,本文將該疾病預后相關的lnc RNA挖掘方法應用到肺癌數(shù)據(jù)中,完成了對肺癌預后相關的lnc RNA挖掘。結果表明:預測出的18個與肺癌病人預后相關的lnc RNA在訓練集與測試集中,均很好地預測了肺癌病人的預后情況,通過Log Rank檢驗,其P值均小于0.01,具有極大的顯著性;進一步GO和Pathway的功能富集分析顯示,這部分lnc RNA與很多免疫有關的節(jié)點和通路有關,并且還與含氧反應以及氧脂素的合成有關,以上事實充分說明了通過該方法挖掘出的lnc RNA與肺癌的發(fā)生發(fā)展以及病人的預后有著潛在的關聯(lián)。
【關鍵詞】:lnc RNA 變量選擇 TCGA 功能富集
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:R318;TP311.13
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-16
- 1.1 課題背景及研究的目的和意義8-11
- 1.1.1 課題背景8-10
- 1.1.2 研究的目的和意義10-11
- 1.2 國內外研究現(xiàn)狀11-13
- 1.2.1 國內研究現(xiàn)狀11-12
- 1.2.2 國外研究現(xiàn)狀12
- 1.2.3 國內外研究簡析12-13
- 1.3 本文主要研究工作13-14
- 1.4 本文組織結構14-16
- 第2章 相關生物學數(shù)據(jù)介紹16-25
- 2.1 引言16-17
- 2.2 TCGA簡介17-18
- 2.3 LNCRNA相關數(shù)據(jù)18-21
- 2.4 癌癥預后相關數(shù)據(jù)21-23
- 2.5 本章小結23-25
- 第3章 疾病預后相關的LNCRNA挖掘25-37
- 3.1 引言25-26
- 3.2 算法總體結構26-27
- 3.3 數(shù)據(jù)整合27-28
- 3.4 常用變量選擇方法28-30
- 3.4.1 基于信息論的準則28-29
- 3.4.2 基于Bayes方法的準則29
- 3.4.3 基于預測誤差的準則29-30
- 3.4.4 基于系數(shù)壓縮的準則30
- 3.5 LASSO與最小二乘法30-33
- 3.5.1 LASSO30-32
- 3.5.2 最小二乘法32-33
- 3.6 生存分析與訓練測試33-34
- 3.6.1 生存分析33-34
- 3.6.2 訓練測試34
- 3.7 LNCRNA功能分析34-35
- 3.8 本章小結35-37
- 第4章 肺癌預后相關的LNCRNA預測37-52
- 4.1 引言37-38
- 4.2 肺癌相關數(shù)據(jù)38-43
- 4.2.1 肺癌lnc RNA表達數(shù)據(jù)38-40
- 4.2.2 肺癌病人預后數(shù)據(jù)40-42
- 4.2.3 肺癌數(shù)據(jù)整合42-43
- 4.3 肺癌訓練集與測試集43-46
- 4.3.1 訓練集與測試集劃分43-44
- 4.3.2 訓練集與測試集檢驗44-46
- 4.4 肺癌預后相關的LNCRNA挖掘46-47
- 4.4.1 lnc RNA選取與權重計算46
- 4.4.2 生存分析46-47
- 4.5 肺癌LNCRNA功能分析47-51
- 4.5.1 m RNA的選取47-48
- 4.5.2 GO和Pathway富集48-51
- 4.6 本章小結51-52
- 結論52-53
- 參考文獻53-56
- 攻讀碩士學位期間發(fā)表的論文56-58
- 致謝58
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊玲,李連弟,陳育德,Donald Maxwell Parkin;中國肺癌死亡趨勢分析及發(fā)病、死亡的估計與預測[J];中國肺癌雜志;2005年04期
本文關鍵詞:基于組學及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究,由筆耕文化傳播整理發(fā)布。
本文編號:390247
本文鏈接:http://sikaile.net/yixuelunwen/swyx/390247.html
最近更新
教材專著