基于組學(xué)及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究
發(fā)布時(shí)間:2017-05-24 08:21
本文關(guān)鍵詞:基于組學(xué)及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:步入新世紀(jì)以來,隨著生物研究的不斷深入與新一代測(cè)序技術(shù)的快速發(fā)展,生物研究與生物信息研究逐漸深入到分子水平上,越來越多的生物大分子的功能被進(jìn)一步揭示出來。起初,人們專注于研究蛋白質(zhì)分子與編碼蛋白的編碼RNA,然而,慢慢地人們逐漸認(rèn)識(shí)到之前被看成“轉(zhuǎn)錄垃圾”的非編碼RNA也扮演著很多重要的角色。lnc RNA是非常重要的一類非編碼RNA,它與生命體的多種生命過程密切相關(guān),它的重要性逐漸被廣大生物信息研究人員所認(rèn)識(shí),并且吸引了越來越多的生物與生物信息研究人員投身其中。本文主要研究基于組學(xué)及臨床數(shù)據(jù)的疾病預(yù)后相關(guān)的lnc RNA挖掘方法。首先綜合分析了國內(nèi)外的研究現(xiàn)狀,并詳細(xì)介紹了TCGA相關(guān)數(shù)據(jù)。然后對(duì)數(shù)據(jù)進(jìn)行了有效的整合,通過對(duì)當(dāng)前的變量選擇方法的詳細(xì)介紹與比較分析,最終確定了以lasso變量選擇為核心的研究方法。接著,利用最小二乘法對(duì)lnc RNA的權(quán)重系數(shù)進(jìn)行計(jì)算,并據(jù)此對(duì)病人的生存時(shí)間進(jìn)行有效的評(píng)估。隨后,對(duì)訓(xùn)練組和測(cè)試組進(jìn)行生存分析,通過生存分析與訓(xùn)練對(duì)照的方法來證實(shí)挖掘出的lnc RNA的有效性。最后,借助m RNA對(duì)lnc RNA挖掘結(jié)果進(jìn)行GO和Pathway的功能富集分析,探究這部分lnc RNA的潛在功能,進(jìn)而驗(yàn)證挖掘方法的正確性。此外,本文將該疾病預(yù)后相關(guān)的lnc RNA挖掘方法應(yīng)用到肺癌數(shù)據(jù)中,完成了對(duì)肺癌預(yù)后相關(guān)的lnc RNA挖掘。結(jié)果表明:預(yù)測(cè)出的18個(gè)與肺癌病人預(yù)后相關(guān)的lnc RNA在訓(xùn)練集與測(cè)試集中,均很好地預(yù)測(cè)了肺癌病人的預(yù)后情況,通過Log Rank檢驗(yàn),其P值均小于0.01,具有極大的顯著性;進(jìn)一步GO和Pathway的功能富集分析顯示,這部分lnc RNA與很多免疫有關(guān)的節(jié)點(diǎn)和通路有關(guān),并且還與含氧反應(yīng)以及氧脂素的合成有關(guān),以上事實(shí)充分說明了通過該方法挖掘出的lnc RNA與肺癌的發(fā)生發(fā)展以及病人的預(yù)后有著潛在的關(guān)聯(lián)。
【關(guān)鍵詞】:lnc RNA 變量選擇 TCGA 功能富集
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:R318;TP311.13
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-16
- 1.1 課題背景及研究的目的和意義8-11
- 1.1.1 課題背景8-10
- 1.1.2 研究的目的和意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-13
- 1.2.1 國內(nèi)研究現(xiàn)狀11-12
- 1.2.2 國外研究現(xiàn)狀12
- 1.2.3 國內(nèi)外研究簡析12-13
- 1.3 本文主要研究工作13-14
- 1.4 本文組織結(jié)構(gòu)14-16
- 第2章 相關(guān)生物學(xué)數(shù)據(jù)介紹16-25
- 2.1 引言16-17
- 2.2 TCGA簡介17-18
- 2.3 LNCRNA相關(guān)數(shù)據(jù)18-21
- 2.4 癌癥預(yù)后相關(guān)數(shù)據(jù)21-23
- 2.5 本章小結(jié)23-25
- 第3章 疾病預(yù)后相關(guān)的LNCRNA挖掘25-37
- 3.1 引言25-26
- 3.2 算法總體結(jié)構(gòu)26-27
- 3.3 數(shù)據(jù)整合27-28
- 3.4 常用變量選擇方法28-30
- 3.4.1 基于信息論的準(zhǔn)則28-29
- 3.4.2 基于Bayes方法的準(zhǔn)則29
- 3.4.3 基于預(yù)測(cè)誤差的準(zhǔn)則29-30
- 3.4.4 基于系數(shù)壓縮的準(zhǔn)則30
- 3.5 LASSO與最小二乘法30-33
- 3.5.1 LASSO30-32
- 3.5.2 最小二乘法32-33
- 3.6 生存分析與訓(xùn)練測(cè)試33-34
- 3.6.1 生存分析33-34
- 3.6.2 訓(xùn)練測(cè)試34
- 3.7 LNCRNA功能分析34-35
- 3.8 本章小結(jié)35-37
- 第4章 肺癌預(yù)后相關(guān)的LNCRNA預(yù)測(cè)37-52
- 4.1 引言37-38
- 4.2 肺癌相關(guān)數(shù)據(jù)38-43
- 4.2.1 肺癌lnc RNA表達(dá)數(shù)據(jù)38-40
- 4.2.2 肺癌病人預(yù)后數(shù)據(jù)40-42
- 4.2.3 肺癌數(shù)據(jù)整合42-43
- 4.3 肺癌訓(xùn)練集與測(cè)試集43-46
- 4.3.1 訓(xùn)練集與測(cè)試集劃分43-44
- 4.3.2 訓(xùn)練集與測(cè)試集檢驗(yàn)44-46
- 4.4 肺癌預(yù)后相關(guān)的LNCRNA挖掘46-47
- 4.4.1 lnc RNA選取與權(quán)重計(jì)算46
- 4.4.2 生存分析46-47
- 4.5 肺癌LNCRNA功能分析47-51
- 4.5.1 m RNA的選取47-48
- 4.5.2 GO和Pathway富集48-51
- 4.6 本章小結(jié)51-52
- 結(jié)論52-53
- 參考文獻(xiàn)53-56
- 攻讀碩士學(xué)位期間發(fā)表的論文56-58
- 致謝58
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊玲,李連弟,陳育德,Donald Maxwell Parkin;中國肺癌死亡趨勢(shì)分析及發(fā)病、死亡的估計(jì)與預(yù)測(cè)[J];中國肺癌雜志;2005年04期
本文關(guān)鍵詞:基于組學(xué)及臨床數(shù)據(jù)的疾病lncRNA挖掘方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):390247
本文鏈接:http://sikaile.net/yixuelunwen/swyx/390247.html
最近更新
教材專著