基因富集分析方法研究及基因與疾病關(guān)聯(lián)性分析
發(fā)布時(shí)間:2017-09-17 05:15
本文關(guān)鍵詞:基因富集分析方法研究及基因與疾病關(guān)聯(lián)性分析
更多相關(guān)文章: 高通量基因測序 基因富集分析 拓?fù)鋭?/b> 基因調(diào)控網(wǎng)絡(luò)
【摘要】:現(xiàn)階段,基因測序技術(shù)主要基于高通量測序,其技術(shù)不斷成熟的同時(shí)基因數(shù)據(jù)也大量產(chǎn)生。人類對(duì)基因的研究也不再集中于基因數(shù)據(jù)的獲取上,重心開始逐漸偏移,著重探討基因的功能及基因的多樣性。當(dāng)前面臨的主要挑戰(zhàn)在于解釋和分析基因測序產(chǎn)生的大量數(shù)據(jù),嘗試從這些大量基因數(shù)據(jù)中挖掘出潛在的規(guī)律,為人類帶來福音。癌癥,又被稱為惡性腫瘤,目前是對(duì)人類健康最大的威脅之一。利用基因技術(shù)進(jìn)行癌癥預(yù)防及治療將會(huì)成為未來癌癥治療的重大突破點(diǎn)。利用生物先驗(yàn)知識(shí),分析一組具有相同功能的基因(基因集)在不同表現(xiàn)型下的差異性的方法漸成為當(dāng)前的主流方法,即基因富集分析方法。本文提出了一種基于拓?fù)鋭菽P偷幕蚋患治龇椒。該方法將單個(gè)基因看作一個(gè)表達(dá)勢場,并且利用拓?fù)鋭菽P土炕吮磉_(dá)勢場的強(qiáng)度。基因表達(dá)勢場的強(qiáng)度主要取決于兩個(gè)方面:基因表達(dá)值的高低以及基因之間調(diào)控關(guān)聯(lián)程度的強(qiáng)弱。基因的表達(dá)值越高,并且與其他基因之間的調(diào)控關(guān)系越強(qiáng),則基因的表達(dá)勢場越強(qiáng)。反之則其表達(dá)勢場越弱?梢詫鹘y(tǒng)的基因富集分析方法分為兩個(gè)大類:基于基因表達(dá)值的分析方法以及基于基因間相互關(guān)系的分析方法。由于基因之間存在調(diào)控關(guān)系,因此可以將人體的所有基因看成一種調(diào)控網(wǎng)絡(luò),基于此調(diào)控網(wǎng)絡(luò),可以將基于基因表達(dá)值的調(diào)控方法稱為“點(diǎn)方法”,將基于基因間相互關(guān)系的方法稱為“邊方法”。本文提出的拓?fù)鋭菽P涂梢钥醋魇恰包c(diǎn)方法”與“邊方法”的結(jié)合。在對(duì)模型的分析上,使用了三組腸癌數(shù)據(jù),并將拓?fù)鋭菽P团c當(dāng)前主流的算法進(jìn)行了比較,實(shí)驗(yàn)結(jié)果表明拓?fù)鋭菽P捅戎渌椒ň哂懈鼉?yōu)的性能。同時(shí),本文還將人體基因調(diào)控網(wǎng)絡(luò)HTRN引入到了拓?fù)鋭菽P?并給出了基于此網(wǎng)絡(luò)的拓?fù)鋭菽P途唧w的計(jì)算方法。HTRN網(wǎng)絡(luò)是DNA元件百科全書項(xiàng)目的一部分,引入此網(wǎng)絡(luò)使得拓?fù)鋭菽P椭恍杩紤]網(wǎng)絡(luò)中存在調(diào)控關(guān)系的基因?qū)?如此使得模型在生物上更具解釋性。在對(duì)引入HTRN網(wǎng)絡(luò)的拓?fù)鋭菽P托阅艿姆治錾?本文用到了一種新的分析方法,該方法要以大量的實(shí)驗(yàn)數(shù)據(jù)為依托,利用不同數(shù)據(jù)目標(biāo)基因集的p-value以及p-value排序位置為衡量標(biāo)準(zhǔn)對(duì)算法性能進(jìn)行評(píng)估。在不同算法的比對(duì)分析中,可以看到引入大網(wǎng)絡(luò)的拓?fù)鋭莘治瞿P途哂懈鼉?yōu)的性能。換句話說,其在基因富集分析方面具有更加優(yōu)越的競爭力。
【關(guān)鍵詞】:高通量基因測序 基因富集分析 拓?fù)鋭?/strong> 基因調(diào)控網(wǎng)絡(luò)
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:R3416
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 緒論9-17
- 1.1 課題的來源及研究的背景和意義9-11
- 1.1.1 課題來源9
- 1.1.2 課題的研究背景和意義9-11
- 1.2 國內(nèi)外在該方向的研究現(xiàn)狀及分析11-15
- 1.2.1 國外研究現(xiàn)狀11-15
- 1.2.2 國內(nèi)研究現(xiàn)狀15
- 1.3 主要研究內(nèi)容和論文組織結(jié)構(gòu)15-17
- 第2章 基因富集分析方法的介紹17-24
- 2.1 引言17-18
- 2.2 常用的基因富集分析方法18-23
- 2.2.1 GSEA18-19
- 2.2.2 GSVA19-20
- 2.2.3 GSCA與GSNCA20-21
- 2.2.4 DRAGEN21-22
- 2.2.5 各類方法優(yōu)缺點(diǎn)的比較22-23
- 2.3 本章小結(jié)23-24
- 第3章 基于拓?fù)鋭莸幕虿町惙治瞿P?/span>24-39
- 3.1 引言24-26
- 3.2 基于拓?fù)鋭菽P退惴ǖ闹饕襟E26-30
- 3.2.1 數(shù)據(jù)預(yù)處理26-27
- 3.2.2 計(jì)算基因集的拓?fù)鋭菹蛄?/span>27-29
- 3.2.3 計(jì)算信息散度29
- 3.2.4 交叉互換最終判定差異基因集29-30
- 3.3 實(shí)驗(yàn)分析30-38
- 3.3.1 算法實(shí)驗(yàn)準(zhǔn)備工作30
- 3.3.2 基于腸癌數(shù)據(jù)的實(shí)驗(yàn)30-34
- 3.3.3 對(duì)腸癌數(shù)據(jù)的深入分析34-37
- 3.3.4 與疾病相關(guān)的中心基因37-38
- 3.4 本章小結(jié)38-39
- 第4章 基于人體調(diào)控網(wǎng)絡(luò)的拓?fù)鋭菽P?/span>39-55
- 4.1 引言39-40
- 4.2 基于HTRN網(wǎng)絡(luò)的拓?fù)鋭菽P?/span>40-41
- 4.3 基于網(wǎng)絡(luò)的中心基因分析法41-42
- 4.4 實(shí)驗(yàn)分析42-55
- 4.4.1 對(duì)引入網(wǎng)絡(luò)拓?fù)鋭菽P偷姆治?/span>43-51
- 4.4.2 比較不同類別中心基因的異同51-55
- 結(jié)論55-57
- 參考文獻(xiàn)57-62
- 攻讀碩士期間發(fā)表的論文及其它成果62-64
- 致謝64
本文編號(hào):867463
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/867463.html
最近更新
教材專著