基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測算法
本文關(guān)鍵詞:基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測算法,由筆耕文化傳播整理發(fā)布。
【摘要】:疾病影響著人類的正常工作及生活,復(fù)雜疾病,以癌癥為代表,更是嚴重威脅著人類的生命安全。對疾病生物標記的研究有助于揭開潛在疾病的發(fā)病機制,并引導個性化的治療。因此,疾病生物標記的研究受到越來越多的關(guān)注,成為了生物信息學研究中一個極其重要的分支。近些年來,隨著高通量測序技術(shù)的發(fā)展,各種不同的生物數(shù)據(jù)大量涌現(xiàn),疾病生物標記的研究進入了一個新階段。已知疾病基因,作為已經(jīng)在臨床上被證實跟疾病相關(guān)的基因,可以作為一種先驗知識來指導研究。然而目前的大多數(shù)研究方法,只是把已知疾病基因作為對研究結(jié)果的驗證數(shù)據(jù),而沒有作為先驗知識去引導疾病生物標記的識別,本文研究中引入了這一數(shù)據(jù)作為先驗知識。另外,大量生物數(shù)據(jù)的積累也推動了對各種計算方法的研究。在生物假說“同一疾病的蛋白質(zhì)互相之間交互多”的基礎(chǔ)上,研究者們通過在網(wǎng)絡(luò)模型中計算各基因與已知疾病基因的距離,來預(yù)測疾病生物標記。這些距離度量方法包括基于最短路徑、基于隨機游走、擴散核等。擴散核能根據(jù)疾病網(wǎng)絡(luò)的全局拓撲特性度量節(jié)點之間的距離,具有比較好的效果。本文研究中采用了擴散核(diffusion kernel)思想。本文提出了一種以已知疾病基因集合引導的疾病網(wǎng)絡(luò)的構(gòu)建方法,并從構(gòu)建的疾病網(wǎng)絡(luò)中預(yù)測疾病相關(guān)基因。本文具體的研究思路如下:首先,從三個公共數(shù)據(jù)庫中收集針對某種癌癥的已知疾病基因,對每種癌癥得到一個疾病基因集合。針對本文研究的六種癌癥(肺癌,前列腺癌,乳腺癌,膀胱癌,大腸直腸癌,子宮內(nèi)膜癌),共獲得了六個基因集合。然后,采用擴散核思想在每一個疾病基因集合基礎(chǔ)上構(gòu)建一個疾病分子網(wǎng)絡(luò)。擴散核在本文中被用來度量基因之間的相似性,旨在找出與已知疾病基因相似性高的基因,用于構(gòu)建網(wǎng)絡(luò)。最后,采用馬爾科夫聚類算法(MCL)在疾病網(wǎng)絡(luò)上進行聚類,并設(shè)計了一種按聚類模塊為單位的新穎的得分算法對疾病網(wǎng)絡(luò)中除已知疾病基因以外的基因打分,從中篩選癌癥相關(guān)基因并進行了一系列驗證。另外,為了說明以疾病基因集合為疾病網(wǎng)絡(luò)的初始節(jié)點集合的合理性,我們在PPI的最大連通圖上比較了疾病基因與非疾病基因的拓撲特性差異。實驗結(jié)果表明,本文的研究方法能比較有效地構(gòu)建疾病分子網(wǎng)絡(luò),預(yù)測與特定癌癥相關(guān)程度高的基因。從與經(jīng)典的帶重啟的隨機游走的預(yù)測方法的結(jié)果對比來看,本文方法預(yù)測的致病基因在已知疾病基因數(shù)據(jù)庫中展現(xiàn)了更顯著的富集性,對癌癥樣本和正常樣本的分類效果也更好。本文的算法將從某種程度上揭示癌癥的發(fā)病機理,并為深入了解癌癥的機制提供支持。
【關(guān)鍵詞】:PPI網(wǎng)絡(luò) 疾病網(wǎng)絡(luò) 拓撲特性 擴散核 生物標記
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:R3416
【目錄】:
- 摘要5-7
- ABSTRACT7-14
- 第一章 緒論14-20
- 1.1 研究背景及意義14-15
- 1.2 研究現(xiàn)狀15-17
- 1.3 本文工作及組織結(jié)構(gòu)17-20
- 第二章 疾病基因預(yù)測研究概述20-30
- 2.1 相關(guān)生物數(shù)據(jù)20-25
- 2.1.1 蛋白質(zhì)相互作用網(wǎng)絡(luò)20-21
- 2.1.2 疾病基因數(shù)據(jù)21-23
- 2.1.3 基因表達數(shù)據(jù)23-24
- 2.1.4 GO本體論和注釋數(shù)據(jù)24-25
- 2.2 疾病基因預(yù)測方法25-30
- 2.2.1 基于模型的預(yù)測方法25-26
- 2.2.2 基于距離的預(yù)測方法26-27
- 2.2.3 基于模塊的預(yù)測方法27-28
- 2.2.4 基于數(shù)據(jù)集成的預(yù)測方法28-30
- 第三章 基于網(wǎng)絡(luò)分析的疾病基因預(yù)測算法30-40
- 3.1 方法概述30-31
- 3.2 疾病網(wǎng)絡(luò)構(gòu)建方法31-35
- 3.2.1 疾病基因收集32
- 3.2.2 網(wǎng)絡(luò)構(gòu)建算法32-35
- 3.3 致病基因的預(yù)測方法35-38
- 3.3.1 聚類算法36-37
- 3.3.2 模塊得分算法37
- 3.3.3 基因得分算法37-38
- 3.4 本章小結(jié)38-40
- 第四章 實驗結(jié)果與分析40-58
- 4.1 實驗數(shù)據(jù)40-43
- 4.1.1 PPI的處理40
- 4.1.2 疾病基因的篩選40-41
- 4.1.3 基因表達數(shù)據(jù)預(yù)處理41-43
- 4.2 疾病網(wǎng)絡(luò)合理性分析43-48
- 4.2.1 疾病基因拓撲特性分析43-46
- 4.2.2 疾病網(wǎng)絡(luò)拓撲特性分析46
- 4.2.3 聚類模塊結(jié)構(gòu)分析46-48
- 4.3 預(yù)測的致病基因的驗證與分析48-57
- 4.3.1 留一交叉驗證48-51
- 4.3.2 分類性能分析51-52
- 4.3.3 富集分析52-57
- 4.4 本章小結(jié)57-58
- 第五章 總結(jié)與展望58-60
- 參考文獻60-66
- 致謝66-68
- 作者簡介68-69
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉二林;;預(yù)測疾病基因[J];家庭醫(yī)學;1988年05期
2 劉建,賀紅焰;疾病基因多態(tài)性研究是發(fā)展個體化臨床醫(yī)學的新途徑[J];醫(yī)學與哲學;2000年05期
3 ;基因組醫(yī)學、染色體組和人類疾病基因(1)[J];現(xiàn)代臨床醫(yī)學生物工程學雜志;2004年01期
4 陳曉紅,陳智;尋找疾病基因的策略進展[J];國外醫(yī)學.流行病學傳染病學分冊;2004年01期
5 ;基因組醫(yī)學、染色體組和人類疾病基因(10)[J];現(xiàn)代臨床醫(yī)學生物工程學雜志;2005年04期
6 袁芳;王瑞春;管明祥;周艷紅;;基于功能的疾病基因預(yù)測系統(tǒng)設(shè)計與應(yīng)用[J];計算機工程;2010年12期
7 袁芳;李靖;;基于功能相似性預(yù)測疾病基因[J];計算機應(yīng)用研究;2012年11期
8 ;基因組醫(yī)學、染色體組和人類疾病基因(1)[J];現(xiàn)代臨床醫(yī)學生物工程學雜志;2004年01期
9 ;基因組醫(yī)學、染色體組和人類疾病基因(3)[J];現(xiàn)代臨床醫(yī)學生物工程學雜志;2004年03期
10 周艷紅,周權(quán)雄,劉懷蘭,萬宏輝;基于密碼子使用特征預(yù)測家族性擴張型心肌病的疾病基因[J];科學通報;2005年20期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 劉維湘;袁克虹;黃勛;唐愛發(fā);賈少微;;疾病基因預(yù)選方法綜述[A];中國生物醫(yī)學工程進展——2007中國生物醫(yī)學工程聯(lián)合學術(shù)年會論文集(下冊)[C];2007年
2 孔令雯;葛正行;;綜述COPD疾病基因多態(tài)性研究進展[A];2011年貴州省中西醫(yī)結(jié)合學會呼吸專業(yè)學術(shù)會議論文匯編[C];2011年
3 夏詔杰;王忠;郭力;;構(gòu)建中風疾病基因關(guān)系網(wǎng)絡(luò)的方法研究[A];中國化學會第28屆學術(shù)年會第14分會場摘要集[C];2012年
4 程義林;楊森;張學軍;;常見復(fù)雜疾病表型基因型全基因組關(guān)聯(lián)分析的問題和對策[A];中華醫(yī)學會第14次全國皮膚性病學術(shù)年會論文匯編[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前8條
1 李斌;成都學者研究疾病基因榜上有名[N];成都日報;2007年
2 許鐵男;歐洲掀起探索疾病基因熱潮[N];醫(yī)藥經(jīng)濟報;2001年
3 記者 尹寧靜;易感疾病基因檢測進入泰州[N];泰州日報;2006年
4 記者 李天舒;我國將開展五類重大疾病基因研究[N];健康報;2008年
5 霍冬;現(xiàn)代疾病基因新療法[N];中國高新技術(shù)產(chǎn)業(yè)導報;2000年
6 本報記者 楊子巖;一匹海外駿馬馳騁在喻家山[N];人民日報海外版;2011年
7 劉燕玲;中藥與基因功能調(diào)控[N];健康報;2003年
8 薛祖玲 王春;上海市自然科學牡丹獎揭曉[N];科技日報;2005年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 袁芳;基于基因功能信息預(yù)測疾病相關(guān)基因[D];華中科技大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前7條
1 虞佳;基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測算法[D];西安電子科技大學;2014年
2 陳穎;基于復(fù)雜網(wǎng)絡(luò)的疾病基因預(yù)測的研究[D];東北大學;2009年
3 滕明祥;基于蛋白質(zhì)互作網(wǎng)絡(luò)的疾病相關(guān)miRNA挖掘方法的研究[D];哈爾濱工業(yè)大學;2008年
4 李論;基于氨基酸使用偏好及基因功能信息預(yù)測疾病相關(guān)基因[D];華中科技大學;2008年
5 周權(quán)雄;疾病基因密碼子使用特征分析及致病基因預(yù)測[D];華中科技大學;2006年
6 李倩;與疾病相關(guān)的差異表達基因檢測[D];西安電子科技大學;2010年
7 王卉;蛋白質(zhì)編碼基因及遺傳疾病相關(guān)基因的預(yù)測[D];華中科技大學;2006年
本文關(guān)鍵詞:基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測算法,,由筆耕文化傳播整理發(fā)布。
本文編號:364935
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/364935.html