基于基因功能信息預(yù)測(cè)疾病相關(guān)基因
發(fā)布時(shí)間:2017-12-30 12:31
本文關(guān)鍵詞:基于基因功能信息預(yù)測(cè)疾病相關(guān)基因 出處:《華中科技大學(xué)》2008年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 生物信息學(xué) 疾病基因 基因本體 文本挖掘 候選基因 相似性 表型
【摘要】:疾病的發(fā)生是遺傳因素與環(huán)境因素共同作用的結(jié)果。發(fā)現(xiàn)疾病的致病基因是理解疾病致病原因、協(xié)助臨床判斷及預(yù)防診治的基礎(chǔ),因此尋找疾病基因是后基因時(shí)代的重要目標(biāo)。如何對(duì)連鎖分析或基因組關(guān)聯(lián)分析所得定位區(qū)域中的眾多基因進(jìn)行疾病基因的鳳險(xiǎn)評(píng)估是尋找疾病基因的關(guān)鍵問題之一。近幾年,已經(jīng)有很多研究者提出了許多基于基因信息的疾病基因的預(yù)測(cè)軟件和在線工具。研究發(fā)現(xiàn),當(dāng)前用于疾病基因預(yù)測(cè)的信息資源中最具有預(yù)測(cè)效力的數(shù)據(jù)是基因功能相關(guān)信息,但是目前已有的基于基因GO功能信息的方法并沒有充分的利用GO之間的結(jié)構(gòu)關(guān)系,使得基于功能GO的預(yù)測(cè)方法在性能還有很大的提升空間。 本文首先提出一個(gè)新的基于已知疾病基因功能注釋信息的預(yù)測(cè)疾病基因的方法。它利用不同GO在DAG中的最短距離來分析待測(cè)基因的GO與已知致病基因的GO之間的相似性,對(duì)待測(cè)定位區(qū)間候選致病基因進(jìn)行評(píng)分,按得分高低進(jìn)行排序。基于OMIM數(shù)據(jù)庫(kù)中可用的最大數(shù)據(jù)集對(duì)這個(gè)方法進(jìn)行評(píng)估,68.5%的疾病基因排名前10%。 但是目前還有很多疾病沒有已知致病基因,或者已知致病基因沒有注釋信息,以上的方法不能對(duì)這樣的疾病進(jìn)行疾病基因的預(yù)測(cè)。對(duì)這種缺少基因功能注釋的疾病,本文提出另一個(gè)新的疾病基因預(yù)測(cè)方法。它結(jié)合文本挖掘技術(shù)和上面方法中的GO功能相似性分析方法來實(shí)現(xiàn)對(duì)這種疾病的候選致病基因的預(yù)測(cè)。預(yù)測(cè)的過程是:首先,基于生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù),利用文本挖掘技術(shù)獲取疾病相關(guān)表形信息,并結(jié)合人類基因產(chǎn)物蛋白質(zhì)的功能注釋,獲取疾病表型與GO注釋之間的關(guān)聯(lián);然后利用以上方法中的GO相似性算法,對(duì)所有候選基因進(jìn)行打分排列。這個(gè)方法主要適用于沒有已知疾病基因的疾病的致病基因的預(yù)測(cè),作為已有的一些通常的利用已知疾病基因信息的預(yù)測(cè)方法的補(bǔ)充方法,可以更全面的對(duì)人類遺傳疾病進(jìn)行致病基因的預(yù)測(cè)。 目前疾病基因預(yù)測(cè)的方法,包括以上提出的方法,主要集中在對(duì)基因信息的分析研究上,很少有人從相似疾病表型的角度進(jìn)行分析。本文通過挖掘生物醫(yī)學(xué)文獻(xiàn)對(duì)疾病表型進(jìn)行標(biāo)準(zhǔn)化,然后計(jì)算表型之間相似性,并對(duì)相似性進(jìn)行分析,結(jié)果顯示這些表型相似性與其功能注釋之間存在正向關(guān)系,即相似度高的表型的致病基因基因,在功能上的確具有較高的相似性特征。顯然,相似度高的疾病表型也可以應(yīng)用到疾病基因的預(yù)測(cè)中。 在實(shí)際預(yù)測(cè)的時(shí)候,可能只知道待測(cè)的疾病表型和待測(cè)的區(qū)間,而不知道該疾病是否已經(jīng)有已知的致病基因或GO功能注釋。為了解決這個(gè)問題,我們?cè)黾右粋(gè)判定模塊,整合以上兩個(gè)方法,開發(fā)了一個(gè)新的疾病候選基因預(yù)測(cè)工具CDGMiner,既能對(duì)已有已知致病基因功能信息的疾病,也能對(duì)還沒有已知致病基因或其已知致病基因沒有具體功能注釋的疾病進(jìn)行候選區(qū)間的致病基因預(yù)測(cè)。
[Abstract]:......
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2008
【分類號(hào)】:R363
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 ;Predicting disease genes for familial dilated cardiomyopathy based on the codon usage bias[J];Chinese Science Bulletin;2005年18期
2 張奎星,朱鼎良,黃薇;多基因遺傳病基因研究的策略和方法[J];生理科學(xué)進(jìn)展;2001年03期
3 沈巖;致病基因的定位候選克隆[J];生命科學(xué);1999年05期
,本文編號(hào):1354967
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/1354967.html
最近更新
教材專著