基于網(wǎng)絡(luò)結(jié)構(gòu)推理和拓撲相似性的致病基因預(yù)測算法
本文選題:網(wǎng)絡(luò)結(jié)構(gòu)推理 + 二部圖。 參考:《安徽大學(xué)》2017年碩士論文
【摘要】:現(xiàn)階段,研究者們發(fā)現(xiàn)幾乎所有的疾病都與基因有一定的關(guān)聯(lián),如何迅速地找到疾病的致病基因?qū)λ醒芯空邆儊碚f是一項很大的挑戰(zhàn)。早期,研究者大多使用傳統(tǒng)生物實驗的方法來進行致病基因的預(yù)測,比如連鎖分析和關(guān)聯(lián)研究。近幾年來,研究者們開始大量使用生物信息學(xué)中的計算方法,并通過基于網(wǎng)絡(luò)結(jié)構(gòu)方法來解決該難題。然而,大多數(shù)方法在推理過程中僅僅使用了網(wǎng)絡(luò)結(jié)構(gòu)中的局部網(wǎng)絡(luò)信息,并且僅限于推理單一基因的關(guān)聯(lián)。此外,這些方法很少或幾乎沒有考慮到疾病與基因關(guān)聯(lián)網(wǎng)絡(luò)中的網(wǎng)絡(luò)拓撲相似性。本文結(jié)合生物信息學(xué)和數(shù)據(jù)挖掘領(lǐng)域中的相關(guān)知識,使用了 OMIM(Online MendelianInheritance inMan,OMIM)數(shù)據(jù)庫中的203個疾病數(shù)據(jù)作為實驗的數(shù)據(jù)集來進行致病基因的預(yù)測。本文主要的研究內(nèi)容和創(chuàng)新工作概述如下:1.為了預(yù)測致病基因,本文首次引入二部圖網(wǎng)絡(luò)結(jié)構(gòu)推理(Network-Based Inference,NBI)算法。具體的步驟如下:首先,構(gòu)建疾病和基因的關(guān)聯(lián)二部圖網(wǎng)絡(luò);其次,利用物質(zhì)熱擴散原理將基因上的初始化資源擴散到疾病上;最后,再將疾病上的資源擴散到基因上。上述操作結(jié)束后將會獲取到候選基因的資源向量,并對資源向量按值大小排序進而預(yù)測潛在致病基因。在使用OMIM數(shù)據(jù)集中的203個疾病數(shù)據(jù)作為最終的實驗數(shù)據(jù),通過留一交叉驗證實驗來證明該算法的有效性。2.針對二部圖網(wǎng)絡(luò)結(jié)構(gòu)推理的算法,提出了一種基于網(wǎng)絡(luò)拓撲相似性的改進算法,稱為 INBI(Improved Network-Based Inference,INBI)算法。首先,分別計算網(wǎng)絡(luò)拓撲相似性,本文通過使用高斯核函數(shù)來計算基因網(wǎng)絡(luò)的拓撲性和疾病網(wǎng)絡(luò)的拓撲相似性;其次,分別構(gòu)建疾病鄰接矩陣和基因鄰接矩陣;然后,預(yù)測致病基因的相關(guān)性分?jǐn)?shù);最后,根據(jù)相關(guān)性分?jǐn)?shù)進行排序從而預(yù)測潛在的致病基因。在進行對比實驗結(jié)果的分析后,可以得出INBI算法具有優(yōu)越的性能。
[Abstract]:At present, researchers have found that almost all diseases are related to genes, and how to quickly find the disease-causing genes is a great challenge to all researchers. In the early days, researchers mostly used traditional biological experiments to predict pathogenic genes, such as linkage analysis and association studies. In recent years, researchers have begun to use a large number of computational methods in bioinformatics and solve the problem based on network structure. However, most of the methods only use the local network information in the network structure in the reasoning process, and only infer the association of a single gene. In addition, these methods rarely or hardly take into account the network topology similarity between disease and gene associated networks. Combining the related knowledge in the field of bioinformatics and data mining, 203 disease data in the OMIM(Online MendelianInheritance in Manmim database are used as experimental data sets to predict the pathogenic genes. The main research contents and innovative work of this paper are summarized as follows: 1. In order to predict the pathogenic genes, the bipartite graph network structure inference (NBI) algorithm is introduced for the first time in this paper. The specific steps are as follows: first, construct the bipartite network of disease and gene association; secondly, use the principle of material thermal diffusion to spread the initial resources on the gene to disease; finally, spread the disease resources to the gene. The resource vector of candidate gene will be obtained after the operation and the resource vector will be sorted according to the value to predict the potential pathogenic gene. Using 203 disease data in the OMIM dataset as the final experimental data, the validity of the algorithm is proved by a cross-validation experiment. In this paper, an improved algorithm based on network topology similarity is proposed for bipartite graph network structure reasoning, which is called INBI(Improved Network-Based reference algorithm. Firstly, the topological similarity of the network is calculated, and the topological similarity of the gene network and the disease network is calculated by using Gao Si kernel function. Secondly, the disease adjacency matrix and the gene adjacency matrix are constructed respectively. The correlation score of pathogenic gene is predicted. Finally, the potential pathogenic gene is predicted by sequencing according to the correlation score. After comparing the experimental results, it can be concluded that the INBI algorithm has superior performance.
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:R3416;TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 ;我國科學(xué)家發(fā)現(xiàn)房顫致病基因[J];中國臨床康復(fù);2003年09期
2 ;上?茖W(xué)家發(fā)現(xiàn)一智障致病基因[J];生物學(xué)教學(xué);2012年12期
3 王丹;周敬華;曹學(xué)兵;;常染色體隱性遺傳肢帶型肌營養(yǎng)不良癥致病基因研究進展[J];國際神經(jīng)病學(xué)神經(jīng)外科學(xué)雜志;2007年03期
4 ;華裔博士楊平發(fā)現(xiàn)肺癌致病基因[J];養(yǎng)生大世界;2010年05期
5 劉文玲,胡大一;家族性預(yù)激綜合征致病基因的發(fā)現(xiàn)[J];中國心臟起搏與心電生理雜志;2001年06期
6 余家駒;智力為何與某些疾病伴生?——德系猶太人的高智商可能與他們帶有的某些致病基因有關(guān)[J];世界科學(xué);2005年07期
7 任翔,梁直厚,姚淇,劉木根;肢帶型肌營養(yǎng)不良一家系致病基因排除性定位[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2005年09期
8 沈軼;曹國凡;蔣沁;;原發(fā)性開角型青光眼三個致病基因的研究進展[J];眼視光學(xué)雜志;2008年02期
9 丁華新,楊曉蘇;兒童型脊髓性肌萎縮癥致病基因的研究進展[J];中國當(dāng)代兒科雜志;2003年03期
10 李謀,余利紅,劉小林,孫志賢,張成崗;原發(fā)性紅斑性肢痛癥致病基因研究進展[J];國外醫(yī)學(xué).遺傳學(xué)分冊;2005年04期
相關(guān)會議論文 前10條
1 康曉靜;唐小輝;;表皮松解性掌跖角化病一維吾爾家系致病基因研究[A];中華醫(yī)學(xué)會第十五次全國皮膚性病學(xué)術(shù)會議論文集[C];2009年
2 卓業(yè)鴻;李秀梅;段山;侯飛;王梅;李亮;葛堅;;廣東普寧原發(fā)性開角型青光眼候選致病基因和臨床特征的研究[A];中華醫(yī)學(xué)會第十二屆全國眼科學(xué)術(shù)大會論文匯編[C];2007年
3 何君;王培光;楊春俊;楊森;張學(xué)軍;;原發(fā)性紅斑肢痛癥致病基因研究進展[A];中華醫(yī)學(xué)會第14次全國皮膚性病學(xué)術(shù)年會論文匯編[C];2008年
4 鄭多;潘乾;劉征;席興華;劉小平;胡正茂;夏昆;夏家輝;;一個常染色體顯性遺傳視網(wǎng)膜色素變性家系致病基因的定位與鑒定[A];中國的遺傳學(xué)研究——中國遺傳學(xué)會第七次代表大會暨學(xué)術(shù)討論會論文摘要匯編[C];2003年
5 崔勇;楊森;高敏;陳建軍;嚴(yán)開林;肖風(fēng)麗;王培光;張學(xué)軍;;進行性對稱性紅斑角化癥致病基因的染色體定位[A];中華醫(yī)學(xué)會第十二次全國皮膚性病學(xué)術(shù)會議論文集[C];2006年
6 王玉萍;楊康鵑;;先天性特發(fā)性眼球震顫致病基因研究現(xiàn)狀[A];東北三省及內(nèi)蒙古地區(qū)遺傳學(xué)研究進展學(xué)術(shù)研討會論文匯編[C];2009年
7 張向陽;溫景敏;楊威;王程;高魯娜;鄭良宏;周專;姚鏡;張學(xué);劉靜宇;;一個新的疼痛致病基因鑒定與分子致病機制研究[A];第十二次全國醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)會議論文匯編[C];2014年
8 翟猛;林鵬飛;毛飛;孫文杰;劉奇跡;焉傳祝;龔瑤琴;;遺傳性痙攣性截癱家系致病基因突變分析[A];第十二次全國醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)會議論文匯編[C];2014年
9 杜鵑;沈璐;唐北沙;;新的AD-HSP致病基因初步定位研究[A];中華醫(yī)學(xué)會第十三次全國神經(jīng)病學(xué)學(xué)術(shù)會議論文匯編[C];2010年
10 夏憶;柯鐵;吳小艷;金潤銘;;先天性長QT綜合征治病基因的研究進展[A];中華醫(yī)學(xué)會第十七次全國兒科學(xué)術(shù)大會論文匯編(下冊)[C];2012年
相關(guān)重要報紙文章 前10條
1 記者 唐先武;我科學(xué)家發(fā)現(xiàn)三個反常性痤瘡致病基因[N];科技日報;2010年
2 記者 葉又紅;中外攜手尋找致病基因[N];文匯報;2000年
3 通訊員 萬霞 張雯怡 記者 劉志偉;我科學(xué)家發(fā)現(xiàn)特發(fā)性基底節(jié)鈣化致病基因[N];科技日報;2012年
4 黃敏;非煙民為何患肺癌?致病基因已找到[N];新華每日電訊;2010年
5 盧蘇燕;中法科學(xué)家發(fā)現(xiàn)房顫致病基因——KCNQ1[N];經(jīng)濟參考報;2003年
6 蔚然;中國科學(xué)家首次發(fā)現(xiàn)房顫致病基因[N];山東科技報;2003年
7 記者褚寧;首次發(fā)現(xiàn):房顫致病基因[N];解放日報;2003年
8 馮立中 朱梅福;“花手花臉”致病基因藏身染色體[N];健康報;2003年
9 記者 高翔;我國專家克隆出顱內(nèi)鈣化致病基因[N];健康報;2012年
10 記者田泓;我科學(xué)家發(fā)現(xiàn)家族性心房顫動致病基因[N];人民日報;2003年
相關(guān)博士學(xué)位論文 前10條
1 戴禮猛;先天性并指(趾)畸形和先天性厚甲癥家系致病基因鑒定及功能研究[D];第三軍醫(yī)大學(xué);2015年
2 邸亞男;全外顯子組測序鑒定RP致病基因EYS新突變及PCG候選致病基因功能研究[D];重慶醫(yī)科大學(xué);2016年
3 吳舜堯;基于復(fù)雜網(wǎng)絡(luò)的致病基因檢測研究[D];青島大學(xué);2014年
4 谷峰;遺傳性白內(nèi)障致病基因的定位及其突變分析[D];中國協(xié)和醫(yī)科大學(xué);2006年
5 劉奇跡;Smith-Fineman-Myers綜合征致病基因的精細定位及候選基因分析[D];山東大學(xué);2005年
6 姜yN群;遺傳性對稱性色素異常癥致病基因的定位和突變研究[D];中國協(xié)和醫(yī)科大學(xué);2004年
7 張?zhí)鞎?兩種遺傳性眼病致病基因的定位與突變研究[D];中國醫(yī)科大學(xué);2008年
8 劉嘉利;三例遺傳性牙本質(zhì)發(fā)育不全Ⅱ型家系致病基因的定位研究[D];中國人民解放軍第四軍醫(yī)大學(xué);2003年
9 柳青;遺傳性對稱性色素異常癥致病基因的突變鑒定和功能分析[D];中國協(xié)和醫(yī)科大學(xué);2005年
10 王英;遺傳性牙本質(zhì)發(fā)育不全Ⅱ型致病基因的定位與克隆[D];第四軍醫(yī)大學(xué);2001年
相關(guān)碩士學(xué)位論文 前10條
1 方明宏;基于熱擴散模型的致病基因預(yù)測方法研究[D];華中師范大學(xué);2015年
2 周元珂;基于人類基因連接組的視網(wǎng)膜色素變異致病基因預(yù)測[D];青島大學(xué);2015年
3 曾磊;全基因組外顯子測序搜尋一例家族性進行性色素沉著和色素減退家系的致病基因[D];安徽醫(yī)科大學(xué);2016年
4 張攀;肝癌重測序數(shù)據(jù)整合以及肝癌關(guān)鍵致病基因的研究[D];華東師范大學(xué);2016年
5 韋貞樂;基于基因網(wǎng)絡(luò)的致病基因預(yù)測算法研究[D];哈爾濱工業(yè)大學(xué);2016年
6 魯磊;基于網(wǎng)絡(luò)結(jié)構(gòu)推理和拓撲相似性的致病基因預(yù)測算法[D];安徽大學(xué);2017年
7 劉笑逸;基于異構(gòu)網(wǎng)絡(luò)模型的致病基因預(yù)測算法[D];西安電子科技大學(xué);2013年
8 劉青;基于相互作用網(wǎng)絡(luò)的致病基因預(yù)測方法研究[D];中南大學(xué);2013年
9 高次子;一原發(fā)性開角型青光眼家系的臨床特點及致病基因的篩查[D];安徽醫(yī)科大學(xué);2011年
10 鄭甄甄;原發(fā)性開角型青光眼大家系致病基因篩查研究[D];福建醫(yī)科大學(xué);2014年
,本文編號:1844357
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/1844357.html