基于蛋白質(zhì)網(wǎng)絡(luò)的人類(lèi)遺傳致病基因預(yù)測(cè)算法研究
[Abstract]:Gene prediction of human genetic diseases is a hot issue in bioinformatics. With the completion of genome sequencing and the development of new generation sequencing technology, the data of gene and protein interaction network are increasing. These data are used to analyze and predict the genetic basis and molecular basis of human disease, which is of great practical significance to genomics and medicine. In this paper, according to the relationship between clinical description of genetic diseases and protein interaction network, we obtain relevant data. Firstly, we mine the online database of human genetic diseases by vector space model. The overlapping relationship between phenotypes of genetic diseases was calculated, and then a series of biological networks were constructed by using protein interaction relation data to calculate interaction score and disease protein correlation data to construct a series of biological networks. The disease phenotypes and protein network data were analyzed and the candidate disease genes were ranked and sequenced based on these network data to predict disease genes. In this paper, two new genetic prediction methods for human genetic diseases based on network are proposed. First, based on the traditional two-dimensional correlation probability model, two new probabilistic models based on multidimensional random variables, the central probabilistic model and the shape probabilistic model, are proposed. A mathematical model for predicting pathogenic genes based on multi-probability fusion is proposed. The other is regression analysis with filter function. By observing the data of network and probability model, summarizing the rule of data, adding biological hypothesis, the candidate gene is sorted by filtering function fusion regression analysis. The prediction model based on multi-probability fusion reflects the correlation law between phenotypic similarity and protein interaction on many levels by making comprehensive use of joint probability, center probability and shape probability. Compared with the traditional model based on single probability, the mathematical model can better reflect the real appearance of the biological system and has a stronger ability to predict disease genes. Another predictive model using filter function fusion regression analysis, based on reasonable biological assumptions, reflects the genetic association in disease phenotypic overlap, and can effectively rank many non-pathogenic genes at the back of the queue. The efficiency of the prediction method is improved effectively.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類(lèi)號(hào)】:R394
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 龔瑤琴;陳丙璽;姜源;鄭紅;魏建軍;邵常順;郭亦壽;;假性肥大型肌營(yíng)養(yǎng)不良癥散發(fā)頻率分析[J];中華醫(yī)學(xué)遺傳學(xué)雜志;1993年05期
2 ;十年后,你發(fā)胖的概率有多大[J];家庭護(hù)士;2006年05期
3 馬繼宏;醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本概念簡(jiǎn)介(續(xù)完) 臨床研究中對(duì)概率的理解與應(yīng)用[J];中國(guó)中醫(yī)眼科雜志;1995年03期
4 王新春;標(biāo)記關(guān)聯(lián)資料的疾病風(fēng)險(xiǎn)計(jì)算—血色病風(fēng)險(xiǎn)個(gè)體的應(yīng)用[J];國(guó)際遺傳學(xué)雜志;1985年06期
5 張艷娥,孫建平,曹艷霞;臨床診斷中的概率思想[J];數(shù)理醫(yī)藥學(xué)雜志;1999年02期
6 邱維勤;;單基因遺傳病[J];實(shí)用醫(yī)學(xué)雜志;1982年01期
7 張瑋祥;于佳;高謙;;從海分枝桿菌菌落形態(tài)變化篩選與毒力相關(guān)基因的方法[J];復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版);2009年05期
8 曹惠蘭;;不該生男孩的家庭[J];婚育與健康;1999年02期
9 張樹(shù)忠,周慶文,梅長(zhǎng)林;常染色體顯性遺傳型多囊腎病常用的基因診斷技術(shù)[J];中華腎臟病雜志;2000年04期
10 ;遺傳性乳光牙本質(zhì)致病基因的鑒定[J];中華醫(yī)學(xué)信息導(dǎo)報(bào);2002年02期
相關(guān)會(huì)議論文 前10條
1 伍淑瑜;梁美嬋;;三水近52年暴雨頻數(shù)的統(tǒng)計(jì)分析[A];第26屆中國(guó)氣象學(xué)會(huì)年會(huì)災(zāi)害天氣事件的預(yù)警、預(yù)報(bào)及防災(zāi)減災(zāi)分會(huì)場(chǎng)論文集[C];2009年
2 齊琳;李慧;陳英和;;雙獎(jiǎng)勵(lì)模型中兒童期望值判斷的發(fā)展特點(diǎn)[A];第十一屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
3 岳治國(guó);王利民;李晶;唐永順;;德?tīng)柗品ㄔ诠I(yè)園區(qū)環(huán)境風(fēng)險(xiǎn)評(píng)價(jià)中的應(yīng)用[A];2008中國(guó)環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)優(yōu)秀論文集(下卷)[C];2008年
4 陳小林;孔東民;王玉濤;;事務(wù)所規(guī)模、可操控應(yīng)計(jì)額與股票的知情交易概率[A];中國(guó)會(huì)計(jì)學(xué)會(huì)2011學(xué)術(shù)年會(huì)論文集[C];2011年
5 董杏燕;曹艷艷;;寧波市雷暴、強(qiáng)對(duì)流天氣潛勢(shì)概率預(yù)報(bào)[A];第26屆中國(guó)氣象學(xué)會(huì)年會(huì)災(zāi)害天氣事件的預(yù)警、預(yù)報(bào)及防災(zāi)減災(zāi)分會(huì)場(chǎng)論文集[C];2009年
6 顧曉琳;胡培亮;宋文濤;;多媒體DS-CDMA系統(tǒng)話音視頻業(yè)務(wù)性能分析[A];2002海峽兩岸三地?zé)o線科技研討會(huì)論文集[C];2002年
7 劉德朋;孫啟美;;一種變異概率的遺傳算法[A];第六屆中國(guó)青年運(yùn)籌與管理學(xué)者大會(huì)論文集[C];2004年
8 趙希人;彭秀艷;尹中鳳;;船舶橫向運(yùn)動(dòng)姿態(tài)及受擾卡爾曼估計(jì)的魯棒性能概率建模[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年
9 連傳杰;吳戈;;走向長(zhǎng)壁開(kāi)采時(shí)水平移動(dòng)規(guī)律的新研究[A];水電與礦業(yè)工程中的巖石力學(xué)問(wèn)題——中國(guó)北方巖石力學(xué)與工程應(yīng)用學(xué)術(shù)會(huì)議文集[C];1991年
10 王琮;趙冬巖;羅超;;基于概率的錨泊撞擊對(duì)海底管道埋深影響分析[A];2010年度海洋工程學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 劉 杰;中旬發(fā)動(dòng)行情概率加大[N];證券日?qǐng)?bào);2003年
2 長(zhǎng)江期貨 高華;LLDPE繼續(xù)走強(qiáng)概率大[N];中國(guó)證券報(bào);2010年
3 證券時(shí)報(bào)記者 巖雪;CPI溫和上揚(yáng) 近期加息概率不大[N];證券時(shí)報(bào);2010年
4 本報(bào)記者 林銘銘;近三月獲利概率90% 市場(chǎng)為“鋰”瘋狂[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2010年
5 西部證券 張煒玲;近期市場(chǎng)蓄勢(shì)整理概率較大[N];上海證券報(bào);2009年
6 渤海證券 徐華;央行大幅降息概率增大[N];證券時(shí)報(bào);2008年
7 記者 張忠安;市場(chǎng)短期回調(diào)概率加大[N];廣州日?qǐng)?bào);2009年
8 宋薇萍;金價(jià)創(chuàng)新高的概率達(dá)60%[N];市場(chǎng)報(bào);2008年
9 唐永梅 記者 張旗;從“概率瞄準(zhǔn)”到“精確打分”[N];解放軍報(bào);2009年
10 劉靜靜 本報(bào)記者 劉傳江;四舍五入 入比舍多一成概率[N];中國(guó)消費(fèi)者報(bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 張偉強(qiáng);法律制度的信息費(fèi)用問(wèn)題[D];山東大學(xué);2010年
2 于忠義;人類(lèi)早期不確定性推斷思想研究[D];天津財(cái)經(jīng)學(xué)院;2004年
3 胡藝;基于空間模型的小概率地理健康事件生態(tài)學(xué)研究[D];中國(guó)地質(zhì)大學(xué)(北京);2012年
4 林鵬飛;遺傳性痙攣性截癱和Charcot-Marie-Tooth病家系的臨床及致病基因分析[D];山東大學(xué);2011年
5 弓樹(shù)宏;電磁波在對(duì)流層中傳輸與散射若干問(wèn)題研究[D];西安電子科技大學(xué);2008年
6 鄧慧瓊;電網(wǎng)連鎖故障預(yù)測(cè)分析方法及其應(yīng)用研究[D];華北電力大學(xué)(北京);2007年
7 葛根;矩形薄板振動(dòng)的隨機(jī)分岔和可靠性研究[D];天津大學(xué);2009年
8 周昀箐;家族性先天性心臟病的致病基因研究[D];復(fù)旦大學(xué);2012年
9 唐立;Dirichlet問(wèn)題的概率數(shù)值方法[D];中南大學(xué);2003年
10 韓紅臣;價(jià)格系統(tǒng)的非線性動(dòng)力學(xué)研究與隨機(jī)梯度回歸分析[D];天津大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 王宗堯;基于蛋白質(zhì)網(wǎng)絡(luò)的人類(lèi)遺傳致病基因預(yù)測(cè)算法研究[D];哈爾濱工業(yè)大學(xué);2010年
2 楊帆;共享網(wǎng)絡(luò)中的實(shí)時(shí)任務(wù)可執(zhí)行概率研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
3 潘沁;卡爾納普概率確證理論探討[D];華中師范大學(xué);2003年
4 束加慶;深埋隧洞工程區(qū)初始地應(yīng)力場(chǎng)研究及圍巖穩(wěn)定分析[D];河海大學(xué);2006年
5 張曉琴;江蘇省高校畢業(yè)生就業(yè)焦慮預(yù)測(cè)因素分析[D];蘇州大學(xué);2005年
6 李丹;學(xué)習(xí)型文化對(duì)知識(shí)轉(zhuǎn)移過(guò)程的影響研究[D];大連理工大學(xué);2007年
7 馬艷英;主成分趨勢(shì)面方法在地質(zhì)異常中的應(yīng)用[D];吉林大學(xué);2008年
8 顏丙香;基于因子分析的商業(yè)銀行績(jī)效比較研究[D];中國(guó)海洋大學(xué);2007年
9 賴俊昆;江西省政府招商引資研究與對(duì)策分析[D];暨南大學(xué);2008年
10 王開(kāi)源;城市生活垃圾熱值計(jì)算模型研究[D];華中科技大學(xué);2007年
,本文編號(hào):2331934
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/2331934.html