基于邏輯回歸和局部結(jié)構(gòu)信息的蛋白質(zhì)功能模塊檢測算法的研究
發(fā)布時間:2021-07-06 16:45
蛋白質(zhì)功能模塊是通過相互作用或一起執(zhí)行某個特定的分子功能的蛋白質(zhì)組,對其探究有助于了解細(xì)胞進(jìn)程,生命活動和疾病機理。識別蛋白質(zhì)功能模塊是蛋白質(zhì)組學(xué)領(lǐng)域中一個非常熱門的研究方向,通過計算方法進(jìn)行蛋白質(zhì)模塊識別既可以節(jié)省大量的時間和資源,還能給出潛在的功能模塊。目前基于計算方法的蛋白質(zhì)功能模塊檢測方法可以分為兩類:有監(jiān)督的和無監(jiān)督的檢測方法。大多數(shù)的無監(jiān)督方法認(rèn)為蛋白質(zhì)功能模塊存在于PPI網(wǎng)絡(luò)圖中比較密集的區(qū)域。有監(jiān)督的方法則通過參考數(shù)據(jù)集的信息特征訓(xùn)練分類模型來指導(dǎo)功能模塊的識別,但是特征提取的不充分和PPI數(shù)據(jù)的噪聲都會導(dǎo)致分類模型不準(zhǔn)確。本文首先提出了一個基于邏輯回歸分類模型和局部結(jié)構(gòu)信息的打分函數(shù)。訓(xùn)練分類模型時,通過選取24個特征來提高分類模型的準(zhǔn)確度。將分類模型和局部結(jié)構(gòu)信息結(jié)合以降低PPI數(shù)據(jù)噪聲所帶來的負(fù)面影響。最后,基于該打分函數(shù)設(shè)計了新的功能模塊檢測算法。在四個大規(guī)模酵母數(shù)據(jù)集上與經(jīng)典的無監(jiān)督檢測方法進(jìn)行了對比實驗,實驗結(jié)果表明本文提出的算法在MMR值得分上高于其它算法,綜合得分大多數(shù)情況下也高于其他算法。還在五個酵母數(shù)據(jù)集上與經(jīng)典的有監(jiān)督檢測方法進(jìn)行了對比實驗,實驗結(jié)...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1蛋白質(zhì)相互作用網(wǎng)絡(luò)示意圖??Figure?2-1?The?illustration?of?PPI?network??
?相關(guān)背景知識??作用網(wǎng)絡(luò)的示意圖如圖2-1所示:????i??圖2-1蛋白質(zhì)相互作用網(wǎng)絡(luò)示意圖??Figure?2-1?The?illustration?of?PPI?network??一個PPI網(wǎng)絡(luò)可以被抽象地定義為一個圖像圖G=(V,E),其中V代表PPI網(wǎng)絡(luò)??中的蛋白質(zhì)節(jié)點,E代表蛋白質(zhì)節(jié)點中的連邊。圖G的權(quán)重可用來表示PPI網(wǎng)絡(luò)??中節(jié)點之間的拓?fù)浠蚬δ芴匦。PPI網(wǎng)絡(luò)是一種高度動態(tài)化和結(jié)構(gòu)化的復(fù)雜網(wǎng)絡(luò)。??它主要包含下面3個拓?fù)涮匦裕??(1)無尺度分布(scale-free?distribution)。我們定義《(^為度分布,它指的是??網(wǎng)絡(luò)中選定節(jié)點有K個連接的概率,如圖2-2所示:??^ ̄ ̄ ̄ ̄??4)????(〇)??????(b—???圖2-2網(wǎng)絡(luò)圖??Figure?2-2?The?graph?of?network??在圖2-2中,第一個星型網(wǎng)絡(luò)中節(jié)點的度為1和6,并不存在其他值。第二個??規(guī)則網(wǎng)絡(luò)的任意頂點度都相等。這兩個圖并沒有度分布。但在PPI網(wǎng)絡(luò)中的度分??布幾乎都符合冪律分布。如公式(2-1)所示:??n(k)=k'y?/?^(y)?(2-
?(2-2)??由此可知蛋白質(zhì)相互作用網(wǎng)絡(luò)正是一個符合冪律分布的無規(guī)模蛋白質(zhì)網(wǎng)絡(luò)[37]。如??圖2-3所示:??1?,?>?>k??10?100?1000???????0.01?.-??—?????0?001??????XX??KSMbn?BKX?X??0.0001??—???0.00001???????????-??-—????圖2-3酵母PPI網(wǎng)絡(luò)中節(jié)點的度分布??Figure?2-3?degree?distribution?of?nodes?in?Yeast?PPI?Networks??在圖2-3中,x軸為k值,y軸為度分布;10),圖中的直線為滿足度分布的最??佳擬合線。無尺度分布意味著PPI網(wǎng)絡(luò)中的絕大多數(shù)蛋白質(zhì)只是參與了一個或兩??個相互作用,而一小部分蛋白質(zhì)參與數(shù)十種相互作用形成了功能模塊。因此無尺??度分布特性使得PPI網(wǎng)絡(luò)圖更加穩(wěn)定[38]。??(2)
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢測的研究綜述[J]. 冀俊忠,劉志軍,劉紅欣,劉椿年. 自動化學(xué)報. 2014(04)
[2]蛋白質(zhì)相互作用信息的文本挖掘研究進(jìn)展[J]. 李滿生,劉齊軍,李棟,劉培磊,朱云平. 中國科學(xué):生命科學(xué). 2010(09)
[3]生物信息學(xué)的現(xiàn)狀與展望[J]. 張春霆. 世界科技研究與發(fā)展. 2000(06)
本文編號:3268603
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1蛋白質(zhì)相互作用網(wǎng)絡(luò)示意圖??Figure?2-1?The?illustration?of?PPI?network??
?相關(guān)背景知識??作用網(wǎng)絡(luò)的示意圖如圖2-1所示:????i??圖2-1蛋白質(zhì)相互作用網(wǎng)絡(luò)示意圖??Figure?2-1?The?illustration?of?PPI?network??一個PPI網(wǎng)絡(luò)可以被抽象地定義為一個圖像圖G=(V,E),其中V代表PPI網(wǎng)絡(luò)??中的蛋白質(zhì)節(jié)點,E代表蛋白質(zhì)節(jié)點中的連邊。圖G的權(quán)重可用來表示PPI網(wǎng)絡(luò)??中節(jié)點之間的拓?fù)浠蚬δ芴匦。PPI網(wǎng)絡(luò)是一種高度動態(tài)化和結(jié)構(gòu)化的復(fù)雜網(wǎng)絡(luò)。??它主要包含下面3個拓?fù)涮匦裕??(1)無尺度分布(scale-free?distribution)。我們定義《(^為度分布,它指的是??網(wǎng)絡(luò)中選定節(jié)點有K個連接的概率,如圖2-2所示:??^ ̄ ̄ ̄ ̄??4)????(〇)??????(b—???圖2-2網(wǎng)絡(luò)圖??Figure?2-2?The?graph?of?network??在圖2-2中,第一個星型網(wǎng)絡(luò)中節(jié)點的度為1和6,并不存在其他值。第二個??規(guī)則網(wǎng)絡(luò)的任意頂點度都相等。這兩個圖并沒有度分布。但在PPI網(wǎng)絡(luò)中的度分??布幾乎都符合冪律分布。如公式(2-1)所示:??n(k)=k'y?/?^(y)?(2-
?(2-2)??由此可知蛋白質(zhì)相互作用網(wǎng)絡(luò)正是一個符合冪律分布的無規(guī)模蛋白質(zhì)網(wǎng)絡(luò)[37]。如??圖2-3所示:??1?,?>?>k??10?100?1000???????0.01?.-??—?????0?001??????XX??KSMbn?BKX?X??0.0001??—???0.00001???????????-??-—????圖2-3酵母PPI網(wǎng)絡(luò)中節(jié)點的度分布??Figure?2-3?degree?distribution?of?nodes?in?Yeast?PPI?Networks??在圖2-3中,x軸為k值,y軸為度分布;10),圖中的直線為滿足度分布的最??佳擬合線。無尺度分布意味著PPI網(wǎng)絡(luò)中的絕大多數(shù)蛋白質(zhì)只是參與了一個或兩??個相互作用,而一小部分蛋白質(zhì)參與數(shù)十種相互作用形成了功能模塊。因此無尺??度分布特性使得PPI網(wǎng)絡(luò)圖更加穩(wěn)定[38]。??(2)
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢測的研究綜述[J]. 冀俊忠,劉志軍,劉紅欣,劉椿年. 自動化學(xué)報. 2014(04)
[2]蛋白質(zhì)相互作用信息的文本挖掘研究進(jìn)展[J]. 李滿生,劉齊軍,李棟,劉培磊,朱云平. 中國科學(xué):生命科學(xué). 2010(09)
[3]生物信息學(xué)的現(xiàn)狀與展望[J]. 張春霆. 世界科技研究與發(fā)展. 2000(06)
本文編號:3268603
本文鏈接:http://sikaile.net/shekelunwen/ljx/3268603.html
最近更新
教材專著