基于表型-基因-藥物異構(gòu)網(wǎng)絡(luò)的藥物相關(guān)表型的預(yù)測
發(fā)布時間:2021-11-11 21:17
了解疾病表型與藥物間的關(guān)系是網(wǎng)絡(luò)醫(yī)學中的一個重要問題.隨著疾病表型和藥物相關(guān)數(shù)據(jù)的不斷豐富,科學家們提出了許多方法,用來挖掘這些數(shù)據(jù)中的生物信息.在現(xiàn)有的方法中,基于網(wǎng)絡(luò)的方法在識別不同生物實體間的相互作用關(guān)系上表現(xiàn)出其特有的優(yōu)勢.然而,這些基于網(wǎng)絡(luò)的方法大多以疾病網(wǎng)絡(luò)為中心,且很少考慮三種及三種以上的生物實體所構(gòu)成的網(wǎng)絡(luò).因此,直接用這些方法來識別疾病表型與藥物間的關(guān)系是不充分的,本文提出一種新的方法,稱為基于異構(gòu)網(wǎng)絡(luò)中疾病表型和藥物間最短路徑的相關(guān)性預(yù)測算法(RSP),并使用該方法來識別疾病表型和藥物關(guān)系.首先,該方法整合了來自三個不同類型的數(shù)據(jù)庫中的疾病表型、基因和藥物數(shù)據(jù),根據(jù)這些數(shù)據(jù),我們可以得到疾病表型和基因、藥物和蛋白質(zhì)靶標間的相互作用關(guān)系信息,基于所得到的信息構(gòu)建了包含三種不同生物實體間相互作用關(guān)系的異構(gòu)網(wǎng)絡(luò).從度分布、連通性及功能相似性等方面對構(gòu)成該異構(gòu)網(wǎng)絡(luò)的子網(wǎng)絡(luò)進行分析,探索了其與隨機網(wǎng)絡(luò)之間的差異性.然后,在該異構(gòu)網(wǎng)絡(luò)中,我們根據(jù)Dijkstra算法計算出疾病表型和藥物間的最短路徑長度,用于改進疾病表型類與藥物類間的相關(guān)性系數(shù),進而用于對具體的藥物和表型間的相關(guān)...
【文章來源】:河南大學河南省
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
圖1-1論文研究思路框架圖.??5??
?基于表型-基因-藥物異構(gòu)網(wǎng)絡(luò)的藥物相關(guān)表型的預(yù)測???和隊員;科學家和論文等.二分網(wǎng)絡(luò)具有普遍性,已經(jīng)成為復(fù)雜網(wǎng)絡(luò)研宄的重要對象.在??已有關(guān)于二分網(wǎng)絡(luò)的研宄工作中,通常的做法是把二分網(wǎng)絡(luò)投影到單頂點網(wǎng)絡(luò),然后進行??網(wǎng)絡(luò)分析.??(:???(b)?(5)?-7????''?廠-?,,/f?X,??④?A?6?⑦?/??v^m?/?.7-—,????@??■??圖2-1網(wǎng)絡(luò)圖示例.(a)加權(quán)無向網(wǎng)絡(luò).該圖包含6個不同節(jié)點,節(jié)點大小與節(jié)點度成正比,節(jié)點間??連邊的粗細與其對應(yīng)權(quán)重大小成正比;(b)無權(quán)有向網(wǎng)絡(luò).圖中包含6個不同節(jié)點,節(jié)點間連邊權(quán)重??都相等.連邊箭頭指向的節(jié)點為終點.e35?=?(u3,t;5)表示由節(jié)點3指向節(jié)點5的連邊.(c)二分網(wǎng)絡(luò).??X?=?{1,2,3,4,5,6丨,F?=?{7,8,9,10,11,12丨分別表示兩個獨立的點集,這兩個點集內(nèi)的節(jié)點間沒有連??邊.通過點集間的連邊將兩個點集連接形成一個二分網(wǎng)絡(luò).??定義2.1.3?M對于任意網(wǎng)絡(luò)G?=?(V,五),如果用映射函數(shù)¥?:?F?4?乂來表示節(jié)??點t;?e?y屬于節(jié)點類型集合丄e八用映射函數(shù)屯:£;?4?i?來表示每條邊??e?e五屬于邊的類型集合兄?屮⑷e凡如果兇>?1或者|i?|?>?1,則該網(wǎng)絡(luò)為異構(gòu)網(wǎng)??絡(luò)(Heterogeneous?Network).??根據(jù)定義2.1.3,異構(gòu)網(wǎng)絡(luò)就是將不同類型網(wǎng)絡(luò),通過網(wǎng)絡(luò)間的相關(guān)關(guān)系連接起來.如圖2-??l(c〇所示,節(jié)點集X和y可分別代表疾病表型和基因這兩個不同類型的節(jié)點集合,此時,??|川=2并且這兩個集合間通過同一類型的表型-基因連邊連接在一起(|丑|?
?第三章表型-基因-藥物異構(gòu)網(wǎng)絡(luò)的構(gòu)建???DrugBank??1266?//??圖3-1疾病表型、藥物、PPI數(shù)據(jù)來源示意圖.圖中外圈代表來源于不同數(shù)據(jù)庫的數(shù)據(jù)集合,內(nèi)圈??代表不同數(shù)據(jù)集合的相關(guān)子集;圓圈中的數(shù)字表示集合中元素的個數(shù).若兩個集合相交,表示這兩個??集合中有相同的元素;否則兩個集合內(nèi)的元素相互獨立.??3.1.2數(shù)據(jù)的整理及分類??己知OMIM數(shù)據(jù)庫是現(xiàn)有的包含有最完整的疾病表型-基因間相互作用關(guān)系的數(shù)據(jù)??庫,其中每個條目是由4個字段組成,分別為:疾病表型的名稱、相關(guān)的基因符號、其??相應(yīng)的OMIM編號和染色體的位置.根據(jù)這些字段的信息,我們隨后手工將所篩選出的??2,476種疾病表型劃分為22個主要表型類,這種分類是基于受疾病影響的生理系統(tǒng)M例??如,177種表型可構(gòu)成“癌癥”類別,84種疾病表型(如動脈粥樣硬化和中風)構(gòu)成“心血??管”類別.當一種表型影響多個生理系統(tǒng)時,我們根據(jù)受影響最大的系統(tǒng),將其分配到一??個主類;具有明顯多重臨床特征的表型被歸入“多重”類,有473種疾病表型屬于這一??類別.雖然疾病表型分類常常引起激烈的爭論,但偶爾的錯誤分類不會影響我們的結(jié)果.??對于剩余的56種疾病表型,由于沒有足夠的信息來進行明確的分類,因此我們將它們標??注為“無類別”類.最終,2,476種疾病表型都被標注為22種表型類中的一種,這22類??表型類分另lli己為:Endocrine,?Metabolic,?Immunological,?Skeletal,?Hematological,?Cancer,??Bone,?Ophthalmological,?Connective,?Developme
【參考文獻】:
期刊論文
[1]基于Floyd算法的多重最短路問題的改進算法[J]. 左秀峰,沈萬杰. 計算機科學. 2017(05)
[2]基于隨機重連的復(fù)雜網(wǎng)絡(luò)社團結(jié)構(gòu)特性分析[J]. 劉亞冰,汪小帆. 微型電腦應(yīng)用. 2010(11)
[3]氨氯地平與左旋氨氯地平治療夜間高血壓療效比較[J]. 劉國樹,王可,張明華. 醫(yī)學研究生學報. 2001(06)
[4]緩解期慢性阻塞性肺疾病患者的營養(yǎng)狀態(tài)與營養(yǎng)治療(現(xiàn)代呼吸系疾病系統(tǒng)講座第十二講)[J]. 林江濤. 中華結(jié)核和呼吸雜志. 1996(05)
本文編號:3489539
【文章來源】:河南大學河南省
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
圖1-1論文研究思路框架圖.??5??
?基于表型-基因-藥物異構(gòu)網(wǎng)絡(luò)的藥物相關(guān)表型的預(yù)測???和隊員;科學家和論文等.二分網(wǎng)絡(luò)具有普遍性,已經(jīng)成為復(fù)雜網(wǎng)絡(luò)研宄的重要對象.在??已有關(guān)于二分網(wǎng)絡(luò)的研宄工作中,通常的做法是把二分網(wǎng)絡(luò)投影到單頂點網(wǎng)絡(luò),然后進行??網(wǎng)絡(luò)分析.??(:???(b)?(5)?-7????''?廠-?,,/f?X,??④?A?6?⑦?/??v^m?/?.7-—,????@??■??圖2-1網(wǎng)絡(luò)圖示例.(a)加權(quán)無向網(wǎng)絡(luò).該圖包含6個不同節(jié)點,節(jié)點大小與節(jié)點度成正比,節(jié)點間??連邊的粗細與其對應(yīng)權(quán)重大小成正比;(b)無權(quán)有向網(wǎng)絡(luò).圖中包含6個不同節(jié)點,節(jié)點間連邊權(quán)重??都相等.連邊箭頭指向的節(jié)點為終點.e35?=?(u3,t;5)表示由節(jié)點3指向節(jié)點5的連邊.(c)二分網(wǎng)絡(luò).??X?=?{1,2,3,4,5,6丨,F?=?{7,8,9,10,11,12丨分別表示兩個獨立的點集,這兩個點集內(nèi)的節(jié)點間沒有連??邊.通過點集間的連邊將兩個點集連接形成一個二分網(wǎng)絡(luò).??定義2.1.3?M對于任意網(wǎng)絡(luò)G?=?(V,五),如果用映射函數(shù)¥?:?F?4?乂來表示節(jié)??點t;?e?y屬于節(jié)點類型集合丄e八用映射函數(shù)屯:£;?4?i?來表示每條邊??e?e五屬于邊的類型集合兄?屮⑷e凡如果兇>?1或者|i?|?>?1,則該網(wǎng)絡(luò)為異構(gòu)網(wǎng)??絡(luò)(Heterogeneous?Network).??根據(jù)定義2.1.3,異構(gòu)網(wǎng)絡(luò)就是將不同類型網(wǎng)絡(luò),通過網(wǎng)絡(luò)間的相關(guān)關(guān)系連接起來.如圖2-??l(c〇所示,節(jié)點集X和y可分別代表疾病表型和基因這兩個不同類型的節(jié)點集合,此時,??|川=2并且這兩個集合間通過同一類型的表型-基因連邊連接在一起(|丑|?
?第三章表型-基因-藥物異構(gòu)網(wǎng)絡(luò)的構(gòu)建???DrugBank??1266?//??圖3-1疾病表型、藥物、PPI數(shù)據(jù)來源示意圖.圖中外圈代表來源于不同數(shù)據(jù)庫的數(shù)據(jù)集合,內(nèi)圈??代表不同數(shù)據(jù)集合的相關(guān)子集;圓圈中的數(shù)字表示集合中元素的個數(shù).若兩個集合相交,表示這兩個??集合中有相同的元素;否則兩個集合內(nèi)的元素相互獨立.??3.1.2數(shù)據(jù)的整理及分類??己知OMIM數(shù)據(jù)庫是現(xiàn)有的包含有最完整的疾病表型-基因間相互作用關(guān)系的數(shù)據(jù)??庫,其中每個條目是由4個字段組成,分別為:疾病表型的名稱、相關(guān)的基因符號、其??相應(yīng)的OMIM編號和染色體的位置.根據(jù)這些字段的信息,我們隨后手工將所篩選出的??2,476種疾病表型劃分為22個主要表型類,這種分類是基于受疾病影響的生理系統(tǒng)M例??如,177種表型可構(gòu)成“癌癥”類別,84種疾病表型(如動脈粥樣硬化和中風)構(gòu)成“心血??管”類別.當一種表型影響多個生理系統(tǒng)時,我們根據(jù)受影響最大的系統(tǒng),將其分配到一??個主類;具有明顯多重臨床特征的表型被歸入“多重”類,有473種疾病表型屬于這一??類別.雖然疾病表型分類常常引起激烈的爭論,但偶爾的錯誤分類不會影響我們的結(jié)果.??對于剩余的56種疾病表型,由于沒有足夠的信息來進行明確的分類,因此我們將它們標??注為“無類別”類.最終,2,476種疾病表型都被標注為22種表型類中的一種,這22類??表型類分另lli己為:Endocrine,?Metabolic,?Immunological,?Skeletal,?Hematological,?Cancer,??Bone,?Ophthalmological,?Connective,?Developme
【參考文獻】:
期刊論文
[1]基于Floyd算法的多重最短路問題的改進算法[J]. 左秀峰,沈萬杰. 計算機科學. 2017(05)
[2]基于隨機重連的復(fù)雜網(wǎng)絡(luò)社團結(jié)構(gòu)特性分析[J]. 劉亞冰,汪小帆. 微型電腦應(yīng)用. 2010(11)
[3]氨氯地平與左旋氨氯地平治療夜間高血壓療效比較[J]. 劉國樹,王可,張明華. 醫(yī)學研究生學報. 2001(06)
[4]緩解期慢性阻塞性肺疾病患者的營養(yǎng)狀態(tài)與營養(yǎng)治療(現(xiàn)代呼吸系疾病系統(tǒng)講座第十二講)[J]. 林江濤. 中華結(jié)核和呼吸雜志. 1996(05)
本文編號:3489539
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/3489539.html
最近更新
教材專著