天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 基因論文 >

基于本體與基因網(wǎng)絡的致病基因預測研究

發(fā)布時間:2017-09-11 07:45

  本文關鍵詞:基于本體與基因網(wǎng)絡的致病基因預測研究


  更多相關文章: 本體 數(shù)據(jù)融合 致病因預測 隨機游走 有監(jiān)督隨機游走 拉普拉斯正規(guī)化


【摘要】:隨著人類基因組計劃的順利完成,出現(xiàn)了許多高通量技術預測基因功能的方法,但是從這些方法產生的大量的候選基因集合中檢測致病基因仍是一個十分艱巨的挑戰(zhàn),如果直接使用生物學實驗驗證則需要消耗大量人力物力。隨著數(shù)據(jù)的積累,人們逐漸發(fā)現(xiàn)致病基因具有模塊性,功能相同或者相似的基因編碼的蛋白質,在蛋白質相互作用網(wǎng)絡中相互靠近。利用已被證實的疾病和基因的關系,使用計算方法來預測候選致病基因通常能起到很好的效果,如計算候選基因和已知致病基因集合中的基因的相似性,然后根據(jù)相似性排名對候選基因進行排序,從而使生物學實驗有針對的對基因進行實驗驗證,降低檢測成本。本文主要以生物醫(yī)學本體為中心,整合了九種不同生物醫(yī)學數(shù)據(jù)庫,構建了由78786個生物學實體或概念組成的一個雙層異構網(wǎng)絡,這個網(wǎng)絡中包含本體術語之間的105875條有向邊,以及術語到基因,基因和基因之間組成的398642條無向邊。在構建網(wǎng)絡時,使用超級敘詞表等映射工具對九種數(shù)據(jù)庫中不同類型的標識進行轉換和去冗余;設計了一套整合不同關系證據(jù)類型的方案,根據(jù)邊的關系證據(jù)集合的不同,為每條邊賦予了不同的權值,最終構建的網(wǎng)絡為帶權的雙層異構網(wǎng)絡。依據(jù)網(wǎng)絡中邊的端點的不同,將邊分為了七個大類,并驗證了每一類的權值改變對基因預測最終的效果有直接影響,為每大類屬于的邊設置了一個特征向量,使用有監(jiān)督的隨機游走訓練每個大類的特征權值,使得組合的權值能夠更準確的進行致病基因預測,同時基于有監(jiān)督隨機游走算法,提出了拉普拉斯正規(guī)化的有監(jiān)督隨機游走,并在多次試驗后驗證了正規(guī)化的有監(jiān)督隨機游走在預測權值上優(yōu)于有監(jiān)督隨機游走,針對正規(guī)化算法復雜度過高的問題,提出了簡化版的正規(guī)化有監(jiān)督隨機游走。在構建的雙層異構網(wǎng)絡上分別進行隨機游走,有監(jiān)督隨機游走,簡化正規(guī)化隨機游走的驗證,最終有監(jiān)督隨機游走的AUC(Area Under roc Curve)比普通隨機游走提高了0.8%,正規(guī)化隨機游走AUC比普通隨機游走提高了2.3%。
【關鍵詞】:本體 數(shù)據(jù)融合 致病因預測 隨機游走 有監(jiān)督隨機游走 拉普拉斯正規(guī)化
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q811.4;TP391.1
【目錄】:
  • 摘要4-5
  • ABSTRACT5-8
  • 第1章 緒論8-13
  • 1.1 課題研究背景及意義8-9
  • 1.2 國內外研究現(xiàn)狀9-11
  • 1.3 本文主要研究內容及組織結構11-13
  • 1.3.1 主要研究內容11-12
  • 1.3.2 本文組織結構12-13
  • 第2章 致病基因預測方法概述13-19
  • 2.1 致病基因預測的主要流程13-14
  • 2.2 致病基因預測的主要方法14-18
  • 2.2.1 基于分子和網(wǎng)絡特征分類的方法14-15
  • 2.2.2 基于網(wǎng)絡節(jié)點相似度排序的方法15-18
  • 2.3 本章小結18-19
  • 第3章 本體基因數(shù)據(jù)整合和網(wǎng)絡構建19-34
  • 3.1 引言19-20
  • 3.2 生物醫(yī)學本體數(shù)據(jù)整合20-28
  • 3.2.1 本體論概述20-21
  • 3.2.2 生物醫(yī)學本體格式和關系抽取21-25
  • 3.2.3 本體注釋25-26
  • 3.2.4 疾病表型與基因關系數(shù)據(jù)26-28
  • 3.2.5 基因與基因關系數(shù)據(jù)28
  • 3.3 本體與基因網(wǎng)絡構建28-33
  • 3.3.1 統(tǒng)一標識映射28-30
  • 3.3.2 證據(jù)整合和網(wǎng)絡構建30-33
  • 3.4 本章小結33-34
  • 第4章 基于有監(jiān)督隨機游走的致病基因預測34-46
  • 4.1 引言34
  • 4.2 隨機游走模型概述34-35
  • 4.3 有返回的隨機游走35-36
  • 4.4 有監(jiān)督隨機游走36-39
  • 4.5 拉普拉斯正規(guī)化的有監(jiān)督隨機游走39-43
  • 4.5.1 基本原理39-41
  • 4.5.2 算法實現(xiàn)41-43
  • 4.6 加權有監(jiān)督隨機游走的致病基因預測43-45
  • 4.7 本章小結45-46
  • 第5章 實驗結果與分析46-55
  • 5.1 改進的有監(jiān)督隨機游走有效性驗證46-48
  • 5.2 實驗環(huán)境與實驗數(shù)據(jù)48-49
  • 5.3 實驗結果驗證方法和正負例生成49-50
  • 5.4 實驗結果50-54
  • 5.4.1 重啟概率的選擇50-52
  • 5.4.2 實驗結果對比52-54
  • 5.5 本章小結54-55
  • 結論55-56
  • 參考文獻56-61
  • 致謝61

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 陳堅;何潔月;;基于本體的生物信息集成技術發(fā)展現(xiàn)狀[J];計算機工程與科學;2006年12期

中國碩士學位論文全文數(shù)據(jù)庫 前1條

1 雋立然;基于生物醫(yī)學本體的生物信息數(shù)據(jù)庫集成方法研究[D];哈爾濱工業(yè)大學;2009年



本文編號:829494

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/829494.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶69817***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com