天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基因網(wǎng)絡(luò)信息搜索引擎的構(gòu)建、優(yōu)化與應(yīng)用

發(fā)布時(shí)間:2017-06-09 12:14

  本文關(guān)鍵詞:基因網(wǎng)絡(luò)信息搜索引擎的構(gòu)建、優(yōu)化與應(yīng)用,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著高通量技術(shù)的迅速發(fā)展,各種類型的生物學(xué)研究海量數(shù)據(jù)產(chǎn)生,生物信息學(xué)與計(jì)算生物學(xué)也不斷發(fā)展相應(yīng)的理論和技術(shù)以剖析這些數(shù)據(jù)蘊(yùn)含的信息。然而理解和解釋復(fù)雜的生命現(xiàn)象仍然還是一個(gè)難題。生命活動(dòng)的過程及參與其中的因素是一個(gè)復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。研究生物學(xué)網(wǎng)絡(luò)(Biological Networks)是理解復(fù)雜生命活動(dòng)的一個(gè)關(guān)鍵。目前越來越多的與復(fù)雜性狀相關(guān)的候選基因或候選生物標(biāo)記正通過全基因組關(guān)聯(lián)分析(Genome-Wide Association Studies, GWAS)等手段挖掘出來,但是GWAS獲得的結(jié)果只能初步揭示可能的顯著效應(yīng)SNP與相關(guān)基因,后續(xù)仍有優(yōu)先排序(Prioritizing)、驗(yàn)證(Validating)等大量工作。我們?cè)噲D綜合現(xiàn)有的生物學(xué)網(wǎng)絡(luò)信息,建立一個(gè)統(tǒng)一各類型數(shù)據(jù)的高效、便捷、可靠、可拓展的可視化基因網(wǎng)絡(luò)搜索引擎,幫助對(duì)GwAS等統(tǒng)計(jì)分析結(jié)果的深入挖掘。以此,我們構(gòu)建了個(gè)整合多種生物網(wǎng)絡(luò)信息,同時(shí)具有存儲(chǔ)、搜索、可視化三種功能的基因網(wǎng)絡(luò)數(shù)據(jù)庫服務(wù)平臺(tái)Biopublnfo。我們以基因、蛋白質(zhì)、表型等生物學(xué)概念作為網(wǎng)絡(luò)中的節(jié)點(diǎn),以蛋白質(zhì)互作、基因調(diào)控、基因表型相關(guān)、生物學(xué)通路關(guān)系等作為網(wǎng)絡(luò)中的線,我們搜集下載了大量生物學(xué)的各類概念數(shù)據(jù)和關(guān)系數(shù)據(jù),并做了一系列格式標(biāo)準(zhǔn)化和關(guān)系分值標(biāo)準(zhǔn)化的工作,在這一過程中摸索出整合各類生物學(xué)數(shù)據(jù)的方法和關(guān)系類型的分類評(píng)分標(biāo)準(zhǔn)。生物學(xué)網(wǎng)絡(luò)數(shù)據(jù)的復(fù)雜性和海量性,對(duì)搜索引擎平臺(tái)的存儲(chǔ)、計(jì)算性能和穩(wěn)定性都提出了巨大的挑戰(zhàn)。我們對(duì)平臺(tái)的硬件系統(tǒng)、操作系統(tǒng)、搜索引擎服務(wù)框架和用戶交互界面都進(jìn)行了一系列的調(diào)整優(yōu)化,建立了一個(gè)穩(wěn)定可靠、快速響應(yīng)、用戶友好的系統(tǒng)。 這一平臺(tái)建立后,我們可以高效地利用多維度的基因網(wǎng)絡(luò)對(duì)全基因組關(guān)聯(lián)分析檢測(cè)到的候選基因進(jìn)行優(yōu)先排序,驗(yàn)證,以及深度生物信息挖掘。我們分別對(duì)二型糖尿病和尼古丁依賴數(shù)據(jù)進(jìn)行了全基因組關(guān)聯(lián)分析,并利用BiopubInfo這一平臺(tái)對(duì)鑒定的候選基因進(jìn)行后續(xù)分析。二型糖尿病是一種典型的復(fù)雜疾病,對(duì)人體的健康和壽命有很大的影響。對(duì)二型糖尿病的基因調(diào)控和生物代謝過程的深入研究,能夠?qū)︻A(yù)防和治療二型糖尿病發(fā)揮積極的作用。我們利用GMDR-GPU程序分析了WTCCC的二型糖尿病數(shù)據(jù),獲取了一到五維的二型糖尿病關(guān)聯(lián)SNPs。對(duì)這些SNPs分析后發(fā)現(xiàn)六個(gè)候選基因。進(jìn)一步對(duì)這六個(gè)候選基因進(jìn)行生物學(xué)網(wǎng)絡(luò)信息分析,發(fā)現(xiàn)其中三個(gè)基因已有研究報(bào)道與二型糖尿病及其相關(guān)性狀有關(guān)聯(lián),其余的三個(gè)基因?yàn)樾掳l(fā)現(xiàn)的二型糖尿病相關(guān)基因,它們與這三個(gè)基因有大量的生物學(xué)關(guān)聯(lián),為驗(yàn)證統(tǒng)計(jì)分析結(jié)果提供了佐證,也從另一個(gè)角度解釋了為何只能在多維的SNP分析中才找到這三個(gè)基因。尼古丁是成癮性非常高的一種毒品,依賴尼古丁的人群戒煙有很大的困難,尼古丁依賴的程度也受基因和環(huán)境的影響。我們利用QTXNetwork對(duì)來自dbGAP的尼古丁依賴數(shù)據(jù)進(jìn)行了全基因組關(guān)聯(lián)分析,我們還用其它四種毒品的成癮數(shù)據(jù)分別對(duì)尼古丁依賴做了條件定位分析。我們把條件分析和非條件分析得到的三組基因分別進(jìn)行了整合生物網(wǎng)絡(luò)信息的分析,觀察到了三種具有明顯差異的網(wǎng)絡(luò)模式,因而在一定程度上揭示了條件分析的有效性和必要性。我們也從網(wǎng)絡(luò)圖中找到一些證據(jù),可解釋為何有些基因在互作中才表現(xiàn)出效應(yīng)。通過對(duì)這兩項(xiàng)實(shí)例分析,說明了我們開發(fā)的基因網(wǎng)絡(luò)搜索平臺(tái)可為GWAS領(lǐng)域的后續(xù)分析和結(jié)果驗(yàn)證提供幫助。
【關(guān)鍵詞】:生物網(wǎng)絡(luò) 基因網(wǎng)絡(luò) 數(shù)據(jù)庫 全基因組關(guān)聯(lián)分析
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4
【目錄】:
  • 致謝6-7
  • 摘要7-9
  • Abstract9-14
  • 圖表目錄14-15
  • 1 緒論15-25
  • 1.1 研究目的和意義15-16
  • 1.2 生物學(xué)網(wǎng)絡(luò)信息數(shù)據(jù)庫概覽16-23
  • 1.2.1 生物數(shù)據(jù)庫的整合17-18
  • 1.2.2 生物網(wǎng)絡(luò)概念和分類18-21
  • 1.2.3 生物信息的可視化21
  • 1.2.4 典型的可視化生物網(wǎng)絡(luò)數(shù)據(jù)庫21-23
  • 1.3 研究方法和流程23-25
  • 2 基因網(wǎng)絡(luò)信息搜索引擎BiopubInfo的構(gòu)建25-55
  • 2.1 概念數(shù)據(jù)的構(gòu)建方法和流程25-27
  • 2.1.1 物種25-26
  • 2.1.2 基因和蛋白質(zhì)26
  • 2.1.3 化合物和藥物26
  • 2.1.4 其他概念信息26-27
  • 2.2 關(guān)系數(shù)據(jù)的構(gòu)建方法和流程27-39
  • 2.2.1 生物學(xué)通路與基因的關(guān)系數(shù)據(jù)30-31
  • 2.2.2 基因共表達(dá)網(wǎng)絡(luò)31-39
  • 2.3 搜索引擎服務(wù)框架的構(gòu)建39-43
  • 2.3.1 硬件和操作系統(tǒng)39-40
  • 2.3.2 圖數(shù)據(jù)庫40-42
  • 2.3.3 Web服務(wù)和網(wǎng)頁前端42-43
  • 2.4 BiopubInfo界面和使用簡(jiǎn)介43-49
  • 2.4.1 搜索方式43-44
  • 2.4.2 結(jié)果展示44-49
  • 2.4.3 導(dǎo)出功能49
  • 2.5 BiopubInfo的優(yōu)化49-52
  • 2.5.1 展示界面和搜索結(jié)果優(yōu)化50-51
  • 2.5.2 系統(tǒng)服務(wù)優(yōu)化51-52
  • 2.6 討論52-55
  • 3 全基因組關(guān)聯(lián)分析及結(jié)果的驗(yàn)證和挖掘55-73
  • 3.1 引言55-56
  • 3.2 二型糖尿病全基因組關(guān)聯(lián)分析結(jié)果的驗(yàn)證和挖掘56-64
  • 3.2.1 引言56-58
  • 3.2.2 數(shù)據(jù)來源和統(tǒng)計(jì)分析結(jié)果58-60
  • 3.2.3 應(yīng)用BiopubInfo進(jìn)行驗(yàn)證與挖掘60-63
  • 3.2.4 討論63-64
  • 3.3 尼古丁依賴的全基因組關(guān)聯(lián)分析結(jié)果的驗(yàn)證和挖掘64-73
  • 3.3.1 引言64-65
  • 3.3.2 數(shù)據(jù)和統(tǒng)計(jì)分析結(jié)果65-69
  • 3.3.3 BiupubInfo的驗(yàn)證與挖掘結(jié)果69-71
  • 3.3.4 討論71-73
  • 參考文獻(xiàn)73-83
  • 個(gè)人簡(jiǎn)歷83-84
  • 附件84

【參考文獻(xiàn)】

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 朱智宏;遺傳分析方法和軟件開發(fā)及其應(yīng)用[D];浙江大學(xué);2012年


  本文關(guān)鍵詞:基因網(wǎng)絡(luò)信息搜索引擎的構(gòu)建、優(yōu)化與應(yīng)用,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):435424

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/435424.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1688c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com