瘧原蟲分子功能注釋二級(jí)數(shù)據(jù)庫的構(gòu)建
本文關(guān)鍵詞:瘧原蟲分子功能注釋二級(jí)數(shù)據(jù)庫的構(gòu)建
更多相關(guān)文章: 瘧原蟲 功能注釋 二級(jí)數(shù)據(jù)庫 基因本體 通路 蛋白質(zhì)與蛋白質(zhì)相互作用
【摘要】:目的: (1)為了更好地對(duì)瘧原蟲分子機(jī)制研究過程中產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分子功能注釋分析,構(gòu)建瘧原蟲分子功能注釋數(shù)據(jù)庫PlasmoFADB。 (2)開發(fā)一個(gè)數(shù)據(jù)注釋結(jié)果界面友好直觀,分析過程簡便易行,相關(guān)數(shù)據(jù)庫高度整合,平臺(tái)擴(kuò)展性較強(qiáng)的生物信息學(xué)分析平臺(tái),為瘧原蟲研究相關(guān)科研工作者提供良好的高通量數(shù)據(jù)分析工具和平臺(tái)。 方法: (1)數(shù)據(jù)整合:PlasmoFADB數(shù)據(jù)庫整合多物種多類型數(shù)據(jù)。從GenBank、 Uniprot、 PubMed中下載整合物種的基本信息,作為基礎(chǔ)數(shù)據(jù)庫,從KEGG、BioCarta、 NCI-PID數(shù)據(jù)庫中下載整合物種的通路信息,從Gene Ontology下載基因本體信息,從dbSNP、DGV數(shù)據(jù)庫中下載整合物種的變異信息,從Agilent、Illumina、Affymetrix官網(wǎng)上下載探針信息,從JASPAR、ITFP數(shù)據(jù)庫中下載轉(zhuǎn)錄因子信息,從EPD數(shù)據(jù)庫中下載啟動(dòng)子信息,從HPRD、MINT數(shù)據(jù)庫中下載蛋白質(zhì)與蛋白質(zhì)相互作用信息,從nirBase、microma、EBI-MicroCosm、TargetScan數(shù)據(jù)庫中下載miRNA及靶基因信息,將以上下載的原始數(shù)據(jù)經(jīng)程序處理導(dǎo)入MySQL數(shù)據(jù)庫中,以用于構(gòu)建平臺(tái)。 (2)功能注釋:在GO2Gene、Pathway2Gene方向進(jìn)行注釋時(shí),調(diào)用Fisher's精確概率檢驗(yàn)算法程序?qū)崿F(xiàn)對(duì)注釋結(jié)果的富集分析或顯著性分析。在對(duì)蛋白質(zhì)相互作用結(jié)果(PPI)進(jìn)行圖形化描述時(shí),調(diào)用Graphviz工具。 (3)平臺(tái)實(shí)現(xiàn):以Windows XP SP3為服務(wù)器,MySQL為底層數(shù)據(jù)庫,根據(jù)解析后的數(shù)據(jù)進(jìn)行數(shù)據(jù)表設(shè)計(jì),采用Navicat for MySQL對(duì)數(shù)據(jù)庫進(jìn)行可視化管理。以Apache為網(wǎng)絡(luò)服務(wù)器,使用MyEclipse等軟件,基于J2EE技術(shù)和MVC的三層體系架構(gòu),以Java、JSP、HTML、XML、JavaScript、Ajax、Jquery Hibernate等語言或技術(shù)進(jìn)行編程開發(fā)瘧原蟲分子功能注釋平臺(tái)及相關(guān)插件。 結(jié)果: (1)PlasmoFADB數(shù)據(jù)庫設(shè)置多入口的分子注釋類型,包括ProbeID、GenelD、 SwissProtID等。 (2)使GO以GOTree的注釋形式展示,并對(duì)GO注釋結(jié)果進(jìn)行富集分析,用戶可從中選出富集效果較好的數(shù)據(jù)進(jìn)行下一步研究,支持注釋結(jié)果的自由下載。 (3)圖形化顯示蛋白質(zhì)與蛋白質(zhì)相互作用結(jié)果,使其注釋信息更加直觀明了。 (4)注釋分子在Pathway通路圖上的快速定位及圖形化顯示,并對(duì)注釋分子所影響的Pathway通路進(jìn)行顯著性分析,根據(jù)注釋結(jié)果判斷注釋分子對(duì)通路的影響作用。 (5)PlasmoFADB數(shù)據(jù)庫可對(duì)整合的部分物種進(jìn)行啟動(dòng)子、轉(zhuǎn)錄因子、靶基因及變異信息注釋。結(jié)論: (1)通過整合多種瘧原蟲蟲株及模式生物的注釋信息,構(gòu)建一個(gè)可對(duì)瘧原蟲高通量生物實(shí)驗(yàn)數(shù)據(jù)提供快速有效注釋的二級(jí)數(shù)據(jù)庫PlasmoFADB。 (2)為表達(dá)譜芯片數(shù)據(jù)分析提供了一個(gè)快速高效的注釋平臺(tái),為深入挖掘和理解模式生物和瘧原蟲分子機(jī)制研究中高通量數(shù)據(jù)生物學(xué)意義提供了有力的分析工具。 (3)本平臺(tái)對(duì)瘧原蟲研究和模式生物表達(dá)譜數(shù)據(jù)分析有很大實(shí)用價(jià)值,可有效促進(jìn)瘧原蟲基因功能、表達(dá)調(diào)控、通路等分子機(jī)制以及模式生物基因功能研究,也可以對(duì)瘧原蟲表達(dá)譜芯片探針的設(shè)計(jì)起到一定的參考作用。
【關(guān)鍵詞】:瘧原蟲 功能注釋 二級(jí)數(shù)據(jù)庫 基因本體 通路 蛋白質(zhì)與蛋白質(zhì)相互作用
【學(xué)位授予單位】:北京協(xié)和醫(yī)學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:R382.31;TP311.13
【目錄】:
- 中文摘要5-7
- Abstract7-9
- 第一部分 前言9-19
- 1.1 生物信息學(xué)及生物信息數(shù)據(jù)庫概述9-15
- 1.1.1 生物信息學(xué)概念9
- 1.1.2 生物信息學(xué)產(chǎn)生背景9-10
- 1.1.3 生物信息學(xué)主要研究內(nèi)容10-13
- 1.1.4 生物信息數(shù)據(jù)庫13-14
- 1.1.5 國內(nèi)外生物信息數(shù)據(jù)庫研究現(xiàn)狀14-15
- 1.2 瘧原蟲分子機(jī)制研究面臨的挑戰(zhàn)15-16
- 1.3 生物信息學(xué)在瘧原蟲分子機(jī)制研究中的應(yīng)用16-17
- 1.4 瘧原蟲分子功能注釋二級(jí)數(shù)據(jù)庫構(gòu)建問題提出17-19
- 第二部分 材料19-25
- 2.1 聚合物種(蟲株)信息19
- 2.2 聚合數(shù)據(jù)來源19-24
- 2.3 設(shè)備與軟件24-25
- 第三部分 方法25-32
- 3.1 主框架構(gòu)建25-27
- 3.2 數(shù)據(jù)解析27
- 3.3 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(jì)27-29
- 3.4 業(yè)務(wù)邏輯層實(shí)現(xiàn)29-31
- 3.5 結(jié)果展示層實(shí)現(xiàn)31-32
- 第四部分 結(jié)果32-41
- 4.1 PlasmoFADB分子功能注釋界面32-33
- 4.2 注釋結(jié)果展示33-41
- 4.2.1 注釋分子基本信息33-34
- 4.2.2 染色體定位信息34
- 4.2.3 GO功能注釋34-35
- 4.2.4 Pathway通路注釋35-37
- 4.2.5 蛋白質(zhì)與蛋白質(zhì)相互作用網(wǎng)絡(luò)37
- 4.2.6 啟動(dòng)子注釋37-38
- 4.2.7 轉(zhuǎn)錄因子注釋38
- 4.2.8 變異信息注釋38-40
- 4.2.9 靶基因注釋40-41
- 第五部分 分析與討論41-44
- 5.1 PlasmoFADB提供面向科研實(shí)踐的生物信息服務(wù)41
- 5.2 PlasmoFADB特點(diǎn)41-42
- 5.3 PlasmoFADB待完善之處42-44
- 5.3.1 數(shù)據(jù)庫更新機(jī)制42-43
- 5.3.2 數(shù)據(jù)功能模塊擴(kuò)展43-44
- 第六部分 結(jié)論44-45
- 第七部分 參考文獻(xiàn)45-50
- 第八部分 英文綜述50-57
- References55-57
- 第九部分 附錄(主要中英文對(duì)照表)57-60
- 第十部分 致謝60-61
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王正華,王勇獻(xiàn);后基因組時(shí)代生物信息學(xué)的新進(jìn)展[J];國防科技大學(xué)學(xué)報(bào);2003年01期
2 毛源澤;韋芳萍;王俊美;劉強(qiáng);;利用cvTree方法構(gòu)建及分析tRNA序列的親緣關(guān)系進(jìn)化網(wǎng)絡(luò)[J];基因組學(xué)與應(yīng)用生物學(xué);2011年04期
3 呼廣躍,沈世鎰;超級(jí)多重基因組序列比對(duì)算法[J];計(jì)算機(jī)工程與應(yīng)用;2005年27期
4 陳琦;王卓;魏冬青;;代謝網(wǎng)絡(luò)流分析進(jìn)展及應(yīng)用[J];科學(xué)通報(bào);2010年14期
5 李曉華;鄧偉;;基于數(shù)據(jù)集成的基因調(diào)控網(wǎng)絡(luò)構(gòu)建[J];計(jì)算機(jī)工程;2012年22期
6 朱偉民;朱云平;楊嘯林;;生命科學(xué)信息工程設(shè)施以及在中國的實(shí)現(xiàn)[J];中國科學(xué):生命科學(xué);2013年01期
7 宋雪梅;李宏濱;杜立新;;比較基因組學(xué)及其應(yīng)用[J];生命的化學(xué);2006年05期
8 劉偉;朱云平;賀福初;;系統(tǒng)生物學(xué)研究中不同組學(xué)數(shù)據(jù)的整合[J];中國生物化學(xué)與分子生物學(xué)報(bào);2007年12期
9 曹文君;李運(yùn)明;陳長生;;基因表達(dá)譜富集分析方法研究進(jìn)展[J];生物技術(shù)通訊;2008年06期
10 武妍;胡德華;;生物信息學(xué)跨學(xué)科研究[J];現(xiàn)代生物醫(yī)學(xué)進(jìn)展;2012年01期
,本文編號(hào):1045047
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/1045047.html