基于MongoDB的多源生物數(shù)據(jù)集成關(guān)鍵技術(shù)研究
發(fā)布時間:2021-04-27 16:36
隨著生命科學(xué)不斷發(fā)展,領(lǐng)域內(nèi)產(chǎn)生了更多的研究問題和數(shù)據(jù)需求,使得生命科學(xué)研究產(chǎn)生了前所未有的數(shù)量和類型的組學(xué)數(shù)據(jù),從而形成生物大數(shù)據(jù)。由于不同的研究技術(shù),產(chǎn)生的數(shù)據(jù)格式也各不相同。面對海量異構(gòu)生物數(shù)據(jù)的處理時,關(guān)系數(shù)據(jù)庫的瓶頸問題顯現(xiàn)出來—基于關(guān)系的固定模式和擴(kuò)展性差。數(shù)據(jù)模式靈活的NoSQL數(shù)據(jù)庫應(yīng)時而生,通過水平擴(kuò)展解決了大數(shù)據(jù)量所帶來的數(shù)據(jù)模式變更,其中MongoDB應(yīng)用最廣泛。因此,急需解決多源異構(gòu)數(shù)據(jù)庫從各種數(shù)據(jù)格式映射到JSON格式的問題,然后存儲到MongoDB上進(jìn)行查詢處理。本文主要研究了基于MongoDB的多源生物數(shù)據(jù)集成的關(guān)鍵技術(shù),對多源異構(gòu)的生物數(shù)據(jù)進(jìn)行集成,并通過MongoDB的存儲機(jī)制進(jìn)行管理。本文將從多源數(shù)據(jù)源的關(guān)聯(lián)模式發(fā)現(xiàn)、數(shù)據(jù)集成存儲和數(shù)據(jù)管理三個方面進(jìn)行研究。首先,確定選定的數(shù)據(jù)源及其數(shù)據(jù)格式,根據(jù)多層網(wǎng)絡(luò)理論知識結(jié)合自動關(guān)聯(lián)模式匹配算法,構(gòu)建層間節(jié)點連接矩陣。然后,設(shè)計不同數(shù)據(jù)格式(結(jié)構(gòu)化文本文件、XML、RDF和OWL)到JSON格式的映射規(guī)則和算法,并應(yīng)用MongoDB對JSON進(jìn)行存儲;谏鲜黾申P(guān)鍵技術(shù),本文研發(fā)了基于MongoDB的管理系...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 課題研究的背景
1.1.2 課題研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 國內(nèi)外現(xiàn)狀分析
1.3 本文的主要研究內(nèi)容
1.4 本文內(nèi)容安排
第2章 多源生物數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)
2.1 引言
2.2 多源生物數(shù)據(jù)獲取與整合
2.2.1 確定生物數(shù)據(jù)來源
2.2.2 數(shù)據(jù)源關(guān)聯(lián)關(guān)系整合
2.3 多層網(wǎng)絡(luò)構(gòu)建
2.4 本章小結(jié)
第3章 基于MONGODB的多源生物數(shù)據(jù)格式映射
3.1 引言
3.2 XML到JSON的映射規(guī)則和算法
3.2.1 映射規(guī)則
3.2.2 算法介紹
3.3 RDF到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.3.1 RDF圖模型解析過程
3.3.2 映射規(guī)則
3.3.3 算法介紹
3.4 OWL到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.4.1 OWL解析
3.4.2 基本語法映射
3.4.3 公理映射
3.4.4 算法介紹
3.5 結(jié)構(gòu)化數(shù)據(jù)到JSON的映射規(guī)則和映射算法
3.5.1 結(jié)構(gòu)化數(shù)據(jù)格式映射
3.5.2 模式未知數(shù)據(jù)映射
3.6 JSON數(shù)據(jù)的MONGODB存儲
3.7 本章小結(jié)
第4章 基于MONGODB的多源生物數(shù)據(jù)集成管理系統(tǒng)構(gòu)建
4.1 引言
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)功能結(jié)構(gòu)設(shè)計
4.3.1 數(shù)據(jù)集成模塊
4.3.2 數(shù)據(jù)轉(zhuǎn)換模塊
4.3.3 索引構(gòu)建模塊
4.3.4 關(guān)鍵字查詢模塊
4.3.5 高級查詢模塊
4.4 系統(tǒng)實現(xiàn)
4.4.1 數(shù)據(jù)集成模塊實現(xiàn)
4.4.2 數(shù)據(jù)轉(zhuǎn)換模塊實現(xiàn)
4.4.3 索引構(gòu)建模塊實現(xiàn)
4.4.4 關(guān)鍵字查詢模塊實現(xiàn)
4.4.5 高級查詢模塊實現(xiàn)
4.5 本章小結(jié)
第5章 實驗及結(jié)果分析
5.1 實驗環(huán)境
5.2 XML格式映射實驗
5.3 RDF格式映射實驗
5.4 OWL格式映射實驗
5.5 結(jié)構(gòu)化數(shù)據(jù)映射實驗
5.6 系統(tǒng)查詢實驗
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
【參考文獻(xiàn)】:
博士論文
[1]基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D]. 程亮.哈爾濱工業(yè)大學(xué) 2014
[2]生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問題研究[D]. 曹順良.復(fù)旦大學(xué) 2005
碩士論文
[1]基于異質(zhì)網(wǎng)絡(luò)的lncRNA-疾病關(guān)聯(lián)預(yù)測[D]. 李省.西安電子科技大學(xué) 2018
[2]基于網(wǎng)絡(luò)模型和多源數(shù)據(jù)集成預(yù)測長非編碼RNA-疾病關(guān)聯(lián)關(guān)系[D]. 賈成龍.西安電子科技大學(xué) 2017
[3]基于語義網(wǎng)的異構(gòu)生物數(shù)據(jù)集成研究[D]. 程建來.天津大學(xué) 2012
本文編號:3163803
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 課題研究的背景
1.1.2 課題研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 國內(nèi)外現(xiàn)狀分析
1.3 本文的主要研究內(nèi)容
1.4 本文內(nèi)容安排
第2章 多源生物數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)
2.1 引言
2.2 多源生物數(shù)據(jù)獲取與整合
2.2.1 確定生物數(shù)據(jù)來源
2.2.2 數(shù)據(jù)源關(guān)聯(lián)關(guān)系整合
2.3 多層網(wǎng)絡(luò)構(gòu)建
2.4 本章小結(jié)
第3章 基于MONGODB的多源生物數(shù)據(jù)格式映射
3.1 引言
3.2 XML到JSON的映射規(guī)則和算法
3.2.1 映射規(guī)則
3.2.2 算法介紹
3.3 RDF到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.3.1 RDF圖模型解析過程
3.3.2 映射規(guī)則
3.3.3 算法介紹
3.4 OWL到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.4.1 OWL解析
3.4.2 基本語法映射
3.4.3 公理映射
3.4.4 算法介紹
3.5 結(jié)構(gòu)化數(shù)據(jù)到JSON的映射規(guī)則和映射算法
3.5.1 結(jié)構(gòu)化數(shù)據(jù)格式映射
3.5.2 模式未知數(shù)據(jù)映射
3.6 JSON數(shù)據(jù)的MONGODB存儲
3.7 本章小結(jié)
第4章 基于MONGODB的多源生物數(shù)據(jù)集成管理系統(tǒng)構(gòu)建
4.1 引言
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)功能結(jié)構(gòu)設(shè)計
4.3.1 數(shù)據(jù)集成模塊
4.3.2 數(shù)據(jù)轉(zhuǎn)換模塊
4.3.3 索引構(gòu)建模塊
4.3.4 關(guān)鍵字查詢模塊
4.3.5 高級查詢模塊
4.4 系統(tǒng)實現(xiàn)
4.4.1 數(shù)據(jù)集成模塊實現(xiàn)
4.4.2 數(shù)據(jù)轉(zhuǎn)換模塊實現(xiàn)
4.4.3 索引構(gòu)建模塊實現(xiàn)
4.4.4 關(guān)鍵字查詢模塊實現(xiàn)
4.4.5 高級查詢模塊實現(xiàn)
4.5 本章小結(jié)
第5章 實驗及結(jié)果分析
5.1 實驗環(huán)境
5.2 XML格式映射實驗
5.3 RDF格式映射實驗
5.4 OWL格式映射實驗
5.5 結(jié)構(gòu)化數(shù)據(jù)映射實驗
5.6 系統(tǒng)查詢實驗
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
【參考文獻(xiàn)】:
博士論文
[1]基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D]. 程亮.哈爾濱工業(yè)大學(xué) 2014
[2]生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問題研究[D]. 曹順良.復(fù)旦大學(xué) 2005
碩士論文
[1]基于異質(zhì)網(wǎng)絡(luò)的lncRNA-疾病關(guān)聯(lián)預(yù)測[D]. 李省.西安電子科技大學(xué) 2018
[2]基于網(wǎng)絡(luò)模型和多源數(shù)據(jù)集成預(yù)測長非編碼RNA-疾病關(guān)聯(lián)關(guān)系[D]. 賈成龍.西安電子科技大學(xué) 2017
[3]基于語義網(wǎng)的異構(gòu)生物數(shù)據(jù)集成研究[D]. 程建來.天津大學(xué) 2012
本文編號:3163803
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3163803.html
最近更新
教材專著