基于MongoDB的多源生物數(shù)據(jù)集成關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2021-04-27 16:36
隨著生命科學(xué)不斷發(fā)展,領(lǐng)域內(nèi)產(chǎn)生了更多的研究問(wèn)題和數(shù)據(jù)需求,使得生命科學(xué)研究產(chǎn)生了前所未有的數(shù)量和類型的組學(xué)數(shù)據(jù),從而形成生物大數(shù)據(jù)。由于不同的研究技術(shù),產(chǎn)生的數(shù)據(jù)格式也各不相同。面對(duì)海量異構(gòu)生物數(shù)據(jù)的處理時(shí),關(guān)系數(shù)據(jù)庫(kù)的瓶頸問(wèn)題顯現(xiàn)出來(lái)—基于關(guān)系的固定模式和擴(kuò)展性差。數(shù)據(jù)模式靈活的NoSQL數(shù)據(jù)庫(kù)應(yīng)時(shí)而生,通過(guò)水平擴(kuò)展解決了大數(shù)據(jù)量所帶來(lái)的數(shù)據(jù)模式變更,其中MongoDB應(yīng)用最廣泛。因此,急需解決多源異構(gòu)數(shù)據(jù)庫(kù)從各種數(shù)據(jù)格式映射到JSON格式的問(wèn)題,然后存儲(chǔ)到MongoDB上進(jìn)行查詢處理。本文主要研究了基于MongoDB的多源生物數(shù)據(jù)集成的關(guān)鍵技術(shù),對(duì)多源異構(gòu)的生物數(shù)據(jù)進(jìn)行集成,并通過(guò)MongoDB的存儲(chǔ)機(jī)制進(jìn)行管理。本文將從多源數(shù)據(jù)源的關(guān)聯(lián)模式發(fā)現(xiàn)、數(shù)據(jù)集成存儲(chǔ)和數(shù)據(jù)管理三個(gè)方面進(jìn)行研究。首先,確定選定的數(shù)據(jù)源及其數(shù)據(jù)格式,根據(jù)多層網(wǎng)絡(luò)理論知識(shí)結(jié)合自動(dòng)關(guān)聯(lián)模式匹配算法,構(gòu)建層間節(jié)點(diǎn)連接矩陣。然后,設(shè)計(jì)不同數(shù)據(jù)格式(結(jié)構(gòu)化文本文件、XML、RDF和OWL)到JSON格式的映射規(guī)則和算法,并應(yīng)用MongoDB對(duì)JSON進(jìn)行存儲(chǔ);谏鲜黾申P(guān)鍵技術(shù),本文研發(fā)了基于MongoDB的管理系...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 課題研究的背景
1.1.2 課題研究的目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外現(xiàn)狀分析
1.3 本文的主要研究?jī)?nèi)容
1.4 本文內(nèi)容安排
第2章 多源生物數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)
2.1 引言
2.2 多源生物數(shù)據(jù)獲取與整合
2.2.1 確定生物數(shù)據(jù)來(lái)源
2.2.2 數(shù)據(jù)源關(guān)聯(lián)關(guān)系整合
2.3 多層網(wǎng)絡(luò)構(gòu)建
2.4 本章小結(jié)
第3章 基于MONGODB的多源生物數(shù)據(jù)格式映射
3.1 引言
3.2 XML到JSON的映射規(guī)則和算法
3.2.1 映射規(guī)則
3.2.2 算法介紹
3.3 RDF到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.3.1 RDF圖模型解析過(guò)程
3.3.2 映射規(guī)則
3.3.3 算法介紹
3.4 OWL到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.4.1 OWL解析
3.4.2 基本語(yǔ)法映射
3.4.3 公理映射
3.4.4 算法介紹
3.5 結(jié)構(gòu)化數(shù)據(jù)到JSON的映射規(guī)則和映射算法
3.5.1 結(jié)構(gòu)化數(shù)據(jù)格式映射
3.5.2 模式未知數(shù)據(jù)映射
3.6 JSON數(shù)據(jù)的MONGODB存儲(chǔ)
3.7 本章小結(jié)
第4章 基于MONGODB的多源生物數(shù)據(jù)集成管理系統(tǒng)構(gòu)建
4.1 引言
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)功能結(jié)構(gòu)設(shè)計(jì)
4.3.1 數(shù)據(jù)集成模塊
4.3.2 數(shù)據(jù)轉(zhuǎn)換模塊
4.3.3 索引構(gòu)建模塊
4.3.4 關(guān)鍵字查詢模塊
4.3.5 高級(jí)查詢模塊
4.4 系統(tǒng)實(shí)現(xiàn)
4.4.1 數(shù)據(jù)集成模塊實(shí)現(xiàn)
4.4.2 數(shù)據(jù)轉(zhuǎn)換模塊實(shí)現(xiàn)
4.4.3 索引構(gòu)建模塊實(shí)現(xiàn)
4.4.4 關(guān)鍵字查詢模塊實(shí)現(xiàn)
4.4.5 高級(jí)查詢模塊實(shí)現(xiàn)
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 XML格式映射實(shí)驗(yàn)
5.3 RDF格式映射實(shí)驗(yàn)
5.4 OWL格式映射實(shí)驗(yàn)
5.5 結(jié)構(gòu)化數(shù)據(jù)映射實(shí)驗(yàn)
5.6 系統(tǒng)查詢實(shí)驗(yàn)
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
【參考文獻(xiàn)】:
博士論文
[1]基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D]. 程亮.哈爾濱工業(yè)大學(xué) 2014
[2]生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問(wèn)題研究[D]. 曹順良.復(fù)旦大學(xué) 2005
碩士論文
[1]基于異質(zhì)網(wǎng)絡(luò)的lncRNA-疾病關(guān)聯(lián)預(yù)測(cè)[D]. 李省.西安電子科技大學(xué) 2018
[2]基于網(wǎng)絡(luò)模型和多源數(shù)據(jù)集成預(yù)測(cè)長(zhǎng)非編碼RNA-疾病關(guān)聯(lián)關(guān)系[D]. 賈成龍.西安電子科技大學(xué) 2017
[3]基于語(yǔ)義網(wǎng)的異構(gòu)生物數(shù)據(jù)集成研究[D]. 程建來(lái).天津大學(xué) 2012
本文編號(hào):3163803
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 課題研究的背景
1.1.2 課題研究的目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外現(xiàn)狀分析
1.3 本文的主要研究?jī)?nèi)容
1.4 本文內(nèi)容安排
第2章 多源生物數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)
2.1 引言
2.2 多源生物數(shù)據(jù)獲取與整合
2.2.1 確定生物數(shù)據(jù)來(lái)源
2.2.2 數(shù)據(jù)源關(guān)聯(lián)關(guān)系整合
2.3 多層網(wǎng)絡(luò)構(gòu)建
2.4 本章小結(jié)
第3章 基于MONGODB的多源生物數(shù)據(jù)格式映射
3.1 引言
3.2 XML到JSON的映射規(guī)則和算法
3.2.1 映射規(guī)則
3.2.2 算法介紹
3.3 RDF到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.3.1 RDF圖模型解析過(guò)程
3.3.2 映射規(guī)則
3.3.3 算法介紹
3.4 OWL到JSON的映射規(guī)則和轉(zhuǎn)換算法
3.4.1 OWL解析
3.4.2 基本語(yǔ)法映射
3.4.3 公理映射
3.4.4 算法介紹
3.5 結(jié)構(gòu)化數(shù)據(jù)到JSON的映射規(guī)則和映射算法
3.5.1 結(jié)構(gòu)化數(shù)據(jù)格式映射
3.5.2 模式未知數(shù)據(jù)映射
3.6 JSON數(shù)據(jù)的MONGODB存儲(chǔ)
3.7 本章小結(jié)
第4章 基于MONGODB的多源生物數(shù)據(jù)集成管理系統(tǒng)構(gòu)建
4.1 引言
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)功能結(jié)構(gòu)設(shè)計(jì)
4.3.1 數(shù)據(jù)集成模塊
4.3.2 數(shù)據(jù)轉(zhuǎn)換模塊
4.3.3 索引構(gòu)建模塊
4.3.4 關(guān)鍵字查詢模塊
4.3.5 高級(jí)查詢模塊
4.4 系統(tǒng)實(shí)現(xiàn)
4.4.1 數(shù)據(jù)集成模塊實(shí)現(xiàn)
4.4.2 數(shù)據(jù)轉(zhuǎn)換模塊實(shí)現(xiàn)
4.4.3 索引構(gòu)建模塊實(shí)現(xiàn)
4.4.4 關(guān)鍵字查詢模塊實(shí)現(xiàn)
4.4.5 高級(jí)查詢模塊實(shí)現(xiàn)
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 XML格式映射實(shí)驗(yàn)
5.3 RDF格式映射實(shí)驗(yàn)
5.4 OWL格式映射實(shí)驗(yàn)
5.5 結(jié)構(gòu)化數(shù)據(jù)映射實(shí)驗(yàn)
5.6 系統(tǒng)查詢實(shí)驗(yàn)
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
【參考文獻(xiàn)】:
博士論文
[1]基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D]. 程亮.哈爾濱工業(yè)大學(xué) 2014
[2]生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問(wèn)題研究[D]. 曹順良.復(fù)旦大學(xué) 2005
碩士論文
[1]基于異質(zhì)網(wǎng)絡(luò)的lncRNA-疾病關(guān)聯(lián)預(yù)測(cè)[D]. 李省.西安電子科技大學(xué) 2018
[2]基于網(wǎng)絡(luò)模型和多源數(shù)據(jù)集成預(yù)測(cè)長(zhǎng)非編碼RNA-疾病關(guān)聯(lián)關(guān)系[D]. 賈成龍.西安電子科技大學(xué) 2017
[3]基于語(yǔ)義網(wǎng)的異構(gòu)生物數(shù)據(jù)集成研究[D]. 程建來(lái).天津大學(xué) 2012
本文編號(hào):3163803
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3163803.html
最近更新
教材專著