基于本體的海量數(shù)據(jù)融合的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于本體的海量數(shù)據(jù)融合的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著大數(shù)據(jù)時(shí)代的到來(lái),網(wǎng)絡(luò)中的數(shù)據(jù)量以前所未有的速度增長(zhǎng),網(wǎng)絡(luò)中的數(shù)據(jù)源也在以前所未有的規(guī)模增長(zhǎng),web2.0時(shí)代的到來(lái)使得每個(gè)人都成為了信息的發(fā)布者和消費(fèi)者。然而,數(shù)據(jù)源和數(shù)據(jù)量的極大豐富帶來(lái)的一個(gè)負(fù)面問(wèn)題就是搜索信息所花費(fèi)的時(shí)間開(kāi)銷不斷增大,雖然有高性能的搜索引擎的幫助,目前搜索引擎所能得到的僅僅是包含有關(guān)鍵詞的網(wǎng)頁(yè),至于真正有用信息的獲取還需要用戶來(lái)逐個(gè)進(jìn)行查找篩選。 本文對(duì)海量數(shù)據(jù)的融合及其并行化技術(shù)展開(kāi)了一系列的研究,旨在通過(guò)對(duì)海量的數(shù)據(jù)和多種數(shù)據(jù)源的分析,獲取以實(shí)體對(duì)象為基本單位的全面信息,通過(guò)對(duì)多個(gè)數(shù)據(jù)源中數(shù)據(jù)的分析來(lái)還原出實(shí)體對(duì)象的完整信息,向用戶提供完整高效的信息查詢服務(wù)。 本文首先在單機(jī)本體構(gòu)建流程的基礎(chǔ)上提出了并行化的本體構(gòu)建算法,在構(gòu)建好的本體的基礎(chǔ)上提出了并行化的本體融合過(guò)程,該過(guò)程采用基于人工指導(dǎo)的半自動(dòng)融合算法,由計(jì)算機(jī)來(lái)完成大量重復(fù)的融合計(jì)算。在得到的融合數(shù)據(jù)的基礎(chǔ)上,介紹了針對(duì)融合數(shù)據(jù)所進(jìn)行的復(fù)雜網(wǎng)絡(luò)分析,以一個(gè)或一組特定的對(duì)象為分析目標(biāo),采用迭代漸進(jìn)式的分析方法,發(fā)揮了融合數(shù)據(jù)所具有的多種信息的優(yōu)勢(shì),并將分析結(jié)果以可視化的方式直觀的展示出來(lái)。 最后,本文給出了基于本體的海量數(shù)據(jù)融合系統(tǒng)的原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。結(jié)合MapReduce框架對(duì)海量的數(shù)據(jù)預(yù)處理,并實(shí)現(xiàn)了MapReduce計(jì)算框架下的本體構(gòu)建與本體融合算法和復(fù)雜網(wǎng)絡(luò)分析算法,采用B/S的架構(gòu),借助于HTML5的強(qiáng)大功能和豐富的表現(xiàn)力,向用戶以最直觀的方式展示融合結(jié)果和分析結(jié)果。 本文將傳統(tǒng)的本體構(gòu)建方法與大數(shù)據(jù)分析相結(jié)合,提出了并行化的本體構(gòu)建與融合算法,實(shí)現(xiàn)了對(duì)于海量數(shù)據(jù)的高效分析與融合,并在此基礎(chǔ)上進(jìn)行了融合數(shù)據(jù)的應(yīng)用設(shè)計(jì).
【關(guān)鍵詞】:本體構(gòu)建 本體融合 數(shù)據(jù)融合 并行計(jì)算
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP202
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-16
- 1.1 選題背景及意義9-11
- 1.2 相關(guān)工作11-13
- 1.2.1 本體構(gòu)建11
- 1.2.2 并行計(jì)算11-12
- 1.2.3 實(shí)體消歧12-13
- 1.3 論文的研究?jī)?nèi)容13-15
- 1.4 論文組織結(jié)構(gòu)15-16
- 第二章 相關(guān)技術(shù)綜述16-24
- 2.1 本體介紹與應(yīng)用16-17
- 2.2 數(shù)據(jù)融合17-18
- 2.3 NoSQL非關(guān)系型數(shù)據(jù)庫(kù)18-20
- 2.4 Hadoop介紹20-23
- 2.4.1 MapReduce20-22
- 2.4.2 HDFS22-23
- 2.5 本章小結(jié)23-24
- 第三章 并行化本體的構(gòu)建與融合技術(shù)24-37
- 3.1 數(shù)據(jù)的預(yù)處理25-26
- 3.1.1 模塊描述25-26
- 3.1.2 具體流程26
- 3.2 單機(jī)環(huán)境下的本體構(gòu)建算法26-28
- 3.2.1 算法思想26-27
- 3.2.2 流程描述27-28
- 3.3 并行環(huán)境下的本體構(gòu)建算法28-30
- 3.3.1 算法思想28
- 3.3.2 流程描述28-29
- 3.3.3 本體的持久化29-30
- 3.4 并行環(huán)境下的本體融合算法30-36
- 3.4.1 算法思想30-33
- 3.4.2 流程描述33-35
- 3.4.3 同名實(shí)體消歧35-36
- 3.5 本章小結(jié)36-37
- 第四章 基于融合數(shù)據(jù)的對(duì)象關(guān)系分析37-47
- 4.1 對(duì)象關(guān)系網(wǎng)絡(luò)的提取37-39
- 4.2 事件驅(qū)動(dòng)的節(jié)點(diǎn)關(guān)系分析39-41
- 4.3 網(wǎng)絡(luò)基本參數(shù)計(jì)算41-46
- 4.3.1 節(jié)點(diǎn)的度42-43
- 4.3.2 網(wǎng)絡(luò)的集聚系數(shù)43-44
- 4.3.3 PageRank排序44-46
- 4.4 本章小結(jié)46-47
- 第五章 原型系統(tǒng)的架構(gòu)與功能設(shè)計(jì)47-52
- 5.1 系統(tǒng)的整體設(shè)計(jì)47-48
- 5.2 系統(tǒng)的詳細(xì)設(shè)計(jì)48-51
- 5.2.1 數(shù)據(jù)預(yù)處理48-49
- 5.2.2 并行化的本體構(gòu)建49-50
- 5.2.3 并行化的本體融合50-51
- 5.2.4 對(duì)象關(guān)系分析51
- 5.3 本章小結(jié)51-52
- 第六章 原型系統(tǒng)的實(shí)現(xiàn)52-70
- 6.1 程序各個(gè)模塊實(shí)現(xiàn)52-56
- 6.1.1 數(shù)據(jù)源鏈接與預(yù)處理模塊52
- 6.1.2 本體構(gòu)建模塊52-53
- 6.1.3 本體融合模塊53-54
- 6.1.4 關(guān)系分析模塊54-55
- 6.1.5 數(shù)據(jù)查詢模塊55-56
- 6.2 系統(tǒng)開(kāi)發(fā)與部署環(huán)境56
- 6.3 系統(tǒng)性能測(cè)試56-58
- 6.3.1 本體構(gòu)建的性能比較56-57
- 6.3.2 本體融合的性能比較57-58
- 6.4 系統(tǒng)效果展示58-69
- 6.4.1 數(shù)據(jù)預(yù)處理界面58-59
- 6.4.2 本體構(gòu)架界面59-61
- 6.4.3 本體融合界面61-63
- 6.4.4 關(guān)系網(wǎng)絡(luò)分析界面63-69
- 6.5 本章小結(jié)69-70
- 第七章 結(jié)束語(yǔ)70-72
- 7.1 論文的工作內(nèi)容70-71
- 7.2 下一步的工作展望71-72
- 參考文獻(xiàn)72-75
- 致謝75-76
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 郭黎;崔鐵軍;王玉海;盧晨琰;;多源空間數(shù)據(jù)融合技術(shù)探討[J];地理信息世界;2007年01期
2 王慶先;孫世新;尚明生;劉宴兵;;并行計(jì)算模型研究[J];計(jì)算機(jī)科學(xué);2004年09期
3 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期
4 李曉輝;王淑艷;;大數(shù)據(jù)及其挑戰(zhàn)[J];科技風(fēng);2012年23期
5 王志超;于劍;柴變芳;;基于集聚系數(shù)的鏈接社區(qū)發(fā)現(xiàn)方法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
6 ;第32次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[J];互聯(lián)網(wǎng)天地;2013年10期
7 丁晟春;李岳盟;甘利人;;基于頂層本體的領(lǐng)域本體綜合構(gòu)建方法研究[J];情報(bào)理論與實(shí)踐;2007年02期
8 杜文華;本體構(gòu)建方法比較研究[J];情報(bào)雜志;2005年10期
9 李曉輝;王盼卿;王寅龍;;基于本體的裝備領(lǐng)域信息集成研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
10 王光磊;;MongoDB數(shù)據(jù)庫(kù)的應(yīng)用研究和方案優(yōu)化[J];中國(guó)科技信息;2011年20期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 朱天;社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)角色以及群體演化研究[D];北京郵電大學(xué);2011年
2 張永新;面向Web數(shù)據(jù)集成的數(shù)據(jù)融合問(wèn)題研究[D];山東大學(xué);2012年
本文關(guān)鍵詞:基于本體的海量數(shù)據(jù)融合的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):393805
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/393805.html