天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

大規(guī)模語義數(shù)據(jù)存儲(chǔ)優(yōu)化方案研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2024-03-16 04:56
  隨著RDF數(shù)據(jù)的迅猛增長,RDF語義數(shù)據(jù)集總量已超過800億,作為W3C標(biāo)準(zhǔn)之一,RDF數(shù)據(jù)的應(yīng)用愈加廣泛,涉及多種領(lǐng)域。面對(duì)大規(guī)模語義數(shù)據(jù),傳統(tǒng)的搜索引擎在實(shí)時(shí)性方面能力不足,同時(shí),基于搜索引擎直接獲取富含語義信息的知識(shí)集合面臨著很大挑戰(zhàn),因此,針對(duì)語義數(shù)據(jù)的管理,近年來涌現(xiàn)出不少RDF語義數(shù)據(jù)管理平臺(tái),例如jena-tdb、gStore、RDF-3X等等。但由于語義數(shù)據(jù)的爆炸式增長,現(xiàn)有的主流RDF管理平臺(tái)主要面臨著面向大規(guī)模數(shù)據(jù)處理能力不足,語義查詢有效性較低等問題。本文提出了一種面向大規(guī)模語義數(shù)據(jù)知識(shí)圖譜分布式管理方案,通過最大網(wǎng)格構(gòu)建索引,利用并行計(jì)算框架實(shí)現(xiàn)對(duì)知識(shí)圖譜高效地語義查詢。為提高對(duì)存儲(chǔ)空間的利用,本文提出采用哈希碼對(duì)語義數(shù)據(jù)編碼。為提高語義查詢的有效性,本文在RDF語義圖中挖掘最大網(wǎng)格,然后基于最大網(wǎng)格構(gòu)建知識(shí)圖譜索引結(jié)構(gòu)。為實(shí)現(xiàn)大規(guī)模語義數(shù)據(jù)的分布式管理,本文采用DBSCAN聚類算法實(shí)現(xiàn)分布式數(shù)據(jù)劃分,將整個(gè)RDF語義圖劃分為多個(gè)RDF語義子圖。本文采用BORDER邊界點(diǎn)檢測(cè)算法識(shí)別語義子圖邊界點(diǎn),從而實(shí)現(xiàn)邊界點(diǎn)關(guān)系數(shù)據(jù)在多個(gè)節(jié)點(diǎn)中的存儲(chǔ),滿足跨節(jié)點(diǎn)語義查詢的數(shù)...

【文章頁數(shù)】:77 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語對(duì)照表
第一章 緒論
    1.1 研究背景與意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 國外研究現(xiàn)狀
        1.2.2 國內(nèi)研究現(xiàn)狀
    1.3 論文工作內(nèi)容
    1.4 論文組織結(jié)構(gòu)
第二章 數(shù)據(jù)管理基礎(chǔ)理論與技術(shù)
    2.1 大規(guī)模RDF數(shù)據(jù)管理
        2.1.1 基于關(guān)系的RDF數(shù)據(jù)管理方法
        2.1.2 基于圖的RDF數(shù)據(jù)管理方法
    2.2 大規(guī)模數(shù)據(jù)聚類
        2.2.1 聚類分析概述
        2.2.2 聚類算法分類
    2.3 本章小結(jié)
第三章 基于最大網(wǎng)格的大規(guī)模數(shù)據(jù)索引構(gòu)建方法
    3.1 問題分析與解決方案
        3.1.1 問題分析
        3.1.2 解決方案
    3.2 知識(shí)圖譜構(gòu)建過程
        3.2.1 哈希編碼
        3.2.2 基于哈希碼的編碼模式
        3.2.3 最大網(wǎng)格挖掘算法
        3.2.4 知識(shí)圖譜索引構(gòu)建
    3.3 基于DBSCAN聚類算法的數(shù)據(jù)劃分
        3.3.1 數(shù)據(jù)劃分方式選擇
        3.3.2 聚類算法選擇
    3.4 本章小結(jié)
第四章 基于分布式計(jì)算的大規(guī)模數(shù)據(jù)管理
    4.1 跨節(jié)點(diǎn)數(shù)據(jù)冗余存儲(chǔ)
        4.1.1 邊界點(diǎn)檢測(cè)算法
        4.1.2 邊界點(diǎn)關(guān)系數(shù)據(jù)冗余存儲(chǔ)
    4.2 基于CLARANS聚類算法的可達(dá)實(shí)體擴(kuò)展
        4.2.1 聚類算法選擇
        4.2.2 聚類擴(kuò)展可達(dá)實(shí)體
    4.3 基于SPARQL查詢的查詢引擎構(gòu)建
        4.3.1 查詢場(chǎng)景分類
        4.3.2 查詢模式構(gòu)建
    4.4 分布式解決方案
    4.5 本章小結(jié)
第五章 實(shí)驗(yàn)與結(jié)果分析
    5.1 實(shí)驗(yàn)準(zhǔn)備工作
        5.1.1 實(shí)驗(yàn)環(huán)境
        5.1.2 實(shí)驗(yàn)數(shù)據(jù)集
        5.1.3 實(shí)驗(yàn)度量標(biāo)準(zhǔn)
    5.2 實(shí)驗(yàn)過程
        5.2.1 基于哈希碼的語義數(shù)據(jù)編碼
        5.2.2 基于最大網(wǎng)格挖掘算法的索引構(gòu)建
        5.2.3 基于DBSCAN聚類算法的數(shù)據(jù)劃分
        5.2.4 基于CLARANS聚類算法的可達(dá)實(shí)體擴(kuò)展
        5.2.5 基于SPARQL查詢的語義數(shù)據(jù)查詢
    5.3 實(shí)驗(yàn)結(jié)果分析
    5.4 本章小結(jié)
第六章 結(jié)束語
    6.1 論文工作總結(jié)
    6.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介



本文編號(hào):3929146

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3929146.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c9ac3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com