天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 水利工程論文 >

水務(wù)知識(shí)圖譜構(gòu)建的技術(shù)研究與系統(tǒng)實(shí)現(xiàn)

發(fā)布時(shí)間:2020-04-02 10:29
【摘要】:隨著水利信息的發(fā)展,水務(wù)數(shù)據(jù)存在的多源異構(gòu)性和數(shù)據(jù)量龐大等問題越來越嚴(yán)重。北京市水務(wù)局內(nèi)部擁有大量結(jié)構(gòu)化監(jiān)測(cè)數(shù)據(jù)和非結(jié)構(gòu)化文本數(shù)據(jù),且數(shù)據(jù)存儲(chǔ)位置多樣化,除此之外網(wǎng)絡(luò)上也存在大量水務(wù)相關(guān)數(shù)據(jù)。需要從對(duì)象分類層面以及數(shù)據(jù)類型層面對(duì)這些數(shù)據(jù)進(jìn)行整合,從而進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)的共享以便于水務(wù)相關(guān)人員查詢數(shù)據(jù)。基于當(dāng)前水務(wù)數(shù)據(jù)的分布和用戶對(duì)綜合數(shù)據(jù)的需求,有必要開發(fā)一種能夠集成大量多源異構(gòu)數(shù)據(jù)并進(jìn)行應(yīng)用的模型。利用知識(shí)圖譜,可以進(jìn)行數(shù)據(jù)的整合以及知識(shí)的可視化和信息推薦。因此,面對(duì)上述這些情況,本文需要尋找針對(duì)于水務(wù)數(shù)據(jù)的知識(shí)圖譜的構(gòu)建方法,從而建立一個(gè)水務(wù)知識(shí)圖譜構(gòu)建系統(tǒng),實(shí)現(xiàn)知識(shí)圖譜在水務(wù)業(yè)務(wù)中的應(yīng)用。本文全面介紹了水務(wù)知識(shí)圖譜構(gòu)建和應(yīng)用過程的相關(guān)技術(shù),主要包含以下幾方面工作:首先,需要更深入地了解知識(shí)圖譜的構(gòu)建背景以及現(xiàn)狀,現(xiàn)有的數(shù)據(jù)特點(diǎn)和知識(shí)圖譜的應(yīng)用現(xiàn)狀等問題。本文選擇自頂向下和自底向上相結(jié)合的綜合性方法來構(gòu)建水務(wù)頂層知識(shí)圖譜,借鑒了Wordnet詞庫(kù)、Dbpedia詞典、水行業(yè)標(biāo)準(zhǔn)文檔及水務(wù)專家知識(shí)經(jīng)驗(yàn)。其中結(jié)構(gòu)化數(shù)據(jù)使用的是D2RQ工具執(zhí)行的RDF文本的數(shù)據(jù)轉(zhuǎn)換,非結(jié)構(gòu)化數(shù)據(jù)運(yùn)用Jieba進(jìn)行文本分詞,連接CN-Dbpedia網(wǎng)絡(luò)詞典擴(kuò)展詞匯信息,并使用Jena工具實(shí)現(xiàn)RDF文本的轉(zhuǎn)換。轉(zhuǎn)換后的RDF文件與先前構(gòu)建好的水務(wù)頂層知識(shí)圖譜進(jìn)行實(shí)體對(duì)齊,以實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文本數(shù)據(jù)的掛接。最后基于構(gòu)建的水務(wù)知識(shí)圖譜完成水務(wù)信息的推薦。在實(shí)體對(duì)齊的過程中,分別嘗試使用編輯距離算法、Jaccard算法和歐式距離算法對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類掛接。同時(shí),分別使用LDA算法、LSI算法和TF-IDF算法對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類掛接。經(jīng)過對(duì)比實(shí)驗(yàn)與結(jié)果的分析,發(fā)現(xiàn)編輯距離算法和LDA算法的評(píng)價(jià)結(jié)果均優(yōu)于其它幾種算法的評(píng)價(jià)結(jié)果,從而驗(yàn)證了水務(wù)知識(shí)圖譜構(gòu)建的有效性和準(zhǔn)確性;跇(gòu)建好的水務(wù)知識(shí)圖譜,制定相關(guān)查詢規(guī)則并使用語(yǔ)義距離算法進(jìn)行水務(wù)信息推薦。推薦結(jié)果不但實(shí)現(xiàn)了水務(wù)信息的共享,而且驗(yàn)證了所構(gòu)建的水務(wù)知識(shí)圖譜的準(zhǔn)確性。本文在開發(fā)層面采用Xitrum框架,建立了水務(wù)知識(shí)圖譜的構(gòu)建系統(tǒng),并詳細(xì)的說明了每個(gè)系統(tǒng)的主要功能以及各個(gè)子模塊的功能,最后對(duì)主要頁(yè)面進(jìn)行了展示。水務(wù)知識(shí)圖譜的構(gòu)建系統(tǒng)依托于《水體污染控制與治理科技重大專項(xiàng)》這一國(guó)家級(jí)項(xiàng)目,對(duì)水務(wù)行業(yè)的數(shù)據(jù)進(jìn)行全方位的整合,能夠在未來的決策等事件中發(fā)揮重大作用,具有實(shí)際的意義。
【圖文】:

模型圖,系統(tǒng)核心,模型,知識(shí)圖


識(shí)圖譜可以有效地整合水務(wù)數(shù)據(jù),本文針對(duì)于水務(wù)數(shù)據(jù)的特點(diǎn)制定了水譜的構(gòu)建方法,且構(gòu)建好的水務(wù)知識(shí)圖譜可以應(yīng)用于不同的系統(tǒng)平臺(tái)中據(jù)的查詢共享。核心模型對(duì)水務(wù)數(shù)據(jù)的特點(diǎn),初步得出水務(wù)知識(shí)圖譜構(gòu)建的模型如圖 2-3 所示。 模型中能夠看出,首先在頂層知識(shí)圖譜的構(gòu)建層中,運(yùn)用數(shù)據(jù)概念結(jié)合的關(guān)系在 Neo4j 平臺(tái)中構(gòu)建頂層水務(wù)知識(shí)圖譜;數(shù)據(jù)源的處理使用 D2 jena 工具分別將結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為 RDF 格式文件,并知識(shí)圖譜的數(shù)據(jù)層;接著分別利用編輯距離算法和 LDA 算法在 Neo4j據(jù)層與頂層知識(shí)圖譜之間的掛接,同時(shí)運(yùn)用 protégé平臺(tái)在水務(wù)知識(shí)圖語(yǔ)義規(guī)則;最后,在最終形成的知識(shí)圖譜上運(yùn)用 Neo4j 中的 Bloom 工務(wù)知識(shí)圖譜的可視化,并運(yùn)用語(yǔ)義距離算法結(jié)合語(yǔ)義規(guī)則做水務(wù)信息推。

主體框架,組件


第 2 章 水務(wù)知識(shí)圖譜構(gòu)建技術(shù)簡(jiǎn)介D2R 主要包含 D2R 服務(wù)器、D2RQ Mapping 及 D2RQ Engine[37]。其中,,器使用 D2RQ 映射語(yǔ)言來捕獲應(yīng)用程序,特定的數(shù)據(jù)庫(kù)模式和 RDFS 模L 本體之間的映射。D2R 服務(wù)器包括一個(gè)可以從數(shù)據(jù)庫(kù)的表結(jié)構(gòu)自動(dòng)Q 映射的工具。該工具為每個(gè)數(shù)據(jù)庫(kù)生成新的 RDF 詞匯表,將表名稱稱,將列名稱作為屬性名稱。然后可以通過使用已知的 RDF 詞匯表中換自動(dòng)生成的術(shù)語(yǔ)來定制映射。D2RQ Mapping 指定如何標(biāo)識(shí)資源以及據(jù)庫(kù)內(nèi)容生成屬性值[38]。D2rq 中的中心對(duì)象是 ClassMap。。Classmap據(jù)庫(kù)中描述的一組實(shí)體到一類或一組類似資源類的映射。每個(gè) ClassM組 PropertyBridges,它們指定如何創(chuàng)建資源描述。可以直接從數(shù)據(jù)庫(kù)值式或轉(zhuǎn)換表創(chuàng)建屬性值。D2RQ 支持 ClassMap 和 PropertyBridge 級(jí)別的,n:m 關(guān)系的映射,并且可以處理高度規(guī)范化的表結(jié)構(gòu),其中實(shí)體描述個(gè)表中。D2RQ Engine 主要功能是運(yùn)用 D2RQ Mapping 文件把結(jié)構(gòu)化數(shù) RDF 格式的文本數(shù)據(jù)[39]。如圖 2-4 是 D2RQ 組件的主體架構(gòu)。
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TV21-39;TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 田雨;蔣云鐘;楊明祥;;智慧水務(wù)建設(shè)的基礎(chǔ)及發(fā)展戰(zhàn)略研究[J];中國(guó)水利;2014年20期

2 熊永蘭;張志強(qiáng);Wei Yongping;劉志輝;程國(guó)棟;;基于科學(xué)知識(shí)圖譜的水文化變遷研究方法探析[J];地球科學(xué)進(jìn)展;2014年01期

3 胡澤文;孫建軍;武夷山;;國(guó)內(nèi)知識(shí)圖譜應(yīng)用研究綜述[J];圖書情報(bào)工作;2013年03期

4 陳天;劉文浩;;相似度算法分析與比較研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2012年18期

5 白海燕;梁冰;;利用D2R實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)與關(guān)聯(lián)數(shù)據(jù)的語(yǔ)義模式映射[J];現(xiàn)代圖書情報(bào)技術(shù);2011年Z1期

6 章勇;呂俊白;;基于Protege的本體建模研究綜述[J];福建電腦;2011年01期

相關(guān)碩士學(xué)位論文 前3條

1 邊慧珍;基于WordNet的蒙古文領(lǐng)域知識(shí)圖譜構(gòu)建方法研究[D];內(nèi)蒙古師范大學(xué);2018年

2 王冬楠;基于Jena的關(guān)聯(lián)數(shù)據(jù)語(yǔ)義導(dǎo)航技術(shù)[D];大連海事大學(xué);2015年

3 黃志聃;利用protege構(gòu)建新媒體領(lǐng)域本體的探索[D];武漢理工大學(xué);2013年



本文編號(hào):2611830

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shuiwenshuili/2611830.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d824***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com