天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于Wikidata的機構(gòu)本體構(gòu)建研究

發(fā)布時間:2020-04-14 07:22
【摘要】:機構(gòu)是指擁有共同目標(biāo)的社會實體。作為信息資源的發(fā)布者,科研評價的統(tǒng)計單位,信息檢索的重要字段,知識導(dǎo)航的代表性要素,機構(gòu)實體在信息組織方面發(fā)揮著重要的作用。機構(gòu)實體數(shù)量繁多,層次關(guān)系復(fù)雜,名稱形式各異,衍化多樣。在關(guān)聯(lián)數(shù)據(jù)的蓬勃發(fā)展的背景下,不同來源的機構(gòu)實體的組織方式不一,揭示粒度有別,方向各有側(cè)重,展示形式各異,范圍多有重疊。加劇了數(shù)據(jù)之間的異構(gòu)性和分散程度,使得辨析機構(gòu)的唯一性成為棘手的難題,給以機構(gòu)為中心的信息檢索,文獻(xiàn)計量,知識導(dǎo)航帶來了困難,大大地增加了機構(gòu)驅(qū)動的數(shù)據(jù)挖掘的成本。本體是一種重要的維護(hù)語義的工具,能夠使用定義好的詞匯表,以標(biāo)準(zhǔn)化和有意義的方式表達(dá)資源之間的鏈接,揭示機構(gòu)實體之間已有的和隱含的關(guān)聯(lián)網(wǎng)絡(luò)。構(gòu)建機構(gòu)本體對于解決數(shù)據(jù)異構(gòu)問題、揭示關(guān)聯(lián)關(guān)系網(wǎng)絡(luò)、發(fā)現(xiàn)隱含知識、科研成果正確歸屬等方面都有重要的理論意義與實踐意義。本文基于Wikidata和DBpedia知識庫對機構(gòu)本體的構(gòu)建展開了理論和實證研究,圍繞機構(gòu)本體構(gòu)建流程從以下幾個方面展開:(1)機構(gòu)本體屬性和類的定義。作為構(gòu)建機構(gòu)本體的基礎(chǔ),選擇機構(gòu)實體數(shù)量豐富的Wikidata和DBpedia知識庫中的機構(gòu)屬性進(jìn)行屬性對齊,提出并實現(xiàn)了基于WordNet的屬性對齊方法,根據(jù)兩大知識庫的機構(gòu)屬性融合結(jié)果總結(jié)機構(gòu)本體應(yīng)該包含的屬性,根據(jù)對象屬性的定義域和值域分析機構(gòu)本體中必需的類。遵循詞表復(fù)用的原則,建立機構(gòu)本體的數(shù)據(jù)字典。(2)提出機構(gòu)類的概念體系的構(gòu)建方法。提取Wikidata知識庫中以subclass of屬性和instance of屬性相關(guān)聯(lián)的機構(gòu)類,根據(jù)上下位類的傳遞性構(gòu)成機構(gòu)類目范疇樹,運用統(tǒng)計分析的方法對提取的機構(gòu)類目范疇樹進(jìn)行分析,發(fā)現(xiàn)機構(gòu)類目范疇樹存在的問題,并針對存在的問題設(shè)計優(yōu)化框架。以優(yōu)化后的機構(gòu)類目范疇樹作為機構(gòu)本體中機構(gòu)類的概念分類體系。(3)運用Protégé工具將構(gòu)建的機構(gòu)本體模型形式化,在本體模型的基礎(chǔ)上添加實例,結(jié)合OWL向下兼容的性質(zhì),提出將表格形式的數(shù)據(jù)轉(zhuǎn)換成語義化的RDF格式的數(shù)據(jù),以實現(xiàn)機構(gòu)實例的批量導(dǎo)入和機構(gòu)本體知識庫的完善,從而驗證機構(gòu)本體的有效性。
【圖文】:

示意圖,機構(gòu)類,實體類,類目


圖 4.3 機構(gòu)類實體與其他實體類重疊示意圖目范疇樹中類目從屬多造成類目層級混亂父類的二級類目中,有 11 個條目的額外父類是處于機的條目。將這些條目按照它們各自的 subclassof 屬性整

示意圖,示意圖,類型屬性,優(yōu)化方法


圖4.4層級混亂示意圖
【學(xué)位授予單位】:山西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:G254

【相似文獻(xiàn)】

相關(guān)期刊論文 前6條

1 賈君枝;葉壯壯;;基于潛在語義索引的Wikidata機構(gòu)實體聚類研究[J];數(shù)據(jù)分析與知識發(fā)現(xiàn);2019年10期

2 賈君枝;葉壯壯;;基于Wikidata的機構(gòu)類目范疇樹構(gòu)建與優(yōu)化[J];國家圖書館學(xué)刊;2018年01期

3 王瑞云;賈君枝;;基于準(zhǔn)馬爾可夫過程的Wikidata職業(yè)類的層次關(guān)系分析[J];情報學(xué)報;2017年03期

4 賈君枝;趙宇飛;;Wikidata與名稱規(guī)范檔數(shù)據(jù)聚合實現(xiàn)[J];情報科學(xué);2018年11期

5 賈君枝;崔西燕;;Wikidata屬性特征及關(guān)系分析[J];情報科學(xué);2019年06期

6 賈君枝;馮婕;;基于因果鏈求解算法的人物關(guān)系挖掘研究——以Wikidata知識庫為例[J];情報學(xué)報;2017年03期

相關(guān)碩士學(xué)位論文 前1條

1 葉壯壯;基于Wikidata的機構(gòu)本體構(gòu)建研究[D];山西大學(xué);2019年

,

本文編號:2627040

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2627040.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶44c34***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com