基于Wikidata屬性的人物詞表屬性互操作研究
發(fā)布時間:2021-11-14 19:29
詞表是用來描述每個實體概念而精心選擇的一系列權威術語,即短語、詞匯的集合,能有效解決同義詞或多義詞的歧義問題。詞表作為語義中心,有助于信息集成和異構數(shù)據(jù)集的互連。人物詞表包含描述人物特征信息的詞匯集合,它的創(chuàng)建為認識人物實體提供了業(yè)界普遍認可的專業(yè)性術語。不同研究人員對人物描述側重點不同、細粒度不同、表達形式不同,使得人物領域詞表的創(chuàng)建呈現(xiàn)出實體關系復雜、主題類型多樣、概念術語涵蓋廣泛等特點,不可避免地造成不同領域人物數(shù)據(jù)彼此有交叉且覆蓋有相同概念,從而對用戶使用人物詞表中某概念造成困擾。不同詞表的創(chuàng)建在豐富人物實體信息多方位的表達的同時,卻也加重了用戶信息檢索的負擔。大規(guī)模語義知識庫匯集了數(shù)以萬計的關聯(lián)實體數(shù)據(jù),其分類導航式的信息分布,能滿足不同層次用戶對各種數(shù)據(jù)的個性化需求,是當前用戶汲取或研究數(shù)據(jù)的首選,有著極高的數(shù)據(jù)使用率。因此通過實現(xiàn)知識庫與詞表的互操作能有效解決詞表重用率低及用戶檢索不便的問題,有效實現(xiàn)用戶一站式信息檢索的需要,同時能優(yōu)化知識庫的數(shù)據(jù),提升其數(shù)據(jù)專業(yè)性。此外,在互操作映射結果上借助大型知識庫的數(shù)據(jù)分類模式,對數(shù)據(jù)進行內(nèi)部剖析,能更有效地提高用戶對詞表的利用率...
【文章來源】:山西大學山西省
【文章頁數(shù)】:88 頁
【學位級別】:碩士
【部分圖文】:
構建多維詞表互操作框架設計
第二章相關基礎理論11第二章相關基礎理論本節(jié)主要對本文研究中涉及的研究方法和相關技術的理論進行介紹�;谇拔膰鴥�(nèi)外對互操作項目、語義知識庫及人物數(shù)據(jù)相關研究背景的詳細分析,從互操作相關理論、映射技術、分類體系、資源描述框架等四個方面進行闡述,為后續(xù)研究奠定理論基矗2.1互操作相關理論2.1.1互操作內(nèi)涵互操作的概念時至今日不同領域有不同的理解。歐盟電子政務互操作協(xié)會提出的歐盟互操作框架(EIF)中指出,互操作不僅是在異構系統(tǒng)之間實現(xiàn)各類數(shù)據(jù)、信息和知識的交換,更重要地是確保使用者能維持并理解交換信息的精確含義[30]。互操作可實現(xiàn)信息資源的共享,但由于缺乏可理解的語義和共享的形式化基礎,異構信息資源間難以實現(xiàn)互操作[17]。而受控詞表的構建為異構資源的互操作提供一定的術語基礎,實現(xiàn)了異構資源之間的語義理解和交互。因此根據(jù)ISO25964-2互操作標準,互操作就是通過建立概念間的映射實現(xiàn),將采用一種詞表形成的表達方式轉換成另外一種或幾種詞表形成的對應表達方式,同時可通過合并多個詞表或使用一個詞表的部分來擴展另一個詞表,達到豐富詞表工具的目的[31]。其中映射是詞表互操作的關鍵手段。2.1.2互操作基本流程詞表互操作為實現(xiàn)知識共享提供了思路,是為用戶提供一站式信息檢索服務的重要手段。無論何種類型的互操作都需遵循基本的流程模式,并在此基礎上結合研究需要進行補充完善。圖2.1互操作基本流程
第二章相關基礎理論13結構,與其他詞表建立映射,并且其他詞表之間不直接建立映射。概念映射到其他詞表的相應概念,反之,其他詞表的概念映射到中心詞表。念關系的傳遞性進行與其他詞表的連續(xù)映射,由于詞表差異性,造成結果不準確。主題領域層面豐富2.2映射技術2.2.1映射類型互操作通過建立概念間的映射實現(xiàn),是分布式環(huán)境下實現(xiàn)雙方交流和共享的操作手段。映射旨在不改變原有詞表的基礎上,顯示不同詞表概念之間的關系,通過語義關聯(lián)實現(xiàn)源詞表的實體映射到目標詞表實體上,以便雙方對事物的理解達成一致[31]。映射的基本類型包括相等、等級、相關三種,其映射效果依次逐漸減弱,并在此基礎上各類型分別進行延伸細分。映射方向分為單向、雙向。映射數(shù)目,包括1:1,1:n,多個1:n映射可以衍生出m:n的映射。結合如圖2.2所示,表示A與B兩個詞表中概念之間的映射方式,并具體分析其映射類型。其中概念1、2屬于詞表A,概念3、4屬于詞表B;概念1、3屬于詞表中的一級概念,即上位概念,2、4屬于詞表的二級概念,即下位概念。因此,實線箭頭表示兩個詞表中構建層級關系,即<概念2“rdfs:subPropertyOf”概念1>,<概念4“rdfs:subPropertyOf”概念3>,根據(jù)其映射方向可為雙向,映射類型用虛線雙箭頭表示。圖2.2A與B詞表之間概念的映射方式及類型(1)相等映射相等映射[3]表示概念的內(nèi)涵和外延完全相同的源詞表與目標詞表之間,匹配效果最理想,相關度最高。由于詞表構建者不同,概念表達形式存在差異,造成其匹配結果的精細程度不同,由此細分為精確匹配、模糊近似匹配。也因此造成實際映射過程中,概念之間近似匹配(一般以一定閾值為界)即可認定為精確匹配。以詞表A
【參考文獻】:
期刊論文
[1]人物本體詞表之間的互操作及分類體系構建[J]. 賈君枝,崔西燕. 情報學報. 2019(07)
[2]Wikidata屬性特征及關系分析[J]. 賈君枝,崔西燕. 情報科學. 2019(06)
[3]國家科技計劃領域分類體系研究[J]. 曾建勛,賈君枝,吳雯娜. 情報學報. 2018(08)
[4]基于WordNet的概念語義相似度的計算方法[J]. 孫麗莉,張小剛. 統(tǒng)計與決策. 2017(23)
[5]基于關聯(lián)規(guī)則的Wikidata人物名稱數(shù)據(jù)分析——以諾貝爾文學獎得主為主題[J]. 賈君枝,馮婕. 圖書情報工作. 2017(12)
[6]基于因果鏈求解算法的人物關系挖掘研究——以Wikidata知識庫為例[J]. 賈君枝,馮婕. 情報學報. 2017(03)
[7]Wikidata的特點、數(shù)據(jù)獲取與應用[J]. 賈君枝,薛秋紅. 圖書情報工作. 2016(17)
[8]基于微格式的用戶生成內(nèi)容聚合組織研究[J]. 張敏,王丹. 情報理論與實踐. 2014(08)
[9]DDC關聯(lián)數(shù)據(jù)實現(xiàn)研究[J]. 賈君枝,趙潔. 中國圖書館學報. 2014(04)
[10]從敘詞表編制標準看敘詞表和其他受控詞表的互操作[J]. 張琳,宋文. 情報理論與實踐. 2012(12)
碩士論文
[1]關聯(lián)型實體名稱數(shù)據(jù)語義聚合研究[D]. 馮婕.山西大學 2018
[2]受控詞表互操作質量分析[D]. 趙潔.山西大學 2016
[3]基于中文百科的知識圖譜分類體系構建研究[D]. 樓仁杰.浙江大學 2016
本文編號:3495219
【文章來源】:山西大學山西省
【文章頁數(shù)】:88 頁
【學位級別】:碩士
【部分圖文】:
構建多維詞表互操作框架設計
第二章相關基礎理論11第二章相關基礎理論本節(jié)主要對本文研究中涉及的研究方法和相關技術的理論進行介紹�;谇拔膰鴥�(nèi)外對互操作項目、語義知識庫及人物數(shù)據(jù)相關研究背景的詳細分析,從互操作相關理論、映射技術、分類體系、資源描述框架等四個方面進行闡述,為后續(xù)研究奠定理論基矗2.1互操作相關理論2.1.1互操作內(nèi)涵互操作的概念時至今日不同領域有不同的理解。歐盟電子政務互操作協(xié)會提出的歐盟互操作框架(EIF)中指出,互操作不僅是在異構系統(tǒng)之間實現(xiàn)各類數(shù)據(jù)、信息和知識的交換,更重要地是確保使用者能維持并理解交換信息的精確含義[30]。互操作可實現(xiàn)信息資源的共享,但由于缺乏可理解的語義和共享的形式化基礎,異構信息資源間難以實現(xiàn)互操作[17]。而受控詞表的構建為異構資源的互操作提供一定的術語基礎,實現(xiàn)了異構資源之間的語義理解和交互。因此根據(jù)ISO25964-2互操作標準,互操作就是通過建立概念間的映射實現(xiàn),將采用一種詞表形成的表達方式轉換成另外一種或幾種詞表形成的對應表達方式,同時可通過合并多個詞表或使用一個詞表的部分來擴展另一個詞表,達到豐富詞表工具的目的[31]。其中映射是詞表互操作的關鍵手段。2.1.2互操作基本流程詞表互操作為實現(xiàn)知識共享提供了思路,是為用戶提供一站式信息檢索服務的重要手段。無論何種類型的互操作都需遵循基本的流程模式,并在此基礎上結合研究需要進行補充完善。圖2.1互操作基本流程
第二章相關基礎理論13結構,與其他詞表建立映射,并且其他詞表之間不直接建立映射。概念映射到其他詞表的相應概念,反之,其他詞表的概念映射到中心詞表。念關系的傳遞性進行與其他詞表的連續(xù)映射,由于詞表差異性,造成結果不準確。主題領域層面豐富2.2映射技術2.2.1映射類型互操作通過建立概念間的映射實現(xiàn),是分布式環(huán)境下實現(xiàn)雙方交流和共享的操作手段。映射旨在不改變原有詞表的基礎上,顯示不同詞表概念之間的關系,通過語義關聯(lián)實現(xiàn)源詞表的實體映射到目標詞表實體上,以便雙方對事物的理解達成一致[31]。映射的基本類型包括相等、等級、相關三種,其映射效果依次逐漸減弱,并在此基礎上各類型分別進行延伸細分。映射方向分為單向、雙向。映射數(shù)目,包括1:1,1:n,多個1:n映射可以衍生出m:n的映射。結合如圖2.2所示,表示A與B兩個詞表中概念之間的映射方式,并具體分析其映射類型。其中概念1、2屬于詞表A,概念3、4屬于詞表B;概念1、3屬于詞表中的一級概念,即上位概念,2、4屬于詞表的二級概念,即下位概念。因此,實線箭頭表示兩個詞表中構建層級關系,即<概念2“rdfs:subPropertyOf”概念1>,<概念4“rdfs:subPropertyOf”概念3>,根據(jù)其映射方向可為雙向,映射類型用虛線雙箭頭表示。圖2.2A與B詞表之間概念的映射方式及類型(1)相等映射相等映射[3]表示概念的內(nèi)涵和外延完全相同的源詞表與目標詞表之間,匹配效果最理想,相關度最高。由于詞表構建者不同,概念表達形式存在差異,造成其匹配結果的精細程度不同,由此細分為精確匹配、模糊近似匹配。也因此造成實際映射過程中,概念之間近似匹配(一般以一定閾值為界)即可認定為精確匹配。以詞表A
【參考文獻】:
期刊論文
[1]人物本體詞表之間的互操作及分類體系構建[J]. 賈君枝,崔西燕. 情報學報. 2019(07)
[2]Wikidata屬性特征及關系分析[J]. 賈君枝,崔西燕. 情報科學. 2019(06)
[3]國家科技計劃領域分類體系研究[J]. 曾建勛,賈君枝,吳雯娜. 情報學報. 2018(08)
[4]基于WordNet的概念語義相似度的計算方法[J]. 孫麗莉,張小剛. 統(tǒng)計與決策. 2017(23)
[5]基于關聯(lián)規(guī)則的Wikidata人物名稱數(shù)據(jù)分析——以諾貝爾文學獎得主為主題[J]. 賈君枝,馮婕. 圖書情報工作. 2017(12)
[6]基于因果鏈求解算法的人物關系挖掘研究——以Wikidata知識庫為例[J]. 賈君枝,馮婕. 情報學報. 2017(03)
[7]Wikidata的特點、數(shù)據(jù)獲取與應用[J]. 賈君枝,薛秋紅. 圖書情報工作. 2016(17)
[8]基于微格式的用戶生成內(nèi)容聚合組織研究[J]. 張敏,王丹. 情報理論與實踐. 2014(08)
[9]DDC關聯(lián)數(shù)據(jù)實現(xiàn)研究[J]. 賈君枝,趙潔. 中國圖書館學報. 2014(04)
[10]從敘詞表編制標準看敘詞表和其他受控詞表的互操作[J]. 張琳,宋文. 情報理論與實踐. 2012(12)
碩士論文
[1]關聯(lián)型實體名稱數(shù)據(jù)語義聚合研究[D]. 馮婕.山西大學 2018
[2]受控詞表互操作質量分析[D]. 趙潔.山西大學 2016
[3]基于中文百科的知識圖譜分類體系構建研究[D]. 樓仁杰.浙江大學 2016
本文編號:3495219
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3495219.html
最近更新
教材專著