基于知識表示學習的知識圖譜補全算法研究
發(fā)布時間:2021-02-20 15:29
知識圖譜(Knowledge Graph)以三元組形式描述了客觀世界中的概念、實體及其之間的關系,為自動理解海量信息提供了一種更好的表達形式。在使用大規(guī)模知識獲取方法構建的知識圖譜中通常存在大量關系缺失問題,如Freebase中71%的實體缺少出生地相關信息,Word Net和NELL也有著不同程度的詞性、父母等關系缺失,缺失的關系會降低下游應用任務的精度。知識圖譜補全是針對這一問題提出的自動補全方法,主要有基于符號推理、基于鏈路預測和基于知識表示學習的方法;诜柾评淼姆椒ㄖ饕蕾囉谌斯は闰炓(guī)則,推理效率低,無法適用于大型的知識圖譜;阪溌奉A測的方法是利用網(wǎng)絡拓撲結構,假設相似節(jié)點最有可能形成鏈接,但知識圖譜中鏈接具有明確的語義信息,使得鏈接預測效果往往不理想;谥R表示學習的補全是一種結合表示學習和鏈路預測的方法,采用數(shù)值推理替代符號推理,為大規(guī)模知識庫的補全提供了一種高效的方式。論文針對知識表示學習補全方法中的計算效率和結構化信息考慮不足的問題,開展了三個方面的研究。(1)針對現(xiàn)有網(wǎng)絡表示學習在鏈路預測中節(jié)點間關系考慮單一、計算效率低的問題,利用網(wǎng)絡中節(jié)點之間的共同鄰居的“...
【文章來源】:西南科技大學四川省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
知識圖譜示例
1緒論3能力。這使得模型的參數(shù)數(shù)量也越來越多,過多的參數(shù)使得模型的計算效率隨之下降,這時需要一種不增加模型參數(shù)就能提高模型補全能力的方法。同時目前的表示學習補全方法都使用一個評分函數(shù)(,,)來描述一個候選三元組(,,)成立的可能性,通過優(yōu)化目標函數(shù)使得真實的三元組的得分(,,)大于不真實三元組的得分(,,′)或(′,,)。但大多數(shù)現(xiàn)有的知識表示學習算法都是使用一個簡單的評分函數(shù)(,,)來描述(,,),很少考慮知識圖譜的結構化信息,例如三元組的有向傳遞關系。1.2本文工作本文的關鍵研究內容為知識圖譜關系(屬性)缺失的問題,利用知識表示學習進行鏈路預測來對知識圖譜中缺失的部分進行補全。知識圖譜本身是一種網(wǎng)絡(圖)的數(shù)據(jù)結構,知識圖譜補全任務對應于復雜網(wǎng)絡中的鏈路預測,知識表示學習對應著網(wǎng)絡表示學習,基于知識表示學習的知識圖譜補全則對應著基于網(wǎng)絡表示學習的鏈路預測問題;所以網(wǎng)絡表示學習、鏈路預測與知識表示學習、知識圖譜補全有著密不可分的關系。本文的工作也集中于這兩個方面,圖1-2展示了本文工作于研究內容之間關系。圖1-2本文研究內容關系首先,本文針對傳統(tǒng)復雜網(wǎng)絡中圖鏈路預測效率不高和現(xiàn)有的圖表示學習沒有針對鏈路預測問題進行單獨考慮的問題,結合傳統(tǒng)的鏈路預測方法和表示學習方法提出了基于資源分配的鏈路預測網(wǎng)絡表示學習(NELP)。其次,對于現(xiàn)有的基于鏈路預測的知識表示學習補全方法來說,隨著模型的效果的提升模型的復雜度也越來越高,本文通過知識圖譜中的先驗信息“關系類型約束”在不改變模型復雜度的前提下提升模型的效果提出了TransRT模型。最后,本文發(fā)現(xiàn)大多數(shù)現(xiàn)有的知識表示學習算法都是使用一個簡單的評分函數(shù)
西南科技大學碩士學位論文62知識圖譜補全研究綜述2.1問題定義與評價標準2.1.1問題定義知識圖譜補全是指在現(xiàn)有實體集合和關系集合的范圍內為知識圖譜添加實體與實體之間未明確標出的關系,形成一個新的三元組,同時保證新添加的三元組不與現(xiàn)有的三元組沖突。如圖2-1的例子中,實線的邊表示知識圖譜中已經(jīng)存在的實體之間的關系,而右邊虛線的邊則表示通過知識圖譜補全為知識圖譜中實體添加的關系;通過新添加的關系構成了新的三元組(葉莉,國籍,中國)、(葉莉,類型,人)等,從而使知識圖譜的關系更加完整。圖2-1知識圖譜補全從圖中可看出,知識圖譜補全就是在知識圖譜中新增加邊,可看成知識圖譜中的鏈路預測問題,但與傳統(tǒng)的網(wǎng)絡中鏈路預測的不同是由于知識圖譜本身數(shù)據(jù)的不同造成的,因為知識圖譜中的“邊”是代表著明確含義的;對于預測的知識圖譜中的邊不單單是預測存不存在關系,還要預測出存在的是什么關系。所以其相較于網(wǎng)絡上的鏈路預測更為復雜。知識圖譜補全中常用的方法有基于符號推理、機器學習分類器鏈路預測和表示學習的方法,其評價方法也不同于傳統(tǒng)的鏈路預測問題使用準確率來評價。在知識圖譜補全中常用的排序作為指標,而其中常用的知識圖譜數(shù)據(jù)集為WordNet和FreeBase兩個知識庫,下面將具體介紹數(shù)據(jù)集和評價標準。2.1.2數(shù)據(jù)集這里介紹在具體知識圖譜補全中所用的數(shù)據(jù),本章的使用共使用了來自兩個知識庫的5個數(shù)據(jù)集,數(shù)據(jù)集的具體信息如表2-1所示
【參考文獻】:
期刊論文
[1]網(wǎng)絡表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:3042962
【文章來源】:西南科技大學四川省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
知識圖譜示例
1緒論3能力。這使得模型的參數(shù)數(shù)量也越來越多,過多的參數(shù)使得模型的計算效率隨之下降,這時需要一種不增加模型參數(shù)就能提高模型補全能力的方法。同時目前的表示學習補全方法都使用一個評分函數(shù)(,,)來描述一個候選三元組(,,)成立的可能性,通過優(yōu)化目標函數(shù)使得真實的三元組的得分(,,)大于不真實三元組的得分(,,′)或(′,,)。但大多數(shù)現(xiàn)有的知識表示學習算法都是使用一個簡單的評分函數(shù)(,,)來描述(,,),很少考慮知識圖譜的結構化信息,例如三元組的有向傳遞關系。1.2本文工作本文的關鍵研究內容為知識圖譜關系(屬性)缺失的問題,利用知識表示學習進行鏈路預測來對知識圖譜中缺失的部分進行補全。知識圖譜本身是一種網(wǎng)絡(圖)的數(shù)據(jù)結構,知識圖譜補全任務對應于復雜網(wǎng)絡中的鏈路預測,知識表示學習對應著網(wǎng)絡表示學習,基于知識表示學習的知識圖譜補全則對應著基于網(wǎng)絡表示學習的鏈路預測問題;所以網(wǎng)絡表示學習、鏈路預測與知識表示學習、知識圖譜補全有著密不可分的關系。本文的工作也集中于這兩個方面,圖1-2展示了本文工作于研究內容之間關系。圖1-2本文研究內容關系首先,本文針對傳統(tǒng)復雜網(wǎng)絡中圖鏈路預測效率不高和現(xiàn)有的圖表示學習沒有針對鏈路預測問題進行單獨考慮的問題,結合傳統(tǒng)的鏈路預測方法和表示學習方法提出了基于資源分配的鏈路預測網(wǎng)絡表示學習(NELP)。其次,對于現(xiàn)有的基于鏈路預測的知識表示學習補全方法來說,隨著模型的效果的提升模型的復雜度也越來越高,本文通過知識圖譜中的先驗信息“關系類型約束”在不改變模型復雜度的前提下提升模型的效果提出了TransRT模型。最后,本文發(fā)現(xiàn)大多數(shù)現(xiàn)有的知識表示學習算法都是使用一個簡單的評分函數(shù)
西南科技大學碩士學位論文62知識圖譜補全研究綜述2.1問題定義與評價標準2.1.1問題定義知識圖譜補全是指在現(xiàn)有實體集合和關系集合的范圍內為知識圖譜添加實體與實體之間未明確標出的關系,形成一個新的三元組,同時保證新添加的三元組不與現(xiàn)有的三元組沖突。如圖2-1的例子中,實線的邊表示知識圖譜中已經(jīng)存在的實體之間的關系,而右邊虛線的邊則表示通過知識圖譜補全為知識圖譜中實體添加的關系;通過新添加的關系構成了新的三元組(葉莉,國籍,中國)、(葉莉,類型,人)等,從而使知識圖譜的關系更加完整。圖2-1知識圖譜補全從圖中可看出,知識圖譜補全就是在知識圖譜中新增加邊,可看成知識圖譜中的鏈路預測問題,但與傳統(tǒng)的網(wǎng)絡中鏈路預測的不同是由于知識圖譜本身數(shù)據(jù)的不同造成的,因為知識圖譜中的“邊”是代表著明確含義的;對于預測的知識圖譜中的邊不單單是預測存不存在關系,還要預測出存在的是什么關系。所以其相較于網(wǎng)絡上的鏈路預測更為復雜。知識圖譜補全中常用的方法有基于符號推理、機器學習分類器鏈路預測和表示學習的方法,其評價方法也不同于傳統(tǒng)的鏈路預測問題使用準確率來評價。在知識圖譜補全中常用的排序作為指標,而其中常用的知識圖譜數(shù)據(jù)集為WordNet和FreeBase兩個知識庫,下面將具體介紹數(shù)據(jù)集和評價標準。2.1.2數(shù)據(jù)集這里介紹在具體知識圖譜補全中所用的數(shù)據(jù),本章的使用共使用了來自兩個知識庫的5個數(shù)據(jù)集,數(shù)據(jù)集的具體信息如表2-1所示
【參考文獻】:
期刊論文
[1]網(wǎng)絡表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:3042962
本文鏈接:http://sikaile.net/kejilunwen/yysx/3042962.html
最近更新
教材專著