天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合外部文本信息的知識表示學(xué)習(xí)研究

發(fā)布時間:2021-03-09 07:05
  知識圖譜是人工智能的重要組成部分,能夠更好的組織、管理和理解互聯(lián)網(wǎng)中海量的信息并且以其強(qiáng)大的語義處理能力和開放互聯(lián)能力將這些信息以結(jié)構(gòu)化的形式呈現(xiàn)給人們。三元組“實體,關(guān)系,實體”是知識圖譜的一種通用的表示方式,實體通過關(guān)系相互連接構(gòu)成語義網(wǎng)絡(luò)并以符號形式或者網(wǎng)狀結(jié)構(gòu)存儲在知識圖譜中,但是這樣的表示方式卻存在數(shù)據(jù)稀疏和計算效率不佳等問題,因此如何更好對知識圖譜中的知識進(jìn)行表示是提升知識圖譜質(zhì)量的關(guān)鍵。隨著深度學(xué)習(xí)領(lǐng)域的走紅,表示學(xué)習(xí)技術(shù)也逐漸受到人們關(guān)注,面向知識圖譜進(jìn)行表示學(xué)習(xí)成為構(gòu)建高質(zhì)量知識圖譜的基礎(chǔ)。知識表示學(xué)習(xí)旨在面向知識圖譜進(jìn)行表示學(xué)習(xí),將知識圖譜中的實體和關(guān)系映射到低維稠密的向量空間,在該向量空間下,實體和關(guān)系都被表示成向量形式,便于計算它們之間的語義關(guān)系和發(fā)現(xiàn)更深層次的語義聯(lián)系。該技術(shù)可顯著提升計算效率和緩解數(shù)據(jù)稀疏問題并實現(xiàn)多源異質(zhì)信息的融合,對知識庫補(bǔ)全和知識推理等下游任務(wù)的質(zhì)量有很大提升。以往的知識表示學(xué)習(xí)技術(shù)都只利用了三元組本身的結(jié)構(gòu)信息,但是知識圖譜中還包含了大量的實體和關(guān)系描述信息、類別信息,甚至互聯(lián)網(wǎng)中還存在大量未被加入到知識圖譜的文本信息,這些信息都能夠... 

【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

融合外部文本信息的知識表示學(xué)習(xí)研究


TransE算法流程

類型,球星,保羅,實體


第2章基于三元組事實的知識表示學(xué)習(xí)方法12但是TransE的參數(shù)小也同時會暴露其他問題,就是在處理復(fù)雜關(guān)系時,并不是太到位。通常我們用與關(guān)系兩端相連接的頭尾實體數(shù)量來劃分關(guān)系類型,比如1:1,1:N,N:1,N:N這四種。1:N意味著在該關(guān)系下,存在一種頭實體對應(yīng)N個尾實體,其他的可類推。規(guī)范來看即為:},,{},,...1,0{Strhnx,除了1:1之外,其他類型都可視為復(fù)雜關(guān)系類型。TransE之所以在處理復(fù)雜關(guān)系類型上乏力,主要和它的模型假設(shè)有關(guān),根據(jù)TransE的假設(shè),在面對1:N,N:1,N:N時可以推出這樣的結(jié)論:如果關(guān)系r屬于N-1關(guān)系,我們可得到nhhh...21,同理我們也可以推理出在該關(guān)系下有mttt...21。比如知識圖譜中存在兩個三元組,分別為(美國,球星,科比·布萊恩特)和(美國,球星,保羅喬治),這里的球星就是很明顯的1:N的復(fù)雜關(guān)系類型,若采用TransE表示,就會使得科比·布萊恩特和保羅喬治的詞向量非常接近,甚至相同。具體情形如下圖所示:圖2.4復(fù)雜關(guān)系類型圖這在實際上是非常的不合理的,科比·布萊恩特和保羅喬治只是在球星這這個關(guān)系下比較貼近,其他的方面都沒什么聯(lián)系,所以在復(fù)雜關(guān)系情況下,TransE對學(xué)習(xí)到的實體區(qū)分能力較弱。因此在TransE的基礎(chǔ)上,有很多人做了大量的工作來進(jìn)行改進(jìn)。(2)TransH模型[33]TransH模型是在TransE基礎(chǔ)上進(jìn)行了一些改進(jìn),為了解決TransE由于自身假設(shè)的局限性所造成的無法解決復(fù)雜關(guān)系類型的問題,正如第二章介紹的那樣,TransH認(rèn)為一個實體在不同關(guān)系下具有不同的屬性,那么理應(yīng)具有不同的

模型圖,模型,實體,三元組


第2章基于三元組事實的知識表示學(xué)習(xí)方法13表示。其核心思想為對每一個關(guān)系定義一個超平面rW和一個關(guān)系向量rd,⊥⊥,th是在rW上的投影,并要求正確的三元組滿足rrrtdh,這樣既能保證一個實體在不同的關(guān)系中的表示不同,而在不同實體在同一個關(guān)系下的表示也可以相同。因此對于一個三元組,,trh我們定義了如下的損失函數(shù):2\1⊥⊥⊥),(LLtdhrlllthf········(2.9)其中我們假設(shè)rw為關(guān)系平面rW的法向量,并設(shè)定12\1LLrw,則頭實體h在rw上的投影為:⊥hwwhTwr···········(2.10)我們可得:hwwhhhhTwr⊥········(2.11)同理可得:hwwttttTwr⊥········(2.12)由于關(guān)系可能同時存在無數(shù)個超平面,TransH通過使rdl與rw近似正交來選出某一個特定的超平面,TransH模型圖如下所示:圖2.5TransH模型(3)TransR模型[34]由于TransH仍然認(rèn)為關(guān)系和實體是存在于同一語義空間中,這實際上對TransH的表示能力有所限制,因此TransR模型在此基礎(chǔ)上做了更加完善的工作。TransR的主要思想為一個實體并不是單一的,應(yīng)該是不同的屬性的一種結(jié)


本文編號:3072469

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3072469.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0c760***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com