面向問(wèn)答系統(tǒng)的知識(shí)圖譜推理算法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-07 23:41
知識(shí)圖譜由于其具有的知識(shí)高度結(jié)構(gòu)化、應(yīng)用范圍廣等優(yōu)點(diǎn)獲得了眾多研究人員的關(guān)注;谥R(shí)圖譜的問(wèn)答系統(tǒng)作為知識(shí)圖譜的一大典型應(yīng)用,目前仍然存在著無(wú)法有效表示和利用知識(shí)的問(wèn)題。針對(duì)這一問(wèn)題,本文開(kāi)展了對(duì)知識(shí)表示和基于知識(shí)圖譜的問(wèn)答推理的研究,并實(shí)現(xiàn)了基于實(shí)體和關(guān)系描述的知識(shí)嵌入模型和基于事實(shí)記憶和知識(shí)圖譜的問(wèn)答模型。其中,基于實(shí)體和關(guān)系描述的知識(shí)嵌入模型用于改善知識(shí)的向量表示效果,基于事實(shí)記憶和知識(shí)圖譜的問(wèn)答模型則用于在知識(shí)圖譜上推理出問(wèn)題答案。具體來(lái)說(shuō),本文的主要研究工作如下:(1)提出并實(shí)現(xiàn)了基于實(shí)體和關(guān)系描述的知識(shí)嵌入模型。當(dāng)前的大多數(shù)知識(shí)嵌入模型都存在著在三元組的語(yǔ)義信息這一方面考慮過(guò)少的問(wèn)題,針對(duì)于這一問(wèn)題,本文提出了基于實(shí)體和關(guān)系描述的知識(shí)嵌入模型。在該模型中,不僅改進(jìn)了傳統(tǒng)的DKRL模型和TransD模型,在獲取實(shí)體和關(guān)系語(yǔ)義時(shí),也采取了結(jié)合注意力機(jī)制和卷積神經(jīng)網(wǎng)絡(luò)的實(shí)體描述嵌入模型和層次化關(guān)系語(yǔ)義嵌入模型這兩種新方法。實(shí)驗(yàn)證明,本模型相比TransE、TransD和DKRL等基線模型,在鏈接預(yù)測(cè)中使用bern采樣時(shí)平均排名達(dá)到了最優(yōu),且此時(shí)的hits@10也達(dá)到了最優(yōu)的77...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TransE模型
第二章相關(guān)研究工作圖2-1TransE模型圖2-2TransH模型2.1.1復(fù)雜關(guān)系建模首先,給出復(fù)雜關(guān)系的定義:給定r0,對(duì)于所有的三元組(h,r0,t)∈S,倘若這樣的三元組個(gè)數(shù)大于1,則稱這樣的關(guān)系是復(fù)雜關(guān)系。復(fù)雜關(guān)系可以根據(jù)該關(guān)系兩端的頭實(shí)體和尾實(shí)體的數(shù)目進(jìn)一步劃分為1-N,N-N和N-1三種類型。上文提到了TransE難以處理復(fù)雜關(guān)系,這是因?yàn)樵赥ransE簡(jiǎn)單的約束下,對(duì)于復(fù)雜關(guān)系,容易出現(xiàn)不同意義實(shí)體的表示向量趨于相同的情況。例如,對(duì)于(成都,位于,四川。,(電子科大,位于,四川省)這樣的兩個(gè)三元組,利用TransE來(lái)進(jìn)行知識(shí)嵌入的時(shí)候,由于需要滿足u成都+u位于≈u四川省和u電子科大+u位于≈u四川省這兩個(gè)條件,故而容易看出,“成都”和“四川時(shí)的向量在訓(xùn)練后會(huì)趨于相同。針對(duì)于TransE模型無(wú)法恰當(dāng)?shù)靥幚韽?fù)雜關(guān)系的問(wèn)題,研究者提出了大量的模型。本文主要從中選取了六個(gè)最經(jīng)典的模型來(lái)進(jìn)行介紹。(1)TransH模型為了能對(duì)復(fù)雜關(guān)系進(jìn)行處理,對(duì)于每一個(gè)關(guān)系r,TransH使用兩個(gè)向量來(lái)進(jìn)行表示,一個(gè)是平移向量lr,一個(gè)是法向量wr;同時(shí)對(duì)于每一個(gè)三元組(h,r,t),TransH首先分別將頭實(shí)體h對(duì)應(yīng)的向量uh和尾實(shí)體t對(duì)應(yīng)的向量ut沿著法向量wr投影到關(guān)系r對(duì)應(yīng)的超平面上,得到uh⊥和ut⊥,然后再讓投影向量uh⊥、ut⊥和lr滿足TransE的約束條件,即uh⊥+lr≈ut⊥。其中,uh⊥的計(jì)算過(guò)程為uh⊥=uhwTruhwr.(2-3)ut⊥的計(jì)算過(guò)程為ut⊥=utwTrutwr.(2-4)圖2-2則是TransH模型的示意圖。相比TransE模型,由于TransH多了頭實(shí)7
電子科技大學(xué)碩士學(xué)位論文體h、尾實(shí)體t在關(guān)系超平面進(jìn)行投影這一步,所以每個(gè)實(shí)體在不同關(guān)系平面上都有不同的向量表示,實(shí)體的表示更加靈活,這使得TransH能較好地對(duì)復(fù)雜關(guān)系的情況進(jìn)行處理。(2)TransR/CTransR模型雖然TransH能夠?qū)?fù)雜關(guān)系進(jìn)行一定的正確表示,但是由于其依舊認(rèn)為實(shí)體和關(guān)系表示需要處于同一空間,這一點(diǎn)大大減弱了TransH的表示能力。針對(duì)于這一點(diǎn),WangZ等提出了TransR模型。TransR模型認(rèn)為,實(shí)體和關(guān)系不應(yīng)該處于同一個(gè)空間,因?yàn)閷?shí)體包含了不同的屬性信息,而不同的關(guān)系關(guān)注著實(shí)體的不同屬性。故而對(duì)于每個(gè)三元組(h,r,t),我們要先將頭實(shí)體h和尾實(shí)體t映射到關(guān)系r所在的關(guān)系空間中,然后再建立頭實(shí)體h到尾實(shí)體t的翻譯關(guān)系。TransR模型如圖2-3所示。圖2-3TransR模型上圖中,hr是頭實(shí)體h在關(guān)系r的關(guān)系空間中的投影(對(duì)應(yīng)的投影向量表示為uhr),tr則是尾實(shí)體t在關(guān)系r的關(guān)系空間中的投影(對(duì)應(yīng)的投影向量表示為utr),矩陣Mr則是從實(shí)體空間到關(guān)系r的空間的映射矩陣。頭實(shí)體的具體映射過(guò)程為uhr=uhMr.(2-5)尾實(shí)體的具體映射過(guò)程為utr=utMr.(2-6)更進(jìn)一步地,TransR的作者發(fā)現(xiàn)不同的三元組的關(guān)系r可能具有不同的含義,可以對(duì)關(guān)系r的語(yǔ)義進(jìn)行進(jìn)一步精確挖掘,于是這便有了CTransR。對(duì)于每一個(gè)三元組(h,r,t),CTransR通過(guò)將uhut作為該三元組的關(guān)系r的語(yǔ)義表示。對(duì)于每一個(gè)關(guān)系r,將r對(duì)應(yīng)的每個(gè)三元組的r的語(yǔ)義表示向量uhut進(jìn)行聚類,得到關(guān)8
【參考文獻(xiàn)】:
期刊論文
[1]基于句法結(jié)構(gòu)分析的中文問(wèn)題分類[J]. 文勖,張宇,劉挺,馬金山. 中文信息學(xué)報(bào). 2006(02)
本文編號(hào):3070014
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TransE模型
第二章相關(guān)研究工作圖2-1TransE模型圖2-2TransH模型2.1.1復(fù)雜關(guān)系建模首先,給出復(fù)雜關(guān)系的定義:給定r0,對(duì)于所有的三元組(h,r0,t)∈S,倘若這樣的三元組個(gè)數(shù)大于1,則稱這樣的關(guān)系是復(fù)雜關(guān)系。復(fù)雜關(guān)系可以根據(jù)該關(guān)系兩端的頭實(shí)體和尾實(shí)體的數(shù)目進(jìn)一步劃分為1-N,N-N和N-1三種類型。上文提到了TransE難以處理復(fù)雜關(guān)系,這是因?yàn)樵赥ransE簡(jiǎn)單的約束下,對(duì)于復(fù)雜關(guān)系,容易出現(xiàn)不同意義實(shí)體的表示向量趨于相同的情況。例如,對(duì)于(成都,位于,四川。,(電子科大,位于,四川省)這樣的兩個(gè)三元組,利用TransE來(lái)進(jìn)行知識(shí)嵌入的時(shí)候,由于需要滿足u成都+u位于≈u四川省和u電子科大+u位于≈u四川省這兩個(gè)條件,故而容易看出,“成都”和“四川時(shí)的向量在訓(xùn)練后會(huì)趨于相同。針對(duì)于TransE模型無(wú)法恰當(dāng)?shù)靥幚韽?fù)雜關(guān)系的問(wèn)題,研究者提出了大量的模型。本文主要從中選取了六個(gè)最經(jīng)典的模型來(lái)進(jìn)行介紹。(1)TransH模型為了能對(duì)復(fù)雜關(guān)系進(jìn)行處理,對(duì)于每一個(gè)關(guān)系r,TransH使用兩個(gè)向量來(lái)進(jìn)行表示,一個(gè)是平移向量lr,一個(gè)是法向量wr;同時(shí)對(duì)于每一個(gè)三元組(h,r,t),TransH首先分別將頭實(shí)體h對(duì)應(yīng)的向量uh和尾實(shí)體t對(duì)應(yīng)的向量ut沿著法向量wr投影到關(guān)系r對(duì)應(yīng)的超平面上,得到uh⊥和ut⊥,然后再讓投影向量uh⊥、ut⊥和lr滿足TransE的約束條件,即uh⊥+lr≈ut⊥。其中,uh⊥的計(jì)算過(guò)程為uh⊥=uhwTruhwr.(2-3)ut⊥的計(jì)算過(guò)程為ut⊥=utwTrutwr.(2-4)圖2-2則是TransH模型的示意圖。相比TransE模型,由于TransH多了頭實(shí)7
電子科技大學(xué)碩士學(xué)位論文體h、尾實(shí)體t在關(guān)系超平面進(jìn)行投影這一步,所以每個(gè)實(shí)體在不同關(guān)系平面上都有不同的向量表示,實(shí)體的表示更加靈活,這使得TransH能較好地對(duì)復(fù)雜關(guān)系的情況進(jìn)行處理。(2)TransR/CTransR模型雖然TransH能夠?qū)?fù)雜關(guān)系進(jìn)行一定的正確表示,但是由于其依舊認(rèn)為實(shí)體和關(guān)系表示需要處于同一空間,這一點(diǎn)大大減弱了TransH的表示能力。針對(duì)于這一點(diǎn),WangZ等提出了TransR模型。TransR模型認(rèn)為,實(shí)體和關(guān)系不應(yīng)該處于同一個(gè)空間,因?yàn)閷?shí)體包含了不同的屬性信息,而不同的關(guān)系關(guān)注著實(shí)體的不同屬性。故而對(duì)于每個(gè)三元組(h,r,t),我們要先將頭實(shí)體h和尾實(shí)體t映射到關(guān)系r所在的關(guān)系空間中,然后再建立頭實(shí)體h到尾實(shí)體t的翻譯關(guān)系。TransR模型如圖2-3所示。圖2-3TransR模型上圖中,hr是頭實(shí)體h在關(guān)系r的關(guān)系空間中的投影(對(duì)應(yīng)的投影向量表示為uhr),tr則是尾實(shí)體t在關(guān)系r的關(guān)系空間中的投影(對(duì)應(yīng)的投影向量表示為utr),矩陣Mr則是從實(shí)體空間到關(guān)系r的空間的映射矩陣。頭實(shí)體的具體映射過(guò)程為uhr=uhMr.(2-5)尾實(shí)體的具體映射過(guò)程為utr=utMr.(2-6)更進(jìn)一步地,TransR的作者發(fā)現(xiàn)不同的三元組的關(guān)系r可能具有不同的含義,可以對(duì)關(guān)系r的語(yǔ)義進(jìn)行進(jìn)一步精確挖掘,于是這便有了CTransR。對(duì)于每一個(gè)三元組(h,r,t),CTransR通過(guò)將uhut作為該三元組的關(guān)系r的語(yǔ)義表示。對(duì)于每一個(gè)關(guān)系r,將r對(duì)應(yīng)的每個(gè)三元組的r的語(yǔ)義表示向量uhut進(jìn)行聚類,得到關(guān)8
【參考文獻(xiàn)】:
期刊論文
[1]基于句法結(jié)構(gòu)分析的中文問(wèn)題分類[J]. 文勖,張宇,劉挺,馬金山. 中文信息學(xué)報(bào). 2006(02)
本文編號(hào):3070014
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3070014.html
最近更新
教材專著