基于深度卷積網(wǎng)絡(luò)的知識(shí)圖譜補(bǔ)全模型
發(fā)布時(shí)間:2021-04-13 21:40
知識(shí)圖譜包含了實(shí)體和關(guān)系的結(jié)構(gòu)化信息,通常表示為多關(guān)系圖的形式,即實(shí)體之間通過(guò)代表不同關(guān)系的邊進(jìn)行連接。知識(shí)圖譜可以用于包括人工智能和信息檢索在內(nèi)的多個(gè)領(lǐng)域。隨著信息大量的創(chuàng)建,對(duì)許多研究人員和從業(yè)人員而言,確定知識(shí)圖中信息是否正確并填補(bǔ)其缺失部分是至關(guān)重要的任務(wù)。為了應(yīng)對(duì)這一挑戰(zhàn),研究人員嘗試將由實(shí)體和關(guān)系組成的大規(guī)模知識(shí)圖譜嵌入到連續(xù)的向量空間以便于計(jì)算。最近,研究人員提出了許多開(kāi)創(chuàng)性的模型來(lái)解決這個(gè)問(wèn)題。根據(jù)模型中得分函數(shù)定義的不同,本文將模型分為組合方法和非組合方法兩類。非組合方法如Trans E,雖然計(jì)算效率很高,但是模型的擬合能力欠佳。諸如Rescal之類的組合方法有更好的擬合能力,但它需要大量的參數(shù)進(jìn)行計(jì)算。在本文中,我們使用深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)建模嵌入向量之間的關(guān)系。與傳統(tǒng)方法中人為設(shè)計(jì)算子的方法不同,本文利用深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)計(jì)算實(shí)體隱特征之間的關(guān)聯(lián),并以實(shí)體之間的相似性作為輔助信息來(lái)改進(jìn)模型。在實(shí)驗(yàn)中,我們的方法比大多數(shù)基線模型都有效并且表現(xiàn)優(yōu)異。
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
知識(shí)圖譜及補(bǔ)全問(wèn)題示意圖
圖 2-1 用獨(dú)熱編碼的方式表示詞向量這些缺點(diǎn)限制了獨(dú)熱編碼的詞向量表示在自然語(yǔ)言處理中的應(yīng)用,對(duì)此,研究人員提出了很多方法,使用較為廣泛的是詞的嵌入表示。2. 嵌入表示嵌入是將詞映射到低維向量空間中,通常維度是幾十到幾百。嵌入的詞向量中的特征稱為隱特征,它們是沒(méi)有具體含義的。通過(guò)將詞嵌入到低維空間中,便可以在此基礎(chǔ)上進(jìn)行向量操作和運(yùn)算。在文本的處理中,常用的詞嵌入方法又被成為 Word2Vec,常用的方法有 CBOW 和 skip-gram,由于篇幅限制,我們不對(duì) Word2Vec 的具體模型進(jìn)行介紹,只針對(duì)知識(shí)圖譜中的嵌入進(jìn)行解釋。知識(shí)圖譜因?yàn)槠涮厥獾臄?shù)據(jù)結(jié)構(gòu),其嵌入方式是依據(jù)損失函數(shù)而確定的。不同于文本處理中的詞嵌入,文本的詞是在整個(gè)句子中出現(xiàn),知識(shí)圖譜的嵌入有其特殊性:(1) 不同于文本,知識(shí)圖譜的數(shù)據(jù)集是規(guī)則的三元組結(jié)構(gòu),包含頭部實(shí)體,尾部實(shí)體和關(guān)系。
生成負(fù)例
本文編號(hào):3136053
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
知識(shí)圖譜及補(bǔ)全問(wèn)題示意圖
圖 2-1 用獨(dú)熱編碼的方式表示詞向量這些缺點(diǎn)限制了獨(dú)熱編碼的詞向量表示在自然語(yǔ)言處理中的應(yīng)用,對(duì)此,研究人員提出了很多方法,使用較為廣泛的是詞的嵌入表示。2. 嵌入表示嵌入是將詞映射到低維向量空間中,通常維度是幾十到幾百。嵌入的詞向量中的特征稱為隱特征,它們是沒(méi)有具體含義的。通過(guò)將詞嵌入到低維空間中,便可以在此基礎(chǔ)上進(jìn)行向量操作和運(yùn)算。在文本的處理中,常用的詞嵌入方法又被成為 Word2Vec,常用的方法有 CBOW 和 skip-gram,由于篇幅限制,我們不對(duì) Word2Vec 的具體模型進(jìn)行介紹,只針對(duì)知識(shí)圖譜中的嵌入進(jìn)行解釋。知識(shí)圖譜因?yàn)槠涮厥獾臄?shù)據(jù)結(jié)構(gòu),其嵌入方式是依據(jù)損失函數(shù)而確定的。不同于文本處理中的詞嵌入,文本的詞是在整個(gè)句子中出現(xiàn),知識(shí)圖譜的嵌入有其特殊性:(1) 不同于文本,知識(shí)圖譜的數(shù)據(jù)集是規(guī)則的三元組結(jié)構(gòu),包含頭部實(shí)體,尾部實(shí)體和關(guān)系。
生成負(fù)例
本文編號(hào):3136053
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3136053.html
最近更新
教材專著