天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

知識圖譜自動演進(jìn)算法研究

發(fā)布時間:2018-03-13 05:05

  本文選題:知識圖譜自動演進(jìn) 切入點:Embedding模型 出處:《北京郵電大學(xué)》2017年博士論文 論文類型:學(xué)位論文


【摘要】:知識圖譜作為一種重要的結(jié)構(gòu)化語義知識數(shù)據(jù)庫,包含了大量形如左實體,關(guān)系,右實體 三元組的知識事實,目前已經(jīng)成為很多人工智能應(yīng)用的核心數(shù)據(jù)支撐,如語義搜索、問答系統(tǒng)等,具有重要的研究價值。知識圖譜的數(shù)據(jù)來源包括百科類數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和搜索日志數(shù)據(jù)等。知識圖譜的構(gòu)建追求不斷地擴充知識圖譜涵蓋的結(jié)構(gòu)化知識。然而,現(xiàn)實世界中的知識在不斷地增長,知識圖譜的構(gòu)建成為一個永不停止的動態(tài)過程,總是面臨非完備性的問題。本文通過挖掘知識圖譜中已存在的知識,推理或者預(yù)測知識圖譜中可能缺失的隱含知識,從而擴展知識圖譜的覆蓋面,即圍繞知識圖譜自動演進(jìn)問題展開研究。首先,針對知識圖譜非完備性問題,本文提出一種基于潛在向量(Embedding)方法的成對交互分化潛在向量模型(Pairwise-interaction Differentiated Embeddings,PIDE),該模型對知識圖譜中的三元組基于以下兩個假設(shè)進(jìn)行建模:(1)三元組成立的置信度取決于其中實體和關(guān)系的成對交互作用,即(左實體、關(guān)系)、(關(guān)系、右實體)和(左實體、右實體);(2)三元組中實體具有語義和語法信息,而關(guān)系則主要提供語法信息。通過訓(xùn)練成對交互分化潛在向量模型,學(xué)習(xí)實體和關(guān)系的潛在語義向量與語法向量的關(guān)聯(lián)性,然后預(yù)測知識圖譜中可能存在的三元組,從而實現(xiàn)知識圖譜自動演進(jìn)。本文進(jìn)一步提出了基于最大排序似然概率(Maximum Ranking Likelihood,MRL)的模型優(yōu)化算法;谡鎸崝(shù)據(jù)集的實驗成功驗證了本文所提模型以及優(yōu)化算法的優(yōu)異性能。其次,由于基于PIDE模型的方法無法直接學(xué)習(xí)出新實體的潛在向量,從而導(dǎo)致其無法預(yù)測包含新實體的知識三元組。針對該問題,本文考慮利用額外的輔助文本信息來解決缺乏新實體潛在向量的問題。知識圖譜通常記錄了實體描述文本信息,詳細(xì)解釋了實體含義,包含豐富的語義信息。受零樣本學(xué)習(xí)算法(Zero-shot Learning)啟發(fā),本文提出一種基于知識圖譜和實體描述文本的聯(lián)合潛在向量(Embedding)模型(Jointly Embedding Model,JointE),該算法的關(guān)鍵創(chuàng)新點在于利用實體描述文本來計算新實體的潛在語義向量,進(jìn)一步實現(xiàn)了知識圖譜中包含新實體的知識三元組預(yù)測。最后,通過實驗驗證所提模型的實用性。然而,有些知識圖譜缺乏實體描述文本,導(dǎo)致JointE模型無法在該類知識圖譜上實現(xiàn)包含新實體的三元組預(yù)測。針對該問題,本文基于互聯(lián)網(wǎng)上大量出現(xiàn)的非結(jié)構(gòu)化文本信息,提出一種基于潛在向量轉(zhuǎn)化神經(jīng)網(wǎng)絡(luò)(Translating Embedding Neural Network, TENN)的模型,聯(lián)合利用知識圖譜和非結(jié)構(gòu)化文本語料訓(xùn)練,從非結(jié)構(gòu)化文本語料中發(fā)掘新實體,實現(xiàn)了包含新實體的三元組預(yù)測。通過在真實數(shù)據(jù)集上的實驗,驗證了該算法的有效性。最后,在上述知識圖譜中知識預(yù)測算法思路的基礎(chǔ)上,本文提出了一種基于潛在向量(Embedding)方法對信息推薦數(shù)據(jù)建模的算法。信息推薦數(shù)據(jù)在結(jié)構(gòu)上類似于知識圖譜,由大量形如 用戶、評分、項目三元組的數(shù)據(jù)構(gòu)成。該算法把信息推薦數(shù)據(jù)看成一種類似于知識圖譜的多關(guān)系網(wǎng)絡(luò),在推薦系統(tǒng)中實現(xiàn)評分預(yù)測、用戶預(yù)測和項目預(yù)測。本文進(jìn)一步把所提模型應(yīng)用到跨域推薦中,實現(xiàn)多領(lǐng)域的推薦生成。最后通過在真實數(shù)據(jù)集上的對比實驗,驗證了所提模型的有效性。
[Abstract]:......
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 莊嚴(yán);李國良;馮建華;;知識庫實體對齊技術(shù)綜述[J];計算機研究與發(fā)展;2016年01期

,

本文編號:1604912

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1604912.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99279***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com