基于社交網(wǎng)絡(luò)的知識圖譜構(gòu)建技術(shù)研究
發(fā)布時間:2020-03-24 06:03
【摘要】:近年來,隨著人工智能技術(shù)的飛速發(fā)展,基于數(shù)據(jù)挖掘、機器學(xué)習(xí)、知識工程的知識圖譜研究吸引了大量研究者的關(guān)注。知識圖譜對于人工智能、機器認(rèn)知智能的發(fā)展有著重要的理論價值和現(xiàn)實意義。雖然近年來研究者在知識圖譜構(gòu)建技術(shù)領(lǐng)域已經(jīng)取得了很多優(yōu)秀的研究成果,但仍有一些問題亟待解決。本文開展了基于社交網(wǎng)絡(luò)的知識圖譜構(gòu)建技術(shù)研究,主要探討了人物知識圖譜構(gòu)建過程中的實體獲取、重名實體消歧、關(guān)系補全、關(guān)系推理和知識沖突消解等問題。本文研究成果可為智能信息檢索、對話系統(tǒng)、智能推薦等智能應(yīng)用提供借鑒和參考。具體而言,本文取得的主要創(chuàng)新性成果包括:(1)針對傳統(tǒng)知識圖譜中的人物實體來源比較單一的問題,提出了三種從社交網(wǎng)絡(luò)中獲取人物實體的方法。首先提出了一種基于社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征關(guān)聯(lián)人物實體的方法,該方法根據(jù)節(jié)點度中心性、聚集系數(shù)、本征矢量中心性特征,基于隨機森林分類器對兩個網(wǎng)絡(luò)中的社交人物進(jìn)行關(guān)聯(lián);然后提出了一種融合社交網(wǎng)絡(luò)結(jié)構(gòu)特征和用戶畫像特征的人物實體關(guān)聯(lián)方法,本方法把社交結(jié)構(gòu)特征和畫像特征轉(zhuǎn)化為向量并根據(jù)向量的余弦相似度來關(guān)聯(lián)社交網(wǎng)絡(luò)之間的用戶;最后提出了一種基于二部圖匹配的人物實體關(guān)聯(lián)方法,該方法融合用戶畫像、用戶在線時間分布特征和用戶興趣特征關(guān)聯(lián)社交網(wǎng)絡(luò)中的人物實體。實驗結(jié)果表明,提出的方法均優(yōu)于現(xiàn)有的基線方法。(2)針對知識圖譜融合過程中出現(xiàn)的實體重名問題,提出了一種基于馬爾科夫邏輯網(wǎng)絡(luò)的重名實體消歧方法。首先使用知識圖譜表示元組中實體之間的鏈接關(guān)系;然后使用馬爾科夫邏輯網(wǎng)絡(luò)推理知識圖譜中存在的實體沖突;最后使用張量分解的方法對沖突實體進(jìn)行實體消歧。實驗結(jié)果表明,該方法在F1值、準(zhǔn)確率和召回率等方面均優(yōu)于基線方法。其中,在WD1數(shù)據(jù)集和Wikidata知識圖譜融合的實驗中,本文提出的方法比DoSeR的F1值高8%;在YA、DB、WD2數(shù)據(jù)集和Wikidata知識圖譜的融合的實驗中,提出的方法比DoSeR方法的F1值高7%;在Wikidata知識圖譜與WD1數(shù)據(jù)集融合的實驗中,該方法的準(zhǔn)確率比DoSeR方法高10%,召回率比DoSeR方法高5%。(3)針對構(gòu)建知識圖譜的過程中出現(xiàn)的關(guān)系缺失問題,提出了一種基于實體鏈接預(yù)測的關(guān)系補全方法(ELPKG)。該方法首先使用基于路徑的方法表示實體之間的關(guān)系;然后使用實體之間的嵌入向量表示實體之間的語義關(guān)系;接著使用概率軟邏輯的方法描述非確定性的知識;最后提出路徑和嵌入向量相結(jié)合的實體鏈接預(yù)測方法對實體關(guān)系進(jìn)行補全。在真實數(shù)據(jù)集上的實驗結(jié)果表明,在關(guān)系補全任務(wù)中ELPKG方法優(yōu)于現(xiàn)有的基線方法,其中在YAGO3數(shù)據(jù)集上ELPKG比基線方法的Hit@1、Hit@10、MRR均值分別高35%、24%、17%。(4)針對人物知識圖譜中的人物關(guān)系推理問題,提出了一個基于概率軟邏輯的實體關(guān)系推理方法(KGIPSL)。該方法首先對知識圖譜中的實體關(guān)系進(jìn)行統(tǒng)計;然后使用基于條件隨機場的方法構(gòu)建實體之間的馬爾科夫邏輯網(wǎng)絡(luò);接著使用局部封閉世界假設(shè)獲得知識圖譜中的負(fù)樣本;然后采用隨機游走方法對馬爾科夫邏輯網(wǎng)絡(luò)進(jìn)行采樣;接著用概率軟邏輯的方法表示非確定的知識;最后在知識圖譜的查詢過程中推理知識圖譜中實體之間的關(guān)系。在真實的知識圖譜數(shù)據(jù)集上的實驗表明,KGIPSL方法的準(zhǔn)確率均優(yōu)于基線方法,在YAGO數(shù)據(jù)集上KGIPSL的平均準(zhǔn)確率比基線方法平均高14.9%。(5)針對知識圖譜的事實及知識隨時間變化過程中出現(xiàn)的知識沖突問題,提出了一種基于時間特征、實體之間的語義嵌入特征和知識圖譜的圖結(jié)構(gòu)特征的知識沖突消解方法。該方法首先使用不確定時序知識圖譜描述知識圖譜隨時間的變化特征;然后分析了知識圖譜中事實在演化過程中的時間沖突,并根據(jù)時間沖突特點對時間約束添加約束條件;最后提出基于深度學(xué)習(xí)的Kcrabdl方法,它利用時間屬性、實體之間的語義嵌入特征和知識圖譜的圖結(jié)構(gòu)特征確保了知識隨時間演化過程中確保一致性。在IMDB和YAGO的真實數(shù)據(jù)集上的大量實驗表明,該方法優(yōu)于基線方法,并通過加入噪聲數(shù)據(jù)驗證了Kcrabdl方法具有較好的魯棒性。
【圖文】:
圖 2.3 DBLP 數(shù)據(jù)集論文作者合作數(shù)量的分布P 數(shù)據(jù)集里論文作者合作數(shù)量的分布,從中關(guān)于作者合作者分布的分析是一致的。因此重要特征是合理的。了算法在Aminer和MAG數(shù)據(jù)集上的ROC以看出,本方法在假正例率為 0.7%的情況下eed-and-Grow、Random Forest 和 NS 方法分對。即使在假正例率為 0.5%的情況下,本文果表明本文提出的方法在 Aminer 數(shù)據(jù)集上DM 方法高 6%。
方法取得了最好的效果。在 MAG-Aminer 數(shù)據(jù)集上本方法的 AUC 值為 0.91,分別比 NS、DDM 方法高 54%、19%。結(jié)果表明本方法在跨網(wǎng)絡(luò)的節(jié)點匹配中效果很好。圖 2.6 本文方法在 MAG-Aminer 和 DBLP-mendeley 數(shù)據(jù)集上與基線方法的 AUC 比較結(jié)果接下來通過向數(shù)據(jù)中添加噪音來驗證本方法的魯棒性(刪除或者添加圖中的邊)。前面的作者合作數(shù)量分布實驗中得知此分布遵循冪率分布,這也正是 Barabási-Albert(BA)[99]偏好鏈接模型的顯著特征,因此使用 BA 模型向圖中添加、刪除邊,從而給數(shù)據(jù)集添加噪音數(shù)據(jù),實驗結(jié)果見圖 2.7。在實驗中分別給目標(biāo)圖和輔助圖中添加比率為 p 的噪音,隨機地給目標(biāo)圖添加(p/2)×|E|
【學(xué)位授予單位】:戰(zhàn)略支援部隊信息工程大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP18
【圖文】:
圖 2.3 DBLP 數(shù)據(jù)集論文作者合作數(shù)量的分布P 數(shù)據(jù)集里論文作者合作數(shù)量的分布,從中關(guān)于作者合作者分布的分析是一致的。因此重要特征是合理的。了算法在Aminer和MAG數(shù)據(jù)集上的ROC以看出,本方法在假正例率為 0.7%的情況下eed-and-Grow、Random Forest 和 NS 方法分對。即使在假正例率為 0.5%的情況下,本文果表明本文提出的方法在 Aminer 數(shù)據(jù)集上DM 方法高 6%。
方法取得了最好的效果。在 MAG-Aminer 數(shù)據(jù)集上本方法的 AUC 值為 0.91,分別比 NS、DDM 方法高 54%、19%。結(jié)果表明本方法在跨網(wǎng)絡(luò)的節(jié)點匹配中效果很好。圖 2.6 本文方法在 MAG-Aminer 和 DBLP-mendeley 數(shù)據(jù)集上與基線方法的 AUC 比較結(jié)果接下來通過向數(shù)據(jù)中添加噪音來驗證本方法的魯棒性(刪除或者添加圖中的邊)。前面的作者合作數(shù)量分布實驗中得知此分布遵循冪率分布,這也正是 Barabási-Albert(BA)[99]偏好鏈接模型的顯著特征,因此使用 BA 模型向圖中添加、刪除邊,從而給數(shù)據(jù)集添加噪音數(shù)據(jù),實驗結(jié)果見圖 2.7。在實驗中分別給目標(biāo)圖和輔助圖中添加比率為 p 的噪音,隨機地給目標(biāo)圖添加(p/2)×|E|
【學(xué)位授予單位】:戰(zhàn)略支援部隊信息工程大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 耿維峰;;社交網(wǎng)絡(luò)應(yīng)用于輔助大學(xué)英語翻譯教學(xué)的相關(guān)分析[J];傳播力研究;2018年28期
2 孫金銘;吳s我,
本文編號:2597911
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2597911.html
最近更新
教材專著