基于重排序的迭代式實體對齊
發(fā)布時間:2023-01-08 16:16
現(xiàn)有的知識圖譜無法避免地存在不完整這一問題.緩解此問題的可行方法是引入外部知識圖譜中的知識.在此過程中,實體對齊是最關鍵的步驟.當前最先進的實體對齊解決方案主要依靠知識圖譜的結構信息來判斷實體的等價性,但在真實世界知識圖譜上,大部分實體只具有較低的節(jié)點度數(shù)以及微少的結構信息.此外,標注數(shù)據(jù)的缺乏也大大限制了實體對齊模型的效果.為解決上述問題,提出將不受節(jié)點度數(shù)影響的實體名信息與結構信息相結合,從更全面的角度實現(xiàn)實體對齊.在此基本框架上,利用基于課程學習的迭代訓練方法從易至難地選擇高置信度結果加入到訓練數(shù)據(jù)中,擴增標注數(shù)據(jù)的規(guī)模.最后使用詞移距離模型進一步改進實體名信息的利用方式,并對前序對齊結果重排序,提升實體對齊準確率.在跨語言以及單語言實體對齊任務上的實驗結果表明,提出的實體對齊方法性能遠好于當前最好的方法.
【文章頁數(shù)】:12 頁
【文章目錄】:
1 相關工作
2 問題定義與總框架
2.1 基本定義
2.2 總框架
3 實體對齊基本框架
3.1 實體結構特征
3.2 實體名特征
3.3 特征融合
4 基于課程學習的迭代訓練框架
4.1 迭代訓練框架
4.2 基于課程學習的迭代策略
5 基于詞移距離模型的重排序
6 實驗與結果
6.1 參數(shù)設置及度量指標
6.2 數(shù)據(jù)集及對比方法
6.3 實驗結果
6.4 參數(shù)分析
6.5 結果討論與特征分析
6.6 案例分析
7 總 結
【參考文獻】:
期刊論文
[1]融合多種特征的實體對齊算法[J]. 喬晶晶,段利國,李愛萍. 計算機工程與設計. 2018(11)
[2]表示學習知識圖譜的實體對齊算法[J]. 朱繼召,喬建忠,林樹寬. 東北大學學報(自然科學版). 2018(11)
[3]中文異構百科知識庫實體對齊[J]. 黃峻福,李天瑞,賈真,景運革,張濤. 計算機應用. 2016(07)
[4]知識庫實體對齊技術綜述[J]. 莊嚴,李國良,馮建華. 計算機研究與發(fā)展. 2016(01)
本文編號:3728792
【文章頁數(shù)】:12 頁
【文章目錄】:
1 相關工作
2 問題定義與總框架
2.1 基本定義
2.2 總框架
3 實體對齊基本框架
3.1 實體結構特征
3.2 實體名特征
3.3 特征融合
4 基于課程學習的迭代訓練框架
4.1 迭代訓練框架
4.2 基于課程學習的迭代策略
5 基于詞移距離模型的重排序
6 實驗與結果
6.1 參數(shù)設置及度量指標
6.2 數(shù)據(jù)集及對比方法
6.3 實驗結果
6.4 參數(shù)分析
6.5 結果討論與特征分析
6.6 案例分析
7 總 結
【參考文獻】:
期刊論文
[1]融合多種特征的實體對齊算法[J]. 喬晶晶,段利國,李愛萍. 計算機工程與設計. 2018(11)
[2]表示學習知識圖譜的實體對齊算法[J]. 朱繼召,喬建忠,林樹寬. 東北大學學報(自然科學版). 2018(11)
[3]中文異構百科知識庫實體對齊[J]. 黃峻福,李天瑞,賈真,景運革,張濤. 計算機應用. 2016(07)
[4]知識庫實體對齊技術綜述[J]. 莊嚴,李國良,馮建華. 計算機研究與發(fā)展. 2016(01)
本文編號:3728792
本文鏈接:http://sikaile.net/tushudanganlunwen/3728792.html