基于文本的實體關系抽取以及知識圖譜的表示推理方法研究
發(fā)布時間:2023-02-14 14:21
隨著信息通信技術特別是移動互聯(lián)網(wǎng)的快速發(fā)展,人類逐漸進入數(shù)據(jù)大爆炸的時代,每天都會有海量的數(shù)據(jù)和知識產(chǎn)生。面對海量的數(shù)據(jù),用戶如何快速高效地獲得有用的知識,成為了這個時代熱門的課題和棘手的難題。把海量的無結(jié)構(gòu)化文本數(shù)據(jù)以知識圖譜的形式存儲表征,成為現(xiàn)在一種主流的知識存儲方式。在這一過程中從文本中抽取實體和關系以及已有知識圖譜的推理和表示成為了知識圖譜能夠更好應用于具體領域的關鍵技術,因此本文的研究內(nèi)容如下:1、針對現(xiàn)有實體關系聯(lián)合抽取方法,底層語義編碼過于簡單,不能充分表征上下文語義的問題。本文通過在底層編碼階段加入多頭注意力機制,同時把不同編碼層訓練出的語義表征拼接,從而在編碼層實現(xiàn)更加豐富的語義表示,最終達到提升上層解碼階段的實體關系識別的效果。2、知識圖譜中表示學習方法主要是以TransE方法為代表的翻譯方法,它是把實體關系映射到低維連續(xù)的張量空間中,但是現(xiàn)有的翻譯方法不能準確地表征復雜關系的三元組,比如一對多,多對一,多對多關系。針對基線方法局限性,提出了一種基于嵌入非對稱的知識表示推理方法(AEM)。本文提出的AEM方法把頭實體和尾實體映射到同一關系空間中的不同的子空間中,可...
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
學位論文數(shù)據(jù)集
摘要
ABSTRACT
第一章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 實體關系的抽取
1.2.2 知識圖譜的表示和推理
1.3 主要研究工作及創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
第二章 相關技術和算法
2.1 詞向量表示
2.2 循環(huán)神經(jīng)網(wǎng)絡
2.3 卷積神經(jīng)網(wǎng)絡
2.4 注意力機制
2.5 本章小結(jié)
第三章 基于豐富語義的實體關系聯(lián)合抽取方法
3.1 現(xiàn)有實體關系抽取方法存在的問題
3.2 基于豐富語義的實體關系聯(lián)合抽取方法
3.2.1 方法的總體框架
3.2.2 詞典嵌入向量表示模塊
3.2.3 基于上下文的嵌入表示模塊
3.2.4 基于雙向長短時記憶神經(jīng)網(wǎng)絡的編碼層
3.2.5 多層語義表征機制
3.2.6 基于單向長短時記憶神經(jīng)網(wǎng)絡的解碼層
3.2.7 目標函數(shù)
3.3 訓練超參
3.4 實驗
3.4.1 數(shù)據(jù)集
3.4.2 評價指標
3.4.3 實驗結(jié)果分析
3.4.3.1 字典語義嵌入模塊對方法效果的影響
3.4.3.2 雙向長短時記憶循環(huán)神經(jīng)網(wǎng)絡模塊對方法效果的影響
3.4.3.3 基于上下文語義嵌入模塊對方法效果的影響
3.4.3.4 多層語義連接模塊對方法的影響
3.5 本章小結(jié)
第四章 基于嵌入非對稱的知識表示推理方法
4.1 現(xiàn)有知識表示和推理方法存在的問題
4.2 基于嵌入非對稱的知識表示推理方法
4.2.1 得分函數(shù)
4.2.2 目標函數(shù)
4.2.3 方法詳細實現(xiàn)過程
4.3 不同方法間的空間時間復雜度對比
4.4 訓練參數(shù)和實驗環(huán)境
4.5 實驗
4.5.1 數(shù)據(jù)集
4.5.2 實現(xiàn)任務和評價指標
4.5.3 實驗結(jié)果分析
4.6 本章小結(jié)
第五章 基于流形的非對稱知識圖譜的表示和推理方法
5.1 AEM方法未能解決的問題
5.2 基于流形的非對稱知識圖譜表示和推理方法
5.2.1 得分函數(shù)
5.2.2 目標函數(shù)
5.2.3 方法的詳細訓練過程
5.3 實驗參數(shù)和實驗環(huán)境
5.4 本文提出知識表示方法的時間空間復雜度對比分析
5.5 實驗
5.5.1 數(shù)據(jù)集
5.5.2 實現(xiàn)任務和評價指標
5.5.3 實驗結(jié)果分析
5.6 本章小結(jié)
第六章 總結(jié)及展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
研究成果及發(fā)表的學術論文
作者和導師簡介
附件
本文編號:3742532
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
學位論文數(shù)據(jù)集
摘要
ABSTRACT
第一章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 實體關系的抽取
1.2.2 知識圖譜的表示和推理
1.3 主要研究工作及創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
第二章 相關技術和算法
2.1 詞向量表示
2.2 循環(huán)神經(jīng)網(wǎng)絡
2.3 卷積神經(jīng)網(wǎng)絡
2.4 注意力機制
2.5 本章小結(jié)
第三章 基于豐富語義的實體關系聯(lián)合抽取方法
3.1 現(xiàn)有實體關系抽取方法存在的問題
3.2 基于豐富語義的實體關系聯(lián)合抽取方法
3.2.1 方法的總體框架
3.2.2 詞典嵌入向量表示模塊
3.2.3 基于上下文的嵌入表示模塊
3.2.4 基于雙向長短時記憶神經(jīng)網(wǎng)絡的編碼層
3.2.5 多層語義表征機制
3.2.6 基于單向長短時記憶神經(jīng)網(wǎng)絡的解碼層
3.2.7 目標函數(shù)
3.3 訓練超參
3.4 實驗
3.4.1 數(shù)據(jù)集
3.4.2 評價指標
3.4.3 實驗結(jié)果分析
3.4.3.1 字典語義嵌入模塊對方法效果的影響
3.4.3.2 雙向長短時記憶循環(huán)神經(jīng)網(wǎng)絡模塊對方法效果的影響
3.4.3.3 基于上下文語義嵌入模塊對方法效果的影響
3.4.3.4 多層語義連接模塊對方法的影響
3.5 本章小結(jié)
第四章 基于嵌入非對稱的知識表示推理方法
4.1 現(xiàn)有知識表示和推理方法存在的問題
4.2 基于嵌入非對稱的知識表示推理方法
4.2.1 得分函數(shù)
4.2.2 目標函數(shù)
4.2.3 方法詳細實現(xiàn)過程
4.3 不同方法間的空間時間復雜度對比
4.4 訓練參數(shù)和實驗環(huán)境
4.5 實驗
4.5.1 數(shù)據(jù)集
4.5.2 實現(xiàn)任務和評價指標
4.5.3 實驗結(jié)果分析
4.6 本章小結(jié)
第五章 基于流形的非對稱知識圖譜的表示和推理方法
5.1 AEM方法未能解決的問題
5.2 基于流形的非對稱知識圖譜表示和推理方法
5.2.1 得分函數(shù)
5.2.2 目標函數(shù)
5.2.3 方法的詳細訓練過程
5.3 實驗參數(shù)和實驗環(huán)境
5.4 本文提出知識表示方法的時間空間復雜度對比分析
5.5 實驗
5.5.1 數(shù)據(jù)集
5.5.2 實現(xiàn)任務和評價指標
5.5.3 實驗結(jié)果分析
5.6 本章小結(jié)
第六章 總結(jié)及展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
研究成果及發(fā)表的學術論文
作者和導師簡介
附件
本文編號:3742532
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3742532.html
最近更新
教材專著