基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取模型研究
發(fā)布時(shí)間:2023-04-21 20:58
隨著互聯(lián)網(wǎng)的飛速發(fā)展,大量的非結(jié)構(gòu)化文本散布在互聯(lián)網(wǎng)的各個(gè)角落。實(shí)體關(guān)系抽取能夠從非結(jié)構(gòu)化的文本中抽取實(shí)體以及實(shí)體之間的語(yǔ)義關(guān)系,有效地將非結(jié)構(gòu)化文本轉(zhuǎn)化為機(jī)器易于處理的結(jié)構(gòu)化文本。關(guān)系抽取屬于實(shí)體關(guān)系抽取任務(wù)中的一個(gè)子任務(wù),是實(shí)體關(guān)系抽取確定了文本中實(shí)體后的后續(xù)任務(wù)。本文主要研究基于監(jiān)督學(xué)習(xí)的句子級(jí)別的二元關(guān)系抽取模型。近年來(lái),隨著深度學(xué)習(xí)的發(fā)展,關(guān)系抽取模型取得了較大的進(jìn)展。然而,關(guān)系抽取模型在句子依存樹的充分利用上、特殊關(guān)系的有效利用上以及是否能夠識(shí)別關(guān)系的方向上依然存在一些需要解決的重要問(wèn)題。本文對(duì)以上三個(gè)問(wèn)題進(jìn)行了探索和研究,將三方面的貢獻(xiàn)總結(jié)如下:1.對(duì)句子依存樹的充分利用進(jìn)行研究,提出了基于樹形自注意力的關(guān)系抽取模型。該模型首先利用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)獲得句子的詞序信息以及利用樹形自注意力從句子的依存樹中捕捉結(jié)構(gòu)信息。其次,使用一個(gè)線性合并層將含有語(yǔ)序信息的向量和含有結(jié)構(gòu)信息的向量進(jìn)行融合,得到每個(gè)單詞的最終的向量表示。再次,利用最大池化層獲得句子向量和兩個(gè)實(shí)體向量,將它們鏈接起來(lái)輸入到前饋神經(jīng)網(wǎng)絡(luò)得到關(guān)系的向量表示。最后,將關(guān)系的向量輸入到softmax層中進(jìn)行關(guān)系預(yù)測(cè)。本章...
【文章頁(yè)數(shù)】:107 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于特征向量的傳統(tǒng)方法
1.2.2 基于核函數(shù)的傳統(tǒng)方法
1.2.3 基于深度學(xué)習(xí)的方法
1.3 有待研究的問(wèn)題
1.4 本文研究?jī)?nèi)容
1.5 本文組織結(jié)構(gòu)
1.6 本章小結(jié)
第2章 相關(guān)知識(shí)介紹
2.1 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
2.2 自注意力機(jī)制
2.3 Transformer Encoder
2.4 預(yù)訓(xùn)練語(yǔ)言模型
2.5 多任務(wù)學(xué)習(xí)和輔助學(xué)習(xí)
2.6 本章小結(jié)
第3章 基于樹形自注意力的關(guān)系抽取
3.1 引言
3.2 相關(guān)工作
3.3 模型介紹
3.3.1 基于樹形自注意力的關(guān)系抽取
3.3.2 樹形自注意力
3.4 實(shí)驗(yàn)評(píng)估
3.4.1 數(shù)據(jù)集SemEval-2010 Task8上的實(shí)驗(yàn)
3.4.2 數(shù)據(jù)集TACRED上的實(shí)驗(yàn)
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 輔助學(xué)習(xí)下的關(guān)系抽取
4.1 引言
4.2 相關(guān)工作
4.3 方法介紹
4.3.1 模型表示階段
4.3.2 模型學(xué)習(xí)階段
4.4 實(shí)驗(yàn)評(píng)估
4.4.1 數(shù)據(jù)集TACRED上的實(shí)驗(yàn)
4.4.2 數(shù)據(jù)集SemEval-2010 Task8上的實(shí)驗(yàn)
4.4.3 實(shí)驗(yàn)分析
4.5 本章小結(jié)
第5章 關(guān)系方向識(shí)別
5.1 引言
5.2 相關(guān)工作
5.3 任務(wù)介紹
5.3.1 關(guān)系方向識(shí)別
5.3.2 評(píng)估指標(biāo)
5.4 實(shí)驗(yàn)評(píng)估
5.4.1 數(shù)據(jù)集準(zhǔn)備
5.4.2 對(duì)EM-C的關(guān)系方向評(píng)估
5.5 討論
5.5.1 包含實(shí)體信息的模型設(shè)計(jì)
5.5.2 包含關(guān)系方向的模型設(shè)計(jì)
5.5.3 模型訓(xùn)練
5.5.4 案例分析
5.5.5 關(guān)系抽取
5.6 本章小結(jié)
第6章 總結(jié)和展望
6.1 主要工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號(hào):3796237
【文章頁(yè)數(shù)】:107 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于特征向量的傳統(tǒng)方法
1.2.2 基于核函數(shù)的傳統(tǒng)方法
1.2.3 基于深度學(xué)習(xí)的方法
1.3 有待研究的問(wèn)題
1.4 本文研究?jī)?nèi)容
1.5 本文組織結(jié)構(gòu)
1.6 本章小結(jié)
第2章 相關(guān)知識(shí)介紹
2.1 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
2.2 自注意力機(jī)制
2.3 Transformer Encoder
2.4 預(yù)訓(xùn)練語(yǔ)言模型
2.5 多任務(wù)學(xué)習(xí)和輔助學(xué)習(xí)
2.6 本章小結(jié)
第3章 基于樹形自注意力的關(guān)系抽取
3.1 引言
3.2 相關(guān)工作
3.3 模型介紹
3.3.1 基于樹形自注意力的關(guān)系抽取
3.3.2 樹形自注意力
3.4 實(shí)驗(yàn)評(píng)估
3.4.1 數(shù)據(jù)集SemEval-2010 Task8上的實(shí)驗(yàn)
3.4.2 數(shù)據(jù)集TACRED上的實(shí)驗(yàn)
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 輔助學(xué)習(xí)下的關(guān)系抽取
4.1 引言
4.2 相關(guān)工作
4.3 方法介紹
4.3.1 模型表示階段
4.3.2 模型學(xué)習(xí)階段
4.4 實(shí)驗(yàn)評(píng)估
4.4.1 數(shù)據(jù)集TACRED上的實(shí)驗(yàn)
4.4.2 數(shù)據(jù)集SemEval-2010 Task8上的實(shí)驗(yàn)
4.4.3 實(shí)驗(yàn)分析
4.5 本章小結(jié)
第5章 關(guān)系方向識(shí)別
5.1 引言
5.2 相關(guān)工作
5.3 任務(wù)介紹
5.3.1 關(guān)系方向識(shí)別
5.3.2 評(píng)估指標(biāo)
5.4 實(shí)驗(yàn)評(píng)估
5.4.1 數(shù)據(jù)集準(zhǔn)備
5.4.2 對(duì)EM-C的關(guān)系方向評(píng)估
5.5 討論
5.5.1 包含實(shí)體信息的模型設(shè)計(jì)
5.5.2 包含關(guān)系方向的模型設(shè)計(jì)
5.5.3 模型訓(xùn)練
5.5.4 案例分析
5.5.5 關(guān)系抽取
5.6 本章小結(jié)
第6章 總結(jié)和展望
6.1 主要工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號(hào):3796237
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3796237.html
最近更新
教材專著