基于深度語境和注意力機制的自動事件檢測模型
發(fā)布時間:2021-05-20 02:35
事件檢測任務是事件抽取任務中重要的一環(huán),其目的是提取出一個句子中可以觸發(fā)事件的觸發(fā)詞,并判斷所觸發(fā)的事件類別。目前,事件檢測的難點在于一詞多義和多事件句子,一詞多義是指同一個詞在不同上下文中可能會觸發(fā)不同類型的事件發(fā)生,而多事件句子則是同一個句子中可能存在著多個事件。為了能夠更好地同時解決這兩個問題,本文提出一個全新的基于深度語境化詞表征的注意力層次神經網絡模型,該模型可以學習深層的語義信息、組塊信息及抽象特征,其中,注意力機制能夠對相關有用的信息賦予更高的權值,并弱化干擾信息的影響,而深度語境化詞表征能夠為模型提供更多語法語義特征信息,有效解決詞語二義性問題。從而提升模型的識別性能。在ACE2005英文語料庫上進行實驗,實驗結果表明,該模型的F1值達到74.4%,高于現(xiàn)有最優(yōu)模型的性能。本文的研究工作主要包括以下幾個部分:(1)研究基于傳統(tǒng)詞向量的層次神經網絡模型,將雙向長短期記憶網絡和動態(tài)卷積神經網絡引入模型,探索不同詞向量維度、輸入特征、模型結構對事件檢測性能的影響,并將最優(yōu)結果作為本文的研究基礎。(2)在模型中引入注意力機制,探索不同注意力機制對模型的影響,研究表明選擇適當的注...
【文章來源】:廈門大學福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 模式匹配的方法
1.2.2 基于特征的方法
1.2.3 基于神經網絡的方法
1.3 本文主要工作及創(chuàng)新點
1.4 文章結構安排
第二章 實驗設置
2.1 實驗語料
2.2 任務定義
2.3 評價指標
2.4 實驗設置
2.4.1 超參數
2.4.2 優(yōu)化算法
2.4.3 損失函數
第三章 層次神經網絡事件檢測模型
3.1 研究動機
3.2 神經網絡
3.2.1 循環(huán)神經網絡
3.2.2 卷積神經網絡
3.2.3 詞向量
3.3 層次神經網絡模型
3.3.1 輸入層
3.3.2 雙向LSTM層
3.3.3 層歸一化
3.3.4 動態(tài)CNN層
3.3.5 輸出層
3.4 實驗
3.4.1 模型設計實驗
3.4.2 結果分析
3.5 本章小結
第四章 基于注意力機制的層次神經網絡事件檢測模型
4.1 研究動機
4.2 注意力機制
4.2.1 注意力機制算法
4.2.2 現(xiàn)有基于注意力機制的神經網絡模型
4.3 基于注意力機制的層次神經網絡模型
4.3.1 Attention層
4.3.2 層次神經網絡中Attention層的引入
4.4 實驗
4.4.1 模型設計實驗
4.4.2 結果分析
4.5 本章小結
第五章 基于深度語境化詞表征的注意力層次神經網絡事件檢測模型
5.1 研究動機
5.2 深度語境化詞表征
5.2.1 雙向語言模型
5.2.2 線性組合
5.3 基于深度語境化詞表征的注意力層次神經網絡模型
5.4 實驗
5.4.1 模型設計實驗
5.4.2 結果分析
5.4.3 多義詞實驗
5.4.4 多事件檢測實驗
5.5 本章小結
第六章 總結與展望
6.1 本文工作總結
6.2 創(chuàng)新點總結
6.3 未來工作展望
參考文獻
致謝
本文編號:3196914
【文章來源】:廈門大學福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 模式匹配的方法
1.2.2 基于特征的方法
1.2.3 基于神經網絡的方法
1.3 本文主要工作及創(chuàng)新點
1.4 文章結構安排
第二章 實驗設置
2.1 實驗語料
2.2 任務定義
2.3 評價指標
2.4 實驗設置
2.4.1 超參數
2.4.2 優(yōu)化算法
2.4.3 損失函數
第三章 層次神經網絡事件檢測模型
3.1 研究動機
3.2 神經網絡
3.2.1 循環(huán)神經網絡
3.2.2 卷積神經網絡
3.2.3 詞向量
3.3 層次神經網絡模型
3.3.1 輸入層
3.3.2 雙向LSTM層
3.3.3 層歸一化
3.3.4 動態(tài)CNN層
3.3.5 輸出層
3.4 實驗
3.4.1 模型設計實驗
3.4.2 結果分析
3.5 本章小結
第四章 基于注意力機制的層次神經網絡事件檢測模型
4.1 研究動機
4.2 注意力機制
4.2.1 注意力機制算法
4.2.2 現(xiàn)有基于注意力機制的神經網絡模型
4.3 基于注意力機制的層次神經網絡模型
4.3.1 Attention層
4.3.2 層次神經網絡中Attention層的引入
4.4 實驗
4.4.1 模型設計實驗
4.4.2 結果分析
4.5 本章小結
第五章 基于深度語境化詞表征的注意力層次神經網絡事件檢測模型
5.1 研究動機
5.2 深度語境化詞表征
5.2.1 雙向語言模型
5.2.2 線性組合
5.3 基于深度語境化詞表征的注意力層次神經網絡模型
5.4 實驗
5.4.1 模型設計實驗
5.4.2 結果分析
5.4.3 多義詞實驗
5.4.4 多事件檢測實驗
5.5 本章小結
第六章 總結與展望
6.1 本文工作總結
6.2 創(chuàng)新點總結
6.3 未來工作展望
參考文獻
致謝
本文編號:3196914
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3196914.html
最近更新
教材專著