基于深度語(yǔ)境和注意力機(jī)制的自動(dòng)事件檢測(cè)模型
發(fā)布時(shí)間:2021-05-20 02:35
事件檢測(cè)任務(wù)是事件抽取任務(wù)中重要的一環(huán),其目的是提取出一個(gè)句子中可以觸發(fā)事件的觸發(fā)詞,并判斷所觸發(fā)的事件類(lèi)別。目前,事件檢測(cè)的難點(diǎn)在于一詞多義和多事件句子,一詞多義是指同一個(gè)詞在不同上下文中可能會(huì)觸發(fā)不同類(lèi)型的事件發(fā)生,而多事件句子則是同一個(gè)句子中可能存在著多個(gè)事件。為了能夠更好地同時(shí)解決這兩個(gè)問(wèn)題,本文提出一個(gè)全新的基于深度語(yǔ)境化詞表征的注意力層次神經(jīng)網(wǎng)絡(luò)模型,該模型可以學(xué)習(xí)深層的語(yǔ)義信息、組塊信息及抽象特征,其中,注意力機(jī)制能夠?qū)ο嚓P(guān)有用的信息賦予更高的權(quán)值,并弱化干擾信息的影響,而深度語(yǔ)境化詞表征能夠?yàn)槟P吞峁└嗾Z(yǔ)法語(yǔ)義特征信息,有效解決詞語(yǔ)二義性問(wèn)題。從而提升模型的識(shí)別性能。在ACE2005英文語(yǔ)料庫(kù)上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,該模型的F1值達(dá)到74.4%,高于現(xiàn)有最優(yōu)模型的性能。本文的研究工作主要包括以下幾個(gè)部分:(1)研究基于傳統(tǒng)詞向量的層次神經(jīng)網(wǎng)絡(luò)模型,將雙向長(zhǎng)短期記憶網(wǎng)絡(luò)和動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)引入模型,探索不同詞向量維度、輸入特征、模型結(jié)構(gòu)對(duì)事件檢測(cè)性能的影響,并將最優(yōu)結(jié)果作為本文的研究基礎(chǔ)。(2)在模型中引入注意力機(jī)制,探索不同注意力機(jī)制對(duì)模型的影響,研究表明選擇適當(dāng)?shù)淖?..
【文章來(lái)源】:廈門(mén)大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 模式匹配的方法
1.2.2 基于特征的方法
1.2.3 基于神經(jīng)網(wǎng)絡(luò)的方法
1.3 本文主要工作及創(chuàng)新點(diǎn)
1.4 文章結(jié)構(gòu)安排
第二章 實(shí)驗(yàn)設(shè)置
2.1 實(shí)驗(yàn)語(yǔ)料
2.2 任務(wù)定義
2.3 評(píng)價(jià)指標(biāo)
2.4 實(shí)驗(yàn)設(shè)置
2.4.1 超參數(shù)
2.4.2 優(yōu)化算法
2.4.3 損失函數(shù)
第三章 層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
3.1 研究動(dòng)機(jī)
3.2 神經(jīng)網(wǎng)絡(luò)
3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)
3.2.3 詞向量
3.3 層次神經(jīng)網(wǎng)絡(luò)模型
3.3.1 輸入層
3.3.2 雙向LSTM層
3.3.3 層歸一化
3.3.4 動(dòng)態(tài)CNN層
3.3.5 輸出層
3.4 實(shí)驗(yàn)
3.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
3.4.2 結(jié)果分析
3.5 本章小結(jié)
第四章 基于注意力機(jī)制的層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
4.1 研究動(dòng)機(jī)
4.2 注意力機(jī)制
4.2.1 注意力機(jī)制算法
4.2.2 現(xiàn)有基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型
4.3 基于注意力機(jī)制的層次神經(jīng)網(wǎng)絡(luò)模型
4.3.1 Attention層
4.3.2 層次神經(jīng)網(wǎng)絡(luò)中Attention層的引入
4.4 實(shí)驗(yàn)
4.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
4.4.2 結(jié)果分析
4.5 本章小結(jié)
第五章 基于深度語(yǔ)境化詞表征的注意力層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
5.1 研究動(dòng)機(jī)
5.2 深度語(yǔ)境化詞表征
5.2.1 雙向語(yǔ)言模型
5.2.2 線性組合
5.3 基于深度語(yǔ)境化詞表征的注意力層次神經(jīng)網(wǎng)絡(luò)模型
5.4 實(shí)驗(yàn)
5.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
5.4.2 結(jié)果分析
5.4.3 多義詞實(shí)驗(yàn)
5.4.4 多事件檢測(cè)實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 創(chuàng)新點(diǎn)總結(jié)
6.3 未來(lái)工作展望
參考文獻(xiàn)
致謝
本文編號(hào):3196914
【文章來(lái)源】:廈門(mén)大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 模式匹配的方法
1.2.2 基于特征的方法
1.2.3 基于神經(jīng)網(wǎng)絡(luò)的方法
1.3 本文主要工作及創(chuàng)新點(diǎn)
1.4 文章結(jié)構(gòu)安排
第二章 實(shí)驗(yàn)設(shè)置
2.1 實(shí)驗(yàn)語(yǔ)料
2.2 任務(wù)定義
2.3 評(píng)價(jià)指標(biāo)
2.4 實(shí)驗(yàn)設(shè)置
2.4.1 超參數(shù)
2.4.2 優(yōu)化算法
2.4.3 損失函數(shù)
第三章 層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
3.1 研究動(dòng)機(jī)
3.2 神經(jīng)網(wǎng)絡(luò)
3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)
3.2.3 詞向量
3.3 層次神經(jīng)網(wǎng)絡(luò)模型
3.3.1 輸入層
3.3.2 雙向LSTM層
3.3.3 層歸一化
3.3.4 動(dòng)態(tài)CNN層
3.3.5 輸出層
3.4 實(shí)驗(yàn)
3.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
3.4.2 結(jié)果分析
3.5 本章小結(jié)
第四章 基于注意力機(jī)制的層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
4.1 研究動(dòng)機(jī)
4.2 注意力機(jī)制
4.2.1 注意力機(jī)制算法
4.2.2 現(xiàn)有基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型
4.3 基于注意力機(jī)制的層次神經(jīng)網(wǎng)絡(luò)模型
4.3.1 Attention層
4.3.2 層次神經(jīng)網(wǎng)絡(luò)中Attention層的引入
4.4 實(shí)驗(yàn)
4.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
4.4.2 結(jié)果分析
4.5 本章小結(jié)
第五章 基于深度語(yǔ)境化詞表征的注意力層次神經(jīng)網(wǎng)絡(luò)事件檢測(cè)模型
5.1 研究動(dòng)機(jī)
5.2 深度語(yǔ)境化詞表征
5.2.1 雙向語(yǔ)言模型
5.2.2 線性組合
5.3 基于深度語(yǔ)境化詞表征的注意力層次神經(jīng)網(wǎng)絡(luò)模型
5.4 實(shí)驗(yàn)
5.4.1 模型設(shè)計(jì)實(shí)驗(yàn)
5.4.2 結(jié)果分析
5.4.3 多義詞實(shí)驗(yàn)
5.4.4 多事件檢測(cè)實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 創(chuàng)新點(diǎn)總結(jié)
6.3 未來(lái)工作展望
參考文獻(xiàn)
致謝
本文編號(hào):3196914
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3196914.html
最近更新
教材專(zhuān)著