機(jī)器閱讀理解中的多任務(wù)學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-04-24 11:04
機(jī)器閱讀理解在自然語言處理領(lǐng)域中是一個(gè)很重要的研究方向,對(duì)于實(shí)現(xiàn)人機(jī)交互是一個(gè)極為關(guān)鍵的技術(shù)。而機(jī)器閱讀理解由于其復(fù)雜性,一直都是評(píng)價(jià)機(jī)器自然語言理解的一個(gè)重要方面。同時(shí)由于時(shí)代的快速發(fā)展,各種文本信息不斷積累,如何能利用這些文本資源,從而使問答過程更加符合實(shí)際,也是一個(gè)具有現(xiàn)實(shí)應(yīng)用價(jià)值的課題。在實(shí)際的問答系統(tǒng)中,要做到全領(lǐng)域的問答,需要涉及到大量的知識(shí)信息,而要收集這些知識(shí)信息更是需要長(zhǎng)年累月的積累,機(jī)器閱讀理解和人類閱讀理解面臨的問題都是相似的,但是現(xiàn)實(shí)中為了降低任務(wù)難度,目前研究的很多機(jī)器閱讀理解數(shù)據(jù)集都有一定的局限性,數(shù)據(jù)樣本都比較少。在目標(biāo)領(lǐng)域沒有足夠的訓(xùn)練數(shù)據(jù)的情況下,如何利用域外的數(shù)據(jù)來增強(qiáng)模型效果,即采用多任務(wù)學(xué)習(xí)的方法來增強(qiáng)主要任務(wù)的模型表現(xiàn)性能十分關(guān)鍵。因此機(jī)器閱讀理解中的多任務(wù)學(xué)習(xí)方法的研究十分重要。近些年來,伴隨著深度學(xué)習(xí)的發(fā)展,機(jī)器閱讀理解技術(shù)不斷迎來新的突破。本文研究了片段抽取型機(jī)器閱讀理解任務(wù)中難點(diǎn),并提出使用機(jī)器閱讀理解模型和多任務(wù)學(xué)習(xí)結(jié)合的方法來解決這個(gè)問題。本文的主要工作與貢獻(xiàn)包括:第一,在泛領(lǐng)域的機(jī)器閱讀理解的任務(wù)中,提出基于經(jīng)典的機(jī)器閱讀理解模型...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 機(jī)器閱讀理解簡(jiǎn)介
2.2 文本表示
2.3 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)
2.3.1 卷積神經(jīng)網(wǎng)絡(luò)
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
2.3.3 注意力機(jī)制
2.4 預(yù)訓(xùn)練
2.5 多任務(wù)學(xué)習(xí)
2.6 本章小結(jié)
第三章 基于BIDAF的多任務(wù)學(xué)習(xí)模型
3.1 引言
3.2 問題描述
3.3 模型設(shè)計(jì)
3.3.1 模型結(jié)構(gòu)
3.3.2 表征編碼層
3.3.3 注意力流層
3.3.4 建模層和輸出層
3.4 實(shí)驗(yàn)環(huán)境和配置
3.4.1 數(shù)據(jù)準(zhǔn)備
3.4.2 參數(shù)設(shè)置
3.4.3 實(shí)驗(yàn)設(shè)置
3.5 實(shí)驗(yàn)結(jié)果和分析
3.5.1 目標(biāo)任務(wù)為SQuAD數(shù)據(jù)集上的結(jié)果分析
3.5.2 目標(biāo)任務(wù)為NewsQA數(shù)據(jù)集上的結(jié)果分析
3.5.3 優(yōu)化混合比
3.6 本章總結(jié)
第四章 基于預(yù)訓(xùn)練的多任務(wù)學(xué)習(xí)模型
4.1 引言
4.2 問題描述
4.3 模型設(shè)計(jì)
4.3.1 模型結(jié)構(gòu)
4.3.2 模型輸入層
4.3.3 模型層
4.3.4 輸出層
4.4 實(shí)驗(yàn)環(huán)境和配置
4.4.1 數(shù)據(jù)準(zhǔn)備
4.4.2 參數(shù)設(shè)置
4.4.3 實(shí)驗(yàn)設(shè)置
4.5 實(shí)驗(yàn)結(jié)果和分析
4.5.1 不同任務(wù)下的多任務(wù)學(xué)習(xí)
4.5.2 不同的混合參數(shù)比
4.6 本章總結(jié)
第五章 總結(jié)和展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
在校期間發(fā)表的論文、科研成果等
致謝
【參考文獻(xiàn)】:
期刊論文
[1]面向機(jī)器閱讀理解的候選句抽取算法[J]. 郭鑫,張庚,陳千,王素格. 計(jì)算機(jī)科學(xué). 2020(05)
本文編號(hào):3157249
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 機(jī)器閱讀理解簡(jiǎn)介
2.2 文本表示
2.3 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)
2.3.1 卷積神經(jīng)網(wǎng)絡(luò)
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
2.3.3 注意力機(jī)制
2.4 預(yù)訓(xùn)練
2.5 多任務(wù)學(xué)習(xí)
2.6 本章小結(jié)
第三章 基于BIDAF的多任務(wù)學(xué)習(xí)模型
3.1 引言
3.2 問題描述
3.3 模型設(shè)計(jì)
3.3.1 模型結(jié)構(gòu)
3.3.2 表征編碼層
3.3.3 注意力流層
3.3.4 建模層和輸出層
3.4 實(shí)驗(yàn)環(huán)境和配置
3.4.1 數(shù)據(jù)準(zhǔn)備
3.4.2 參數(shù)設(shè)置
3.4.3 實(shí)驗(yàn)設(shè)置
3.5 實(shí)驗(yàn)結(jié)果和分析
3.5.1 目標(biāo)任務(wù)為SQuAD數(shù)據(jù)集上的結(jié)果分析
3.5.2 目標(biāo)任務(wù)為NewsQA數(shù)據(jù)集上的結(jié)果分析
3.5.3 優(yōu)化混合比
3.6 本章總結(jié)
第四章 基于預(yù)訓(xùn)練的多任務(wù)學(xué)習(xí)模型
4.1 引言
4.2 問題描述
4.3 模型設(shè)計(jì)
4.3.1 模型結(jié)構(gòu)
4.3.2 模型輸入層
4.3.3 模型層
4.3.4 輸出層
4.4 實(shí)驗(yàn)環(huán)境和配置
4.4.1 數(shù)據(jù)準(zhǔn)備
4.4.2 參數(shù)設(shè)置
4.4.3 實(shí)驗(yàn)設(shè)置
4.5 實(shí)驗(yàn)結(jié)果和分析
4.5.1 不同任務(wù)下的多任務(wù)學(xué)習(xí)
4.5.2 不同的混合參數(shù)比
4.6 本章總結(jié)
第五章 總結(jié)和展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
在校期間發(fā)表的論文、科研成果等
致謝
【參考文獻(xiàn)】:
期刊論文
[1]面向機(jī)器閱讀理解的候選句抽取算法[J]. 郭鑫,張庚,陳千,王素格. 計(jì)算機(jī)科學(xué). 2020(05)
本文編號(hào):3157249
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3157249.html
最近更新
教材專著