機器閱讀理解中的多任務學習算法研究
發(fā)布時間:2021-04-24 11:04
機器閱讀理解在自然語言處理領域中是一個很重要的研究方向,對于實現(xiàn)人機交互是一個極為關鍵的技術。而機器閱讀理解由于其復雜性,一直都是評價機器自然語言理解的一個重要方面。同時由于時代的快速發(fā)展,各種文本信息不斷積累,如何能利用這些文本資源,從而使問答過程更加符合實際,也是一個具有現(xiàn)實應用價值的課題。在實際的問答系統(tǒng)中,要做到全領域的問答,需要涉及到大量的知識信息,而要收集這些知識信息更是需要長年累月的積累,機器閱讀理解和人類閱讀理解面臨的問題都是相似的,但是現(xiàn)實中為了降低任務難度,目前研究的很多機器閱讀理解數(shù)據(jù)集都有一定的局限性,數(shù)據(jù)樣本都比較少。在目標領域沒有足夠的訓練數(shù)據(jù)的情況下,如何利用域外的數(shù)據(jù)來增強模型效果,即采用多任務學習的方法來增強主要任務的模型表現(xiàn)性能十分關鍵。因此機器閱讀理解中的多任務學習方法的研究十分重要。近些年來,伴隨著深度學習的發(fā)展,機器閱讀理解技術不斷迎來新的突破。本文研究了片段抽取型機器閱讀理解任務中難點,并提出使用機器閱讀理解模型和多任務學習結(jié)合的方法來解決這個問題。本文的主要工作與貢獻包括:第一,在泛領域的機器閱讀理解的任務中,提出基于經(jīng)典的機器閱讀理解模型...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關理論和技術
2.1 機器閱讀理解簡介
2.2 文本表示
2.3 神經(jīng)網(wǎng)絡和深度學習
2.3.1 卷積神經(jīng)網(wǎng)絡
2.3.2 循環(huán)神經(jīng)網(wǎng)絡和長短時記憶網(wǎng)絡
2.3.3 注意力機制
2.4 預訓練
2.5 多任務學習
2.6 本章小結(jié)
第三章 基于BIDAF的多任務學習模型
3.1 引言
3.2 問題描述
3.3 模型設計
3.3.1 模型結(jié)構(gòu)
3.3.2 表征編碼層
3.3.3 注意力流層
3.3.4 建模層和輸出層
3.4 實驗環(huán)境和配置
3.4.1 數(shù)據(jù)準備
3.4.2 參數(shù)設置
3.4.3 實驗設置
3.5 實驗結(jié)果和分析
3.5.1 目標任務為SQuAD數(shù)據(jù)集上的結(jié)果分析
3.5.2 目標任務為NewsQA數(shù)據(jù)集上的結(jié)果分析
3.5.3 優(yōu)化混合比
3.6 本章總結(jié)
第四章 基于預訓練的多任務學習模型
4.1 引言
4.2 問題描述
4.3 模型設計
4.3.1 模型結(jié)構(gòu)
4.3.2 模型輸入層
4.3.3 模型層
4.3.4 輸出層
4.4 實驗環(huán)境和配置
4.4.1 數(shù)據(jù)準備
4.4.2 參數(shù)設置
4.4.3 實驗設置
4.5 實驗結(jié)果和分析
4.5.1 不同任務下的多任務學習
4.5.2 不同的混合參數(shù)比
4.6 本章總結(jié)
第五章 總結(jié)和展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻
在校期間發(fā)表的論文、科研成果等
致謝
【參考文獻】:
期刊論文
[1]面向機器閱讀理解的候選句抽取算法[J]. 郭鑫,張庚,陳千,王素格. 計算機科學. 2020(05)
本文編號:3157249
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關理論和技術
2.1 機器閱讀理解簡介
2.2 文本表示
2.3 神經(jīng)網(wǎng)絡和深度學習
2.3.1 卷積神經(jīng)網(wǎng)絡
2.3.2 循環(huán)神經(jīng)網(wǎng)絡和長短時記憶網(wǎng)絡
2.3.3 注意力機制
2.4 預訓練
2.5 多任務學習
2.6 本章小結(jié)
第三章 基于BIDAF的多任務學習模型
3.1 引言
3.2 問題描述
3.3 模型設計
3.3.1 模型結(jié)構(gòu)
3.3.2 表征編碼層
3.3.3 注意力流層
3.3.4 建模層和輸出層
3.4 實驗環(huán)境和配置
3.4.1 數(shù)據(jù)準備
3.4.2 參數(shù)設置
3.4.3 實驗設置
3.5 實驗結(jié)果和分析
3.5.1 目標任務為SQuAD數(shù)據(jù)集上的結(jié)果分析
3.5.2 目標任務為NewsQA數(shù)據(jù)集上的結(jié)果分析
3.5.3 優(yōu)化混合比
3.6 本章總結(jié)
第四章 基于預訓練的多任務學習模型
4.1 引言
4.2 問題描述
4.3 模型設計
4.3.1 模型結(jié)構(gòu)
4.3.2 模型輸入層
4.3.3 模型層
4.3.4 輸出層
4.4 實驗環(huán)境和配置
4.4.1 數(shù)據(jù)準備
4.4.2 參數(shù)設置
4.4.3 實驗設置
4.5 實驗結(jié)果和分析
4.5.1 不同任務下的多任務學習
4.5.2 不同的混合參數(shù)比
4.6 本章總結(jié)
第五章 總結(jié)和展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻
在校期間發(fā)表的論文、科研成果等
致謝
【參考文獻】:
期刊論文
[1]面向機器閱讀理解的候選句抽取算法[J]. 郭鑫,張庚,陳千,王素格. 計算機科學. 2020(05)
本文編號:3157249
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3157249.html
最近更新
教材專著