面向開(kāi)放域問(wèn)答的閱讀理解技術(shù)研究
發(fā)布時(shí)間:2024-01-25 19:39
本課題主要研究閱讀理解技術(shù)在開(kāi)放域問(wèn)答系統(tǒng)中的應(yīng)用,并設(shè)計(jì)了結(jié)合檢索系統(tǒng)和閱讀理解技術(shù)的問(wèn)答系統(tǒng),期望通過(guò)這種模式推動(dòng)閱讀理解技術(shù)的應(yīng)用落地。開(kāi)放域是指提問(wèn)內(nèi)容是不限定領(lǐng)域的。閱讀理解技術(shù)是近幾年來(lái)新興的一種答案抽取技術(shù),通過(guò)預(yù)測(cè)答案開(kāi)始和結(jié)束位置來(lái)定位精確答案。本課題選擇Du Reader作為實(shí)驗(yàn)數(shù)據(jù),因?yàn)镈u Reader中的問(wèn)題是從搜索引擎真實(shí)的用戶搜索記錄中整理出來(lái)的,相比刻意標(biāo)注的問(wèn)題數(shù)據(jù),這種問(wèn)題能夠真實(shí)客觀的反映問(wèn)答系統(tǒng)的需求,實(shí)驗(yàn)結(jié)果也能夠更真實(shí)地反映實(shí)際應(yīng)用效果。本課題的研究?jī)?nèi)容主要有以下幾個(gè)方面,首先,本課題設(shè)計(jì)了面向多篇章的閱讀理解模型。所謂多篇章指的是每個(gè)問(wèn)題對(duì)應(yīng)的候選篇章不止一個(gè),而目前大多數(shù)閱讀理解任務(wù)都是圍繞單篇章展開(kāi)的。多篇章能夠顯著提高答案的召回率,提高了檢索系統(tǒng)的容錯(cuò)率。為了解決多篇章閱讀理解任務(wù),本課題基于當(dāng)前單篇章閱讀理解的模型,做了面向多篇章的改進(jìn)。其次,我們發(fā)現(xiàn)模型定位答案篇章,對(duì)于模型定位答案具有至關(guān)重要的意義,而簡(jiǎn)單地將模型設(shè)計(jì)為先定位篇章,再定位答案的模式又容易造成誤差累計(jì)。于是我們通過(guò)為模型增加一個(gè)篇章排序子任務(wù),訓(xùn)練時(shí)采用多任務(wù)學(xué)習(xí)...
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的和意義
1.1.1 課題的來(lái)源
1.1.2 課題研究的背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)內(nèi)研究現(xiàn)狀
1.2.2 國(guó)外研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外研究現(xiàn)狀簡(jiǎn)析
1.3 主要研究?jī)?nèi)容
1.4 本文章節(jié)安排
第2章 面向多篇章的閱讀理解模型
2.1 引言
2.2 DuReader數(shù)據(jù)介紹
2.3 DuReader數(shù)據(jù)預(yù)處理
2.3.1 文檔處理
2.3.2 答案片段處理
2.4 面向多篇章的閱讀理解模型設(shè)計(jì)
2.4.1 模型結(jié)構(gòu)設(shè)計(jì)概覽
2.4.2 Encoder層介紹
2.4.3 Pointer Network介紹
2.5 實(shí)驗(yàn)結(jié)果及分析
2.5.1 數(shù)據(jù)預(yù)處理相關(guān)實(shí)驗(yàn)
2.5.2 不同Encoder層相關(guān)實(shí)驗(yàn)
2.6 本章小結(jié)
第3章 面向多任務(wù)學(xué)習(xí)的閱讀理解模型
3.1 引言
3.2 面向多任務(wù)學(xué)習(xí)的閱讀理解模型設(shè)計(jì)
3.2.1 多任務(wù)學(xué)習(xí)在本課題中的應(yīng)用
3.2.2 模型結(jié)構(gòu)設(shè)計(jì)概覽
3.2.3 人工特征提取
3.3 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第4章 面向多領(lǐng)域的閱讀理解模型
4.1 引言
4.2 多領(lǐng)域數(shù)據(jù)構(gòu)建
4.3 遷移學(xué)習(xí)
4.4 基于預(yù)訓(xùn)練模型的遷移學(xué)習(xí)
4.5 基于對(duì)抗學(xué)習(xí)的領(lǐng)域自適應(yīng)學(xué)習(xí)框架
4.5.1 對(duì)抗學(xué)習(xí)
4.5.2 模型設(shè)計(jì)
4.6 實(shí)驗(yàn)結(jié)果及分析
4.7 本章小結(jié)
第5章 基于閱讀理解的開(kāi)放域問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 引言
5.2 檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.2.1 離線檢索系統(tǒng)
5.2.2 在線檢索系統(tǒng)
5.3 問(wèn)答系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)
5.3.1 問(wèn)答系統(tǒng)設(shè)計(jì)
5.3.2 問(wèn)答系統(tǒng)實(shí)現(xiàn)
5.4 實(shí)驗(yàn)結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3885438
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的和意義
1.1.1 課題的來(lái)源
1.1.2 課題研究的背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)內(nèi)研究現(xiàn)狀
1.2.2 國(guó)外研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外研究現(xiàn)狀簡(jiǎn)析
1.3 主要研究?jī)?nèi)容
1.4 本文章節(jié)安排
第2章 面向多篇章的閱讀理解模型
2.1 引言
2.2 DuReader數(shù)據(jù)介紹
2.3 DuReader數(shù)據(jù)預(yù)處理
2.3.1 文檔處理
2.3.2 答案片段處理
2.4 面向多篇章的閱讀理解模型設(shè)計(jì)
2.4.1 模型結(jié)構(gòu)設(shè)計(jì)概覽
2.4.2 Encoder層介紹
2.4.3 Pointer Network介紹
2.5 實(shí)驗(yàn)結(jié)果及分析
2.5.1 數(shù)據(jù)預(yù)處理相關(guān)實(shí)驗(yàn)
2.5.2 不同Encoder層相關(guān)實(shí)驗(yàn)
2.6 本章小結(jié)
第3章 面向多任務(wù)學(xué)習(xí)的閱讀理解模型
3.1 引言
3.2 面向多任務(wù)學(xué)習(xí)的閱讀理解模型設(shè)計(jì)
3.2.1 多任務(wù)學(xué)習(xí)在本課題中的應(yīng)用
3.2.2 模型結(jié)構(gòu)設(shè)計(jì)概覽
3.2.3 人工特征提取
3.3 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第4章 面向多領(lǐng)域的閱讀理解模型
4.1 引言
4.2 多領(lǐng)域數(shù)據(jù)構(gòu)建
4.3 遷移學(xué)習(xí)
4.4 基于預(yù)訓(xùn)練模型的遷移學(xué)習(xí)
4.5 基于對(duì)抗學(xué)習(xí)的領(lǐng)域自適應(yīng)學(xué)習(xí)框架
4.5.1 對(duì)抗學(xué)習(xí)
4.5.2 模型設(shè)計(jì)
4.6 實(shí)驗(yàn)結(jié)果及分析
4.7 本章小結(jié)
第5章 基于閱讀理解的開(kāi)放域問(wèn)答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 引言
5.2 檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.2.1 離線檢索系統(tǒng)
5.2.2 在線檢索系統(tǒng)
5.3 問(wèn)答系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)
5.3.1 問(wèn)答系統(tǒng)設(shè)計(jì)
5.3.2 問(wèn)答系統(tǒng)實(shí)現(xiàn)
5.4 實(shí)驗(yàn)結(jié)果及分析
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3885438
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3885438.html
最近更新
教材專著