面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究
發(fā)布時(shí)間:2022-12-05 23:54
面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)是自然語(yǔ)言生成領(lǐng)域最前沿的研究任務(wù)之一,旨在給定結(jié)構(gòu)化數(shù)據(jù),生成描述數(shù)據(jù)的相應(yīng)文本。隨著社會(huì)信息化的不斷普及,互聯(lián)網(wǎng)數(shù)據(jù)呈爆炸式增長(zhǎng),撰寫相應(yīng)的文本需要耗費(fèi)大量時(shí)間人力,而面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)則能有效的提高產(chǎn)能,提升效率。但是,目前面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究較少,成果落地不足。因此開展面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究具有極大的研究?jī)r(jià)值和實(shí)際意義。本文圍繞面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)這一課題,開展了三個(gè)子課題的研究;跀(shù)字表示預(yù)訓(xùn)練的數(shù)據(jù)到文本生成技術(shù)模塊,為了賦予數(shù)字更好的區(qū)別于文字的表示,開展了面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)的特性研究,提出了隨機(jī)遮蔽部分?jǐn)?shù)據(jù),要求模型生成計(jì)算該數(shù)據(jù)的等式,從而還原被遮蔽的數(shù)據(jù)的預(yù)訓(xùn)練任務(wù),有效提升了模型對(duì)于數(shù)據(jù)本身的常識(shí)、邏輯和文法信息建模的能力,實(shí)驗(yàn)效果明顯;跀(shù)字拓展與推理的數(shù)據(jù)到文本生成技術(shù)模塊為了進(jìn)一步提升模型的數(shù)字拓展和推理能力,通過(guò)引入多任務(wù)學(xué)習(xí)機(jī)制,在原有的編碼器-解碼器模型中增加了推理數(shù)字的等式解碼器,將其嵌入原有的(文本)解碼器中,并通過(guò)設(shè)立推理按鈕來(lái)進(jìn)行觸發(fā)。當(dāng)模型生成文本的過(guò)程中,如果...
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究意義
1.1.1 課題來(lái)源
1.1.2 課題研究的背景和意義
1.2 國(guó)內(nèi)外在該方向的研究現(xiàn)狀及分析
1.2.1 流水線模型
1.2.2 端到端模型
1.2.3 國(guó)內(nèi)外文獻(xiàn)綜述的簡(jiǎn)析
1.3 主要研究?jī)?nèi)容
第2章 基于數(shù)字表示預(yù)訓(xùn)練的數(shù)據(jù)到文本生成技術(shù)
2.1 引言
2.2 預(yù)訓(xùn)練數(shù)據(jù)的構(gòu)建
2.3 基于層次化的編碼器-解碼器的模型架構(gòu)
2.4 實(shí)驗(yàn)
2.4.1 實(shí)驗(yàn)設(shè)置
2.4.2 評(píng)價(jià)指標(biāo)
2.4.3 結(jié)果分析
2.5 本章小結(jié)
第3章 基于數(shù)字拓展與推理的數(shù)據(jù)到文本生成技術(shù)
3.1 引言
3.2 推理數(shù)字集的構(gòu)建
3.3 基于多任務(wù)學(xué)習(xí)的數(shù)字拓展與推理技術(shù)
3.4 基于強(qiáng)化學(xué)習(xí)的數(shù)字拓展與推理技術(shù)
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 結(jié)果分析
3.6 本章小節(jié)
第4章 基于知識(shí)蒸餾的數(shù)據(jù)到文本生成技術(shù)
4.1 引言
4.2 知識(shí)蒸餾信息的構(gòu)建
4.3 基于對(duì)抗學(xué)習(xí)的知識(shí)蒸餾模型
4.4 基于層次化更新的知識(shí)蒸餾模型
4.5 實(shí)驗(yàn)
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 評(píng)價(jià)指標(biāo)
4.5.3 結(jié)果分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3710617
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究意義
1.1.1 課題來(lái)源
1.1.2 課題研究的背景和意義
1.2 國(guó)內(nèi)外在該方向的研究現(xiàn)狀及分析
1.2.1 流水線模型
1.2.2 端到端模型
1.2.3 國(guó)內(nèi)外文獻(xiàn)綜述的簡(jiǎn)析
1.3 主要研究?jī)?nèi)容
第2章 基于數(shù)字表示預(yù)訓(xùn)練的數(shù)據(jù)到文本生成技術(shù)
2.1 引言
2.2 預(yù)訓(xùn)練數(shù)據(jù)的構(gòu)建
2.3 基于層次化的編碼器-解碼器的模型架構(gòu)
2.4 實(shí)驗(yàn)
2.4.1 實(shí)驗(yàn)設(shè)置
2.4.2 評(píng)價(jià)指標(biāo)
2.4.3 結(jié)果分析
2.5 本章小結(jié)
第3章 基于數(shù)字拓展與推理的數(shù)據(jù)到文本生成技術(shù)
3.1 引言
3.2 推理數(shù)字集的構(gòu)建
3.3 基于多任務(wù)學(xué)習(xí)的數(shù)字拓展與推理技術(shù)
3.4 基于強(qiáng)化學(xué)習(xí)的數(shù)字拓展與推理技術(shù)
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 結(jié)果分析
3.6 本章小節(jié)
第4章 基于知識(shí)蒸餾的數(shù)據(jù)到文本生成技術(shù)
4.1 引言
4.2 知識(shí)蒸餾信息的構(gòu)建
4.3 基于對(duì)抗學(xué)習(xí)的知識(shí)蒸餾模型
4.4 基于層次化更新的知識(shí)蒸餾模型
4.5 實(shí)驗(yàn)
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 評(píng)價(jià)指標(biāo)
4.5.3 結(jié)果分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3710617
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3710617.html
最近更新
教材專著