融入特征和注意力機制的問題生成方法研究
發(fā)布時間:2023-02-14 20:18
問題生成任務旨在為文本生成相應的自然語言問句。傳統(tǒng)方法主要通過復雜的人工規(guī)則將陳述句轉化為自然問句,以此方法生成的問句往往表述簡單,普適性較低。目前,深度學習法方法已經被應用于問題自動生成任務,其中,以端到端的架構為主。深度學習方法直接將陳述句作為模型的輸入,忽略了密令的相關信息。其中,密令是句子中的連續(xù)短語片段,生成問句所需要關注的“潛在提問對象”,又稱為答案源。從而,其往往使得模型的性能受限于固有的問題提問方式,無法適應原句(答案源)的自身特點。因此,本文利用特征和注意力機制加強關注陳述句中的密令進行問題生成研究,主要內容包含以下三個方面:(1)基于密令位里信息的問題生成現(xiàn)有的問題生成方法以端到端的序列化生成模型為基本框架,該方法由于對句子中密令的關注度不足,使得模型無法適應原句(答案源)的語言特性。針對此弊端,本文提出一種基于密令位置信息的點對點的問題生成模型。該模型將密令位置信息與全句語義信息進行融合。本方法的目標是通過添加密令位置信息輔助原有模型自動關注密令。實驗結果顯示,相比于基準系統(tǒng),本方法在SQuAD數(shù)據上BLEU-4指標提高1.98個百分點。(2)基于疑問詞識別的問題...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.2.1 文本生成研究現(xiàn)狀
1.2.2 問題生成的研究現(xiàn)狀
1.3 問題生成現(xiàn)有研究中存在的問題
1.4 本文的研究內容和組織結構
第二章 問題生成概述
2.1 問題生成方法
2.2 端到端模型
2.2.1 循環(huán)神經網絡
2.2.2 編碼-解碼過程
2.3 語料概述
2.4 評價方法
2.5 本章小結
第三章 基于密令位置信息的問題生成
3.1 研究動機
3.2 融合密令位置信息的問題生成模型
3.2.1 密令位置信息表示
3.2.2 句子語義信息編碼
3.2.3 密令位置信息特征抽取
3.2.4 門控注意力解碼層
3.3 實驗及結果分析
3.3.1 語料配置
3.3.2 實驗配置
3.3.3 參數(shù)配置
3.3.4 實驗結果及分析
3.4 本章小結
第四章 基于疑問詞識別的問題生成方法
4.1 研究動機
4.2 基于疑問詞識別的問題生成
4.2.1 基于密令的疑問詞預測模型
4.2.2 端到端的問題生成模型
4.3 實驗及結果分析
4.3.1 語料配置
4.3.2 實驗配置
4.3.3 評價方法
4.3.4 實驗結果及分析
4.4 本章小結
第五章 基于雙向注意力機制的問題生成網絡
5.1 研究動機
5.2 基于指針網絡的問題生成
5.2.1 注意力機制獲取上下文信息
5.2.2 基于指針網絡的問題生成模型
5.3 基于雙向注意力機制的問題生成方法
5.4 實驗配置與分析
5.4.1 實驗配置
5.4.2 實驗結果與分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 工作展望
參考文獻
攻讀學位期間公開發(fā)表的論文
致謝
本文編號:3742950
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.2.1 文本生成研究現(xiàn)狀
1.2.2 問題生成的研究現(xiàn)狀
1.3 問題生成現(xiàn)有研究中存在的問題
1.4 本文的研究內容和組織結構
第二章 問題生成概述
2.1 問題生成方法
2.2 端到端模型
2.2.1 循環(huán)神經網絡
2.2.2 編碼-解碼過程
2.3 語料概述
2.4 評價方法
2.5 本章小結
第三章 基于密令位置信息的問題生成
3.1 研究動機
3.2 融合密令位置信息的問題生成模型
3.2.1 密令位置信息表示
3.2.2 句子語義信息編碼
3.2.3 密令位置信息特征抽取
3.2.4 門控注意力解碼層
3.3 實驗及結果分析
3.3.1 語料配置
3.3.2 實驗配置
3.3.3 參數(shù)配置
3.3.4 實驗結果及分析
3.4 本章小結
第四章 基于疑問詞識別的問題生成方法
4.1 研究動機
4.2 基于疑問詞識別的問題生成
4.2.1 基于密令的疑問詞預測模型
4.2.2 端到端的問題生成模型
4.3 實驗及結果分析
4.3.1 語料配置
4.3.2 實驗配置
4.3.3 評價方法
4.3.4 實驗結果及分析
4.4 本章小結
第五章 基于雙向注意力機制的問題生成網絡
5.1 研究動機
5.2 基于指針網絡的問題生成
5.2.1 注意力機制獲取上下文信息
5.2.2 基于指針網絡的問題生成模型
5.3 基于雙向注意力機制的問題生成方法
5.4 實驗配置與分析
5.4.1 實驗配置
5.4.2 實驗結果與分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 工作展望
參考文獻
攻讀學位期間公開發(fā)表的論文
致謝
本文編號:3742950
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3742950.html
最近更新
教材專著