人機(jī)對話質(zhì)量評估技術(shù)研究
發(fā)布時間:2022-02-24 19:01
伴隨著信息咨詢需求的不斷增加,人機(jī)對話交互的場景越來越多。一般的對話中用戶帶著明確的目的而來,希望得到滿足特定條件的信息或服務(wù),例如:訂餐,訂票,尋找音樂、電影或某種商品等等,并且由于用戶的需求可能比較復(fù)雜,需要分多輪進(jìn)行陳述,用戶也可能在對話過程中不斷修改或完善自己的需求。此外,當(dāng)用戶的陳述的需求不夠具體和明確的時候,機(jī)器也可以通過詢問、澄清或確認(rèn)來幫助用戶找到滿意的結(jié)果。因此需要從對話過程中提取出用戶表達(dá)的信息特征,建立合適的對話質(zhì)量評估模型,從而有助于人們?nèi)ジ纳茩C(jī)器語言對話技巧,對提高用戶咨詢滿意度具有重要意義。在本文工作中,將重點放在了多輪對話的語義特征上,利用多種深度網(wǎng)絡(luò)模型去提取語言特征,并針對與中文對話提出相關(guān)模型,主要工作包括以下幾個方面:本文首先利用統(tǒng)計的對話特征進(jìn)行學(xué)習(xí),包括LR、SVM、決策樹等傳統(tǒng)機(jī)器學(xué)習(xí)方法對人工添加時間特征的樣本數(shù)據(jù)的訓(xùn)練以及以循環(huán)神經(jīng)網(wǎng)絡(luò)模型對交互歷史特征的自動提取,結(jié)合所提出的各項指標(biāo)結(jié)果對比發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型能夠有效地捕獲對話序列特征。隨后基于NLP相關(guān)研究基礎(chǔ),僅從對話文本出發(fā),不再做人工特征的提取,提出了利用BiLSTM、1D-CNN...
【文章來源】:西安電子科技大學(xué)陜西省211工程院校教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景與意義
1.2 人機(jī)對話系統(tǒng)的發(fā)展
1.3 人機(jī)對話質(zhì)量評估的研究現(xiàn)狀
1.4 研究思路
1.5 本文結(jié)構(gòu)
第二章 傳統(tǒng)對話評估方法
2.1 引言
2.2 人機(jī)對話系統(tǒng)概述
2.2.1 LEGO公交查詢系統(tǒng)介紹
2.2.2 數(shù)據(jù)集統(tǒng)計特征介紹
2.3 基于統(tǒng)計特征的模型介紹
2.3.1 傳統(tǒng)機(jī)器學(xué)習(xí)模型
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)的模型
2.4 對話質(zhì)量評估指標(biāo)
2.5 實驗及結(jié)果分析
2.5.1 加入時間窗的傳統(tǒng)方法
2.5.2 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.6 本章小結(jié)
第三章 基于NLP的對話質(zhì)量評估
3.1 引言
3.2 詞嵌入層
3.2.1 詞袋模型
3.2.2 詞查表
3.3 對話文本特征提取
3.3.1 BiLSTM模型
3.3.2 1D-CNN模型
3.3.3 Multi-head Attention
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)預(yù)處理
3.4.2 模型結(jié)果對比分析
3.4.3 文本加錯實驗
3.5 本章小結(jié)
第四章 中文對話系統(tǒng)的評估方法
4.1 引言
4.2 中文語言特性分析
4.2.1 分詞方式
4.2.2 中文字形
4.3 基于CNN的對話象形特征提取
4.3.1 田字格CNN模型
4.3.2 群卷積模型
4.3.3 多任務(wù)輔助學(xué)習(xí)
4.3.4 整體模型
4.4 實驗及結(jié)果分析
4.4.1 中文語料庫的構(gòu)建
4.4.2 漢字圖像集
4.4.3 模型參數(shù)及結(jié)果分析
4.5 總結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來研究展望
參考文獻(xiàn)
致謝
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]SIRI智能語音系統(tǒng)在汽車上的應(yīng)用[J]. 劉思源. 中國新技術(shù)新產(chǎn)品. 2014(09)
[2]音頻檢索技術(shù)概述[J]. 張華. 廣東通信技術(shù). 2013(07)
[3]詞典與統(tǒng)計方法結(jié)合的中文分詞模型研究及應(yīng)用[J]. 蔣建洪,趙嵩正,羅玫. 計算機(jī)工程與設(shè)計. 2012(01)
[4]中文分詞算法概述[J]. 龍樹全,趙正文,唐華. 電腦知識與技術(shù). 2009(10)
本文編號:3643329
【文章來源】:西安電子科技大學(xué)陜西省211工程院校教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景與意義
1.2 人機(jī)對話系統(tǒng)的發(fā)展
1.3 人機(jī)對話質(zhì)量評估的研究現(xiàn)狀
1.4 研究思路
1.5 本文結(jié)構(gòu)
第二章 傳統(tǒng)對話評估方法
2.1 引言
2.2 人機(jī)對話系統(tǒng)概述
2.2.1 LEGO公交查詢系統(tǒng)介紹
2.2.2 數(shù)據(jù)集統(tǒng)計特征介紹
2.3 基于統(tǒng)計特征的模型介紹
2.3.1 傳統(tǒng)機(jī)器學(xué)習(xí)模型
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)的模型
2.4 對話質(zhì)量評估指標(biāo)
2.5 實驗及結(jié)果分析
2.5.1 加入時間窗的傳統(tǒng)方法
2.5.2 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.6 本章小結(jié)
第三章 基于NLP的對話質(zhì)量評估
3.1 引言
3.2 詞嵌入層
3.2.1 詞袋模型
3.2.2 詞查表
3.3 對話文本特征提取
3.3.1 BiLSTM模型
3.3.2 1D-CNN模型
3.3.3 Multi-head Attention
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)預(yù)處理
3.4.2 模型結(jié)果對比分析
3.4.3 文本加錯實驗
3.5 本章小結(jié)
第四章 中文對話系統(tǒng)的評估方法
4.1 引言
4.2 中文語言特性分析
4.2.1 分詞方式
4.2.2 中文字形
4.3 基于CNN的對話象形特征提取
4.3.1 田字格CNN模型
4.3.2 群卷積模型
4.3.3 多任務(wù)輔助學(xué)習(xí)
4.3.4 整體模型
4.4 實驗及結(jié)果分析
4.4.1 中文語料庫的構(gòu)建
4.4.2 漢字圖像集
4.4.3 模型參數(shù)及結(jié)果分析
4.5 總結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來研究展望
參考文獻(xiàn)
致謝
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]SIRI智能語音系統(tǒng)在汽車上的應(yīng)用[J]. 劉思源. 中國新技術(shù)新產(chǎn)品. 2014(09)
[2]音頻檢索技術(shù)概述[J]. 張華. 廣東通信技術(shù). 2013(07)
[3]詞典與統(tǒng)計方法結(jié)合的中文分詞模型研究及應(yīng)用[J]. 蔣建洪,趙嵩正,羅玫. 計算機(jī)工程與設(shè)計. 2012(01)
[4]中文分詞算法概述[J]. 龍樹全,趙正文,唐華. 電腦知識與技術(shù). 2009(10)
本文編號:3643329
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3643329.html
最近更新
教材專著