【摘要】:情感計算是人工智能領(lǐng)域中新興的研究方向,其目的是通過賦予計算機(jī)識別、理解、表達(dá)和適應(yīng)人的情感的能力來建立和諧人機(jī)交互環(huán)境,并使計算機(jī)具有更高、更全面的智能。人機(jī)情感交互是情感計算方向的核心研究課題,情感對話系統(tǒng)是實現(xiàn)多模態(tài)人機(jī)情感交互的重要途徑之一。情感對話管理是情感對話系統(tǒng)的核心模塊,本文主要對其建模方法及應(yīng)用開展研究。本文研究的主要切入點是在現(xiàn)有對話管理模型的基礎(chǔ)上,融入用戶的情感信息因素,面向特定對話領(lǐng)域構(gòu)建合理有效的情感對話管理模型。本文的主要研究內(nèi)容包括:(1)提出了一種基于雙有限狀態(tài)機(jī)(TFSM)的情感對話管理模型。通過兩個有限狀態(tài)機(jī)來分別對用戶和系統(tǒng)進(jìn)行建模,用兩個狀態(tài)機(jī)之間的信息交換來模擬人機(jī)情感對話過程,構(gòu)建了一個能同時提供信息查詢和情感交互功能的情感對話系統(tǒng)框架。進(jìn)一步討論了系統(tǒng)信息查詢與情感響應(yīng)模塊的具體實現(xiàn)方法,包括基于任務(wù)樹的多主題信息查詢和嵌入一個子狀態(tài)機(jī)來實現(xiàn)多輪的人機(jī)情感交互。在評價方法上,利用部分可觀察馬爾可夫決策過程(POMDP)模型中回報值函數(shù)對基于雙有限狀態(tài)機(jī)的情感對話管理模型的系統(tǒng)表現(xiàn)進(jìn)行了分析。實驗結(jié)果表明:為用戶建立一個獨立的有限狀態(tài)機(jī)模型有利于系統(tǒng)預(yù)測用戶的對話狀態(tài),基于TFSM的對話管理模型的表現(xiàn)要優(yōu)于傳統(tǒng)的有限狀態(tài)機(jī)模型。(2)提出了一種基于分解POMDP的情感對話管理模型。為了有效的響應(yīng)用戶在對話過程中的情感狀態(tài),新模型將用戶的狀態(tài)空間分解為目標(biāo)狀態(tài)和情感狀態(tài)兩部分,且首次將系統(tǒng)動作空間分解為目標(biāo)響應(yīng)和情感響應(yīng)兩部分,分別應(yīng)對用戶的目標(biāo)狀態(tài)和情感狀態(tài),系統(tǒng)的獎勵值函數(shù)也相應(yīng)地更新為這兩部分動作獎勵值的加權(quán)和。在此基礎(chǔ)上,建立了新的用戶目標(biāo)、情感模型及系統(tǒng)觀察模型,并據(jù)此提出了基于分解POMDP的情感對話管理模型,該模型致力于在對話過程中同時響應(yīng)用戶的目標(biāo)和情感。以智能音樂播放器為例闡述了新模型的實際應(yīng)用,并評估了模型關(guān)鍵參數(shù)對系統(tǒng)表現(xiàn)的影響。仿真實驗結(jié)果表明,基于分解POMDP的情感對話管理模型應(yīng)用于智能音樂播放系統(tǒng)是合理且可行的。(3)研究了基于POMDP的情感對話管理模型的應(yīng)用移植。面向情感教學(xué)系統(tǒng)這一特定的應(yīng)用領(lǐng)域,以概念學(xué)習(xí)和情感交互為預(yù)定對話任務(wù),將用戶的狀態(tài)空間分解為目標(biāo)狀態(tài)、認(rèn)知狀態(tài)和情感狀態(tài),系統(tǒng)的動作空間則仍被分解成兩部分,包括學(xué)習(xí)目標(biāo)響應(yīng)和情感響應(yīng)。在此基礎(chǔ)上,對之前提出的分解POMDP情感對話模型進(jìn)行了改進(jìn)和推廣,提出了一種新的面向情感教學(xué)系統(tǒng)的分解POMDP情感對話管理模型。仿真實驗結(jié)果表明,基于該分解模型的情感家教系統(tǒng)更有利于那些學(xué)習(xí)能力較弱的學(xué)生,且適合較大規(guī)模的概念學(xué)習(xí)。這些結(jié)果都在一定程度上驗證了模型的合理性和可行性。(4)綜述了對話管理建模方法及應(yīng)用領(lǐng)域的研究現(xiàn)狀,從模型原理、研究進(jìn)展、模型優(yōu)缺點等角度詳細(xì)剖析了幾種常用的對話管理模型,包括有限狀態(tài)機(jī)、填槽法、馬爾可夫決策過程(MDP)、POMDP、基于實例的、基于規(guī)劃的、基于貝葉斯網(wǎng)絡(luò)等,為情感對話管理建模方法的創(chuàng)新奠定了理論基礎(chǔ)。
【圖文】:
多模態(tài)對話系統(tǒng)[4()]。逡逑通常一個面向任務(wù)的口語對話系統(tǒng)都是由自動語音識別、自然語言理解、對逡逑話管理、自然語言生成和語音合成五個部分構(gòu)成,系統(tǒng)框架如圖1.2所示。逡逑10逡逑

統(tǒng)表現(xiàn)的各個要素貢獻(xiàn)歸一化為單一性能評價函數(shù),認(rèn)為口語對話系統(tǒng)的最高目逡逑標(biāo)是用戶滿意度的最大化,包括任務(wù)成功率最大化和對話代價最小化兩方面。逡逑口語對話系統(tǒng)的評價指標(biāo)有很多,,其分類方式與評價的角度有關(guān),如圖1.3所逡逑示。從評價內(nèi)容上可以分為整體評價和局部評價,局部評價是指對系統(tǒng)的單一模逡逑塊的某些性能進(jìn)行評估,例如語音識別模塊關(guān)鍵詞識別率、對話管理模塊的回答逡逑成功率等,目前較多的評測方法都傾向于將系統(tǒng)作為一個整體進(jìn)行評價;從評價逡逑的性質(zhì)上整體評價又可以分為主觀評價和客觀評價。主觀評價是通過諸如用戶滿逡逑意度、對話自然度等主觀性指標(biāo)來體現(xiàn),客觀評價則是通過一些量化指標(biāo)來評估,逡逑大致可分為三類:第一類是任務(wù)完成率,包括對話成功率、回答正確率等類似指逡逑標(biāo);第二類是對話代價,包括對話回合數(shù)、對話長度、任務(wù)完成時間、系統(tǒng)響應(yīng)逡逑時間等;第三類是對話得分,包括回報值、獎勵值、對話得分等。相比較而言,逡逑客觀評價更具有說服力和易操作性。也存在一些其他的分類方法
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 許高攀;曾文華;黃翠蘭;;智能教學(xué)系統(tǒng)研究綜述[J];計算機(jī)應(yīng)用研究;2009年11期
2 雷建軍;楊震;劉剛;郭軍;;噪聲魯棒語音識別研究綜述[J];計算機(jī)應(yīng)用研究;2009年04期
3 孟慶梅;吳偉國;;Artificial emotional model based on finite state machine[J];Journal of Central South University of Technology;2008年05期
4 吳彥文;劉偉;張昆明;;基于情感識別的智能教學(xué)系統(tǒng)研究[J];計算機(jī)工程與設(shè)計;2008年09期
5 楊國亮;任金霞;王志良;;基于情緒心理學(xué)的情感建模[J];計算機(jī)工程;2007年22期
6 姚琳;梁春霞;張德干;;基于實例推理的人機(jī)對話系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機(jī)應(yīng)用;2007年03期
7 王志良;喬向杰;王超;余軍;解侖;;基于自定義空間和OCC模型的情緒建模研究[J];計算機(jī)工程;2007年04期
8 拜戰(zhàn)勝;藍(lán)嵐;彭佳紅;陳哲;;對話系統(tǒng)中控制模型的比較研究[J];鄭州大學(xué)學(xué)報(理學(xué)版);2006年04期
9 張雪元;王志良;永井正武;;機(jī)器人情感交互模型研究[J];計算機(jī)工程;2006年24期
10 王志良;;人工心理與人工情感[J];智能系統(tǒng)學(xué)報;2006年01期
相關(guān)博士學(xué)位論文 前1條
1 魏松;人機(jī)對話系統(tǒng)中若干關(guān)鍵問題研究[D];北京郵電大學(xué);2007年
本文編號:
2673666
本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/2673666.html