情感語(yǔ)音的非線性特征研究
本文關(guān)鍵詞:情感語(yǔ)音的非線性特征研究,由筆耕文化傳播整理發(fā)布。
【摘要】:情感語(yǔ)音識(shí)別已經(jīng)成為人機(jī)交互的重要研究領(lǐng)域之一。通過感知情感狀態(tài),計(jì)算機(jī)可以對(duì)人類的行為進(jìn)行簡(jiǎn)單地認(rèn)知并采用更為人性化的方式進(jìn)行交流,拓展了人機(jī)交互的更多可能性。情感語(yǔ)音識(shí)別是通過計(jì)算機(jī)手段從說話人的語(yǔ)音信號(hào)中識(shí)別出情感狀態(tài)。鑒于富含情感的溝通對(duì)社會(huì)關(guān)系的重要性,情感語(yǔ)音識(shí)別在人機(jī)對(duì)話、情感計(jì)算、心理和精神疾病診斷等方面都有日趨廣泛的應(yīng)用潛力。由于情感的多模態(tài)性和自發(fā)性,以及情感理論相關(guān)研究的滯后性等多種原因的存在,仍然沒有建立起完全成熟的情感識(shí)別系統(tǒng)。結(jié)合當(dāng)前的情感語(yǔ)音識(shí)別研究狀況與實(shí)際需要,本文首先對(duì)情感語(yǔ)音數(shù)據(jù)庫(kù)、特征提取以及識(shí)別網(wǎng)絡(luò)部分三個(gè)部分分別進(jìn)行介紹,然后重點(diǎn)對(duì)情感語(yǔ)音特征提取的方法和手段進(jìn)行詳盡的研究和論述,提出了基于語(yǔ)音發(fā)聲機(jī)理混沌特性的新非線性特征,實(shí)驗(yàn)證明了本文提取的非線性特征彌補(bǔ)了以往提取的特征不足之處。主要的研究?jī)?nèi)容包括如下部分:(1)介紹了情感語(yǔ)音識(shí)別的基礎(chǔ)知識(shí),包括常用的數(shù)據(jù)庫(kù)、特征提取和識(shí)別網(wǎng)絡(luò)。針對(duì)常用的情感特征(韻律特征、基于譜的特征、音質(zhì)特征和TEO能量算子)和識(shí)別網(wǎng)絡(luò)展開了理論簡(jiǎn)介。介紹了語(yǔ)音發(fā)聲和傳播過程中體現(xiàn)出的非線性特性,接著采用非線性動(dòng)力學(xué)理論分析方法,從功率譜分析、主分量分析、相空間重構(gòu)三個(gè)方面驗(yàn)證了情感語(yǔ)音是具有混沌特性的。(2)在驗(yàn)證了情感語(yǔ)音信號(hào)的混沌特性的基礎(chǔ)上,將情感語(yǔ)音信號(hào)看作一維時(shí)間學(xué)列,采用時(shí)間序列分析方法實(shí)現(xiàn)情感語(yǔ)音的高維狀態(tài)空間的重構(gòu),為進(jìn)一步提取基于情感語(yǔ)音混沌特性的非線性特征做準(zhǔn)備。為了實(shí)現(xiàn)情感語(yǔ)音的高維空間重構(gòu),本文分別采用鄰接誤差法、平均互信息法以及C-C方法得到一維情感語(yǔ)音信號(hào)相空間重構(gòu)需要的嵌入維數(shù)和延時(shí)時(shí)間兩個(gè)參數(shù),為非線性分析方法提取情感語(yǔ)音非線性新特征提供了條件。(3)提出將情感語(yǔ)音信號(hào)處理與非線性動(dòng)力學(xué)模型相結(jié)合的方法并仿真實(shí)現(xiàn)了基于情感語(yǔ)音混沌特性的非線性特征提取。這些特征包括最小延遲時(shí)間、關(guān)聯(lián)維數(shù)、Kolmogorov熵、最大Lyapunov指數(shù)和以及用于描述時(shí)間序列相關(guān)性的Hurst指數(shù)特征,并對(duì)上述的非線性特征與情感區(qū)分能力之間的關(guān)聯(lián)性進(jìn)行了定性分析,通過實(shí)驗(yàn)驗(yàn)證了基于混沌特性的語(yǔ)音情感非線性特征可以作為語(yǔ)音情感區(qū)分的有效的新特征量。(4)利用基于混沌特性的情感語(yǔ)音非線性特征進(jìn)行了情感語(yǔ)音識(shí)別。首先選擇在公開的Berlin語(yǔ)音數(shù)據(jù)庫(kù)和自建的離散情感語(yǔ)料庫(kù)TYUT2.0作為實(shí)驗(yàn)備選數(shù)據(jù)庫(kù),然后分別提取了韻律學(xué)特征、MFCCs和非線性特征及其對(duì)應(yīng)的統(tǒng)計(jì)特征,其次對(duì)語(yǔ)音情感非線性特征、韻律學(xué)特征和MFCCs的性能定性分析,確定了非線性特征是區(qū)分語(yǔ)音情感的有效特征;最后分別使用上述三類特征的不同特征融合作為識(shí)別系統(tǒng)的輸入。通過識(shí)別率對(duì)比,驗(yàn)證了融合非線性特征后的系統(tǒng)識(shí)別性能有了較為顯著的改善。
【關(guān)鍵詞】:情感語(yǔ)音識(shí)別 混沌特性 非線性特征 支持向量機(jī)
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-16
- 1.1 研究背景和意義10-11
- 1.2 研究現(xiàn)狀11-13
- 1.2.1 語(yǔ)音情感識(shí)別研究現(xiàn)狀11-13
- 1.3 語(yǔ)音情感識(shí)別存在問題13-14
- 1.4 研究?jī)?nèi)容與論文安排14-16
- 第二章 情感語(yǔ)音識(shí)別系統(tǒng)16-28
- 2.1 情感語(yǔ)音數(shù)據(jù)庫(kù)16-17
- 2.2 情感語(yǔ)音特征提取17-22
- 2.2.1 韻律特征18-19
- 2.2.2 基于譜的特征19-21
- 2.2.3 音質(zhì)特征21
- 2.2.4 TEO能量算子21-22
- 2.3 情感語(yǔ)音融合特征22-23
- 2.4 情感語(yǔ)音識(shí)別網(wǎng)絡(luò)23-26
- 2.4.1 支持向量機(jī)23-24
- 2.4.2 隱馬爾科夫模型24-25
- 2.4.3 高斯混合模型25-26
- 2.4.4 模糊認(rèn)知圖26
- 2.5 本章小結(jié)26-28
- 第三章 情感語(yǔ)音的混沌特性研究28-44
- 3.1 語(yǔ)音的混沌特性28-30
- 3.2 情感語(yǔ)音信號(hào)的混沌特性30-37
- 3.2.1 功率譜方法30-31
- 3.2.2 情感語(yǔ)音信號(hào)的主分量分析31-32
- 3.2.3 情感語(yǔ)音信號(hào)的相空間重構(gòu)32-37
- 3.3 情感語(yǔ)音混沌特征量37-40
- 3.3.1 關(guān)聯(lián)維數(shù)37-38
- 3.3.2 Kolmogorov熵38
- 3.3.3 最大Lyapunov指數(shù)38-40
- 3.4 Hurst指數(shù)40-41
- 3.5 本章小結(jié)41-44
- 第四章 基于混沌特性的情感語(yǔ)音識(shí)別44-56
- 4.1 情感語(yǔ)音數(shù)據(jù)庫(kù)處理44
- 4.2 情感語(yǔ)音信號(hào)預(yù)處理44-45
- 4.3 情感語(yǔ)音特性的提取45
- 4.4 基于混沌特性的情感語(yǔ)音識(shí)別實(shí)驗(yàn)45-52
- 4.4.1 最小延遲時(shí)間特征在情感語(yǔ)音識(shí)別中的應(yīng)用45-46
- 4.4.2 關(guān)聯(lián)維數(shù)特征在情感語(yǔ)音識(shí)別中的應(yīng)用46-47
- 4.4.3 Kolmogorov熵特征在情感語(yǔ)音識(shí)別中的應(yīng)用47
- 4.4.4 最大Lyapunov指數(shù)特征在情感語(yǔ)音識(shí)別中的應(yīng)用47-48
- 4.4.5 Hurst指數(shù)特征在情感語(yǔ)音識(shí)別中的應(yīng)用48-49
- 4.4.6 混沌非線性特征在情感語(yǔ)音識(shí)別中的應(yīng)用49-52
- 4.5 基于融合特征的情感語(yǔ)音識(shí)別實(shí)驗(yàn)52-55
- 4.6 本章小結(jié)55-56
- 第五章 總結(jié)與展望56-60
- 5.1 研究總結(jié)56-57
- 5.2 工作展望57-60
- 參考文獻(xiàn)60-65
- 致謝65-66
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄66
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 夏金祥;范平志;;基于次用戶協(xié)作的主用戶頻譜洞周期穩(wěn)態(tài)特征檢測(cè)[J];電路與系統(tǒng)學(xué)報(bào);2009年03期
2 潘廣林;梁彥;金術(shù)玲;潘泉;程詠梅;;基于子束變換的自適應(yīng)線性特征檢測(cè)[J];火力與指揮控制;2008年10期
3 劉偉;紀(jì)玉波;;一種改進(jìn)的人眼特征檢測(cè)方法[J];遼寧石油化工大學(xué)學(xué)報(bào);2010年03期
4 張寶政;;基于實(shí)時(shí)擊鍵特征檢測(cè)的游戲禁止算法研究[J];信息安全與技術(shù);2012年09期
5 黃志武;張銳;;基于近紅外光和可變形模板的人眼特征檢測(cè)方法[J];電腦知識(shí)與技術(shù);2008年07期
6 黃家m:;鄭日榮;曾繩濤;;心電信號(hào)特征檢測(cè)算法研究[J];機(jī)電工程技術(shù);2013年08期
7 陳偉;孫勇;楊義先;鈕心忻;;面向特征的信息隱藏檢測(cè)研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年03期
8 楊恒;王慶;;一種新的局部不變特征檢測(cè)和描述算法[J];計(jì)算機(jī)學(xué)報(bào);2010年05期
9 范虹;孟慶豐;張優(yōu)云;高強(qiáng);;基于三階累積量對(duì)角切片的信號(hào)特征檢測(cè)[J];計(jì)算機(jī)工程與應(yīng)用;2006年36期
10 吳訓(xùn)威,盧仰堅(jiān),夏銀水;三值序列的特征檢測(cè)及其產(chǎn)生[J];浙江大學(xué)學(xué)報(bào)(理學(xué)版);2001年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 呂堯新;劉志強(qiáng);朱祥華;;基于相位一致性原理的圖像特征檢測(cè)技術(shù)[A];第九屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2004年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 ;IDS的演變[N];網(wǎng)絡(luò)世界;2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 徐政五;基于太赫茲雷達(dá)的人體心跳和微動(dòng)特征檢測(cè)方法研究[D];電子科技大學(xué);2014年
2 王建輝;實(shí)時(shí)視覺特征檢測(cè)與匹配硬件架構(gòu)研究[D];華中科技大學(xué);2015年
3 鐘清流;時(shí)序、圖像特征檢測(cè)的理論、方法及應(yīng)用研究[D];中南大學(xué);2008年
4 杜剛;新聞數(shù)據(jù)中突發(fā)話題檢測(cè)研究[D];北京郵電大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 常旭劍;基于FAST檢測(cè)及SIFT描述的特征檢測(cè)算法[D];中北大學(xué);2015年
2 許可樂;圖像局部不變特征檢測(cè)與描述技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
3 周圣焱;面向光學(xué)生物傳感器的海量光譜信號(hào)特征檢測(cè)系統(tǒng)[D];上海交通大學(xué);2015年
4 宋愷珉;基于統(tǒng)計(jì)特征的網(wǎng)絡(luò)入侵檢測(cè)技術(shù)研究[D];南京郵電大學(xué);2015年
5 姚慧;情感語(yǔ)音的非線性特征研究[D];太原理工大學(xué);2016年
6 姜艷;對(duì)基于點(diǎn)表示的物體進(jìn)行繪制和特征檢測(cè)的技術(shù)的研究與實(shí)現(xiàn)[D];吉林大學(xué);2008年
7 馮小平;基于高光譜成像技術(shù)的血跡形態(tài)特征檢測(cè)研究[D];重慶理工大學(xué);2013年
8 劉傳靜;三角網(wǎng)格曲面的分級(jí)特征檢測(cè)算法研究[D];大連理工大學(xué);2006年
9 楊云英;仿射不變特征檢測(cè)算法性能分析[D];山西大學(xué);2012年
10 呂思凡;人臉皮膚圖像特征檢測(cè)[D];北京交通大學(xué);2008年
本文關(guān)鍵詞:情感語(yǔ)音的非線性特征研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):382687
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/382687.html