基于語(yǔ)音信息的多特征情緒識(shí)別算法研究
發(fā)布時(shí)間:2017-07-05 03:11
本文關(guān)鍵詞:基于語(yǔ)音信息的多特征情緒識(shí)別算法研究
更多相關(guān)文章: 語(yǔ)音情緒識(shí)別 樣本熵 端點(diǎn)檢測(cè) 貢獻(xiàn)分析
【摘要】:情感計(jì)算是對(duì)與情感相關(guān)、來(lái)源于情感或者影響情感方面的計(jì)算,其目的是賦予智能機(jī)器感知,理解和表達(dá)各種情感狀態(tài)的能力。情感識(shí)別是情感計(jì)算的關(guān)鍵研究?jī)?nèi)容,是實(shí)現(xiàn)和諧人機(jī)交互的重要基礎(chǔ)。目前,情感計(jì)算主要以表情、姿態(tài)、語(yǔ)音、文本和生理信號(hào)為基礎(chǔ)進(jìn)行情感識(shí)別,其中語(yǔ)音信號(hào),是情感信息表達(dá)的主要載體,且獲取方便,越來(lái)越受到研究人員的重視。尋找能夠準(zhǔn)確表征語(yǔ)音情緒狀態(tài)的特征參數(shù)和有效的情緒狀態(tài)識(shí)別模型是語(yǔ)音情緒識(shí)別的主要困難,一直是研究的熱點(diǎn)之一。本文主要以語(yǔ)音信息的情感特征參數(shù)和情感模型對(duì)四種情緒(happy, angry, sad, fear)識(shí)別的有效性為研究?jī)?nèi)容。首先,提取語(yǔ)音信號(hào)的樣本熵作為一個(gè)表征語(yǔ)音情緒狀態(tài)的特征參數(shù),分析其在語(yǔ)音情緒識(shí)別中的區(qū)分性,并與傳統(tǒng)的聲學(xué)參數(shù)進(jìn)行特征融合,用于情緒識(shí)別;然后,在傳統(tǒng)BP網(wǎng)絡(luò)基礎(chǔ)上,結(jié)合基于貢獻(xiàn)分析的PCA算法,建立了一種基于PCA貢獻(xiàn)分析的神經(jīng)網(wǎng)絡(luò)語(yǔ)音情感識(shí)別模型。對(duì)實(shí)驗(yàn)結(jié)果的分析表明,對(duì)樣本熵與傳統(tǒng)的聲學(xué)參數(shù)進(jìn)行特征融合可以改進(jìn)分類器的性能;基于PCA與神經(jīng)網(wǎng)絡(luò)建立的語(yǔ)音情感識(shí)別模型提高了識(shí)別效率。具體研究?jī)?nèi)容如下:(1)信號(hào)獲取。根據(jù)語(yǔ)音情感信號(hào)的產(chǎn)生機(jī)理和國(guó)際上對(duì)情感類型的劃分方法,綜合比較國(guó)內(nèi)外典型情感語(yǔ)音數(shù)據(jù)庫(kù),最終確定本文的情感類型劃分方法和采用的情感語(yǔ)音庫(kù)。(2)前期處理。對(duì)原始數(shù)據(jù)進(jìn)行采樣、量化、預(yù)加重、分幀、加窗等預(yù)處理后,針對(duì)端點(diǎn)效應(yīng)問(wèn)題,本文提出基于樣本熵改進(jìn)的兩級(jí)判別端點(diǎn)檢測(cè)算法。采用模糊C均值聚類算法和貝葉斯信息判決算法確定雙門限閾值,將其作為第一級(jí)判別,初步判斷信號(hào)的起止點(diǎn),然后將修正的過(guò)零率作為第二級(jí)判別,最終確定信號(hào)的起止點(diǎn)。(3)特征提取與特征選擇。本研究將樣本熵及目前比較成熟的聲學(xué)參數(shù)(包括語(yǔ)速、能量特征、基音頻率、MFCC)及其統(tǒng)計(jì)參數(shù),進(jìn)行特征融合應(yīng)用于語(yǔ)音情緒識(shí)別。采用PCA貢獻(xiàn)分析對(duì)原始特征向量集合進(jìn)行降維,得到最簡(jiǎn)約向量集,降低網(wǎng)絡(luò)模型的復(fù)雜性,降低訓(xùn)練時(shí)間。(4)語(yǔ)音情緒識(shí)別模型。本文在傳統(tǒng)BP網(wǎng)絡(luò)基礎(chǔ)上,結(jié)合基于貢獻(xiàn)分析的PCA算法,建立一種基于PCA的神經(jīng)網(wǎng)絡(luò)語(yǔ)音信號(hào)情感識(shí)別模型。基于上述融合的特征,利用該情感模型對(duì)800個(gè)樣本的四種情緒狀態(tài)進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果分析表明:(a)樣本熵是一個(gè)能夠表征語(yǔ)音信號(hào)情感變化的有效參數(shù)。樣本熵和傳統(tǒng)聲學(xué)特征參數(shù)的融合可以顯著提高分類器的識(shí)別率,改善情感識(shí)別模型的性能。(b)基于PCA貢獻(xiàn)分析的神經(jīng)網(wǎng)絡(luò)語(yǔ)音情感識(shí)別模型解決了傳統(tǒng)BP算法計(jì)算量大,運(yùn)算速度慢的問(wèn)題,有效的提高了系統(tǒng)的識(shí)別效率。綜合考慮以上分析,利用樣本熵與傳統(tǒng)聲學(xué)參數(shù)進(jìn)行特征融合,結(jié)合基于PCA的神經(jīng)網(wǎng)絡(luò)情感識(shí)別模型,可以建立有效的語(yǔ)音情感識(shí)別系統(tǒng)。
【關(guān)鍵詞】:語(yǔ)音情緒識(shí)別 樣本熵 端點(diǎn)檢測(cè) 貢獻(xiàn)分析
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要10-12
- ABSTRACT12-14
- 第一章 緒論14-22
- 1.1 研究背景及意義14-16
- 1.2 研究現(xiàn)狀16-19
- 1.2.1 國(guó)外研究現(xiàn)狀16-17
- 1.2.2 國(guó)內(nèi)研究現(xiàn)狀17-19
- 1.3 立題依據(jù)19-20
- 1.4 主要內(nèi)容及章節(jié)安排20-22
- 1.4.1 主要內(nèi)容20-21
- 1.4.2 章節(jié)安排21-22
- 第二章 語(yǔ)音情緒識(shí)別的理論基礎(chǔ)22-30
- 2.1 語(yǔ)音信號(hào)的產(chǎn)生22-23
- 2.2 情緒分類23-24
- 2.3 情感語(yǔ)音庫(kù)的建立24-27
- 2.3.1 情感語(yǔ)音庫(kù)的創(chuàng)建方式24-25
- 2.3.2 典型情感語(yǔ)音庫(kù)25-27
- 2.4 語(yǔ)音情緒識(shí)別27-29
- 2.4.1 語(yǔ)音情緒識(shí)別的原理27-28
- 2.4.2 語(yǔ)音情緒識(shí)別的分類識(shí)別算法28-29
- 2.5 本章小結(jié)29-30
- 第三章 語(yǔ)音信號(hào)的前期處理30-44
- 3.1 情感語(yǔ)音信號(hào)的預(yù)處理30-32
- 3.1.1 采樣與量化30-31
- 3.1.2 預(yù)加重31
- 3.1.3 分幀31
- 3.1.4 加窗31-32
- 3.2 傳統(tǒng)兩級(jí)判別端點(diǎn)檢測(cè)32-38
- 3.2.1 短時(shí)能量33
- 3.2.2 短時(shí)過(guò)零率33-34
- 3.2.3 兩級(jí)判別端點(diǎn)檢測(cè)算法34-38
- 3.3 基于樣本熵改進(jìn)的兩級(jí)判別端點(diǎn)檢測(cè)38-43
- 3.3.1 樣本熵理論及其算法38-39
- 3.3.2 基于樣本熵改進(jìn)的兩級(jí)判別端點(diǎn)檢測(cè)算法39-40
- 3.3.3 樣本熵門限閾值的確定40-42
- 3.3.4 仿真及結(jié)果分析42-43
- 3.4 本章小結(jié)43-44
- 第四章 語(yǔ)音信號(hào)的特征提取與選擇44-58
- 4.1 語(yǔ)音特征與情緒的對(duì)應(yīng)關(guān)系44-45
- 4.2 語(yǔ)音信號(hào)的特征提取及分析45-53
- 4.2.1 發(fā)音速率45-46
- 4.2.2 短時(shí)能量特征46-48
- 4.2.3 基音周期和基因頻率48-50
- 4.2.4 MFCC50-52
- 4.2.5 樣本熵52-53
- 4.3 基于PCA貢獻(xiàn)分析的特征選擇53-57
- 4.3.1 PCA概述54-55
- 4.3.2 特征選擇55-57
- 4.4 本章小結(jié)57-58
- 第五章 基于PCA貢獻(xiàn)分析的神經(jīng)網(wǎng)絡(luò)語(yǔ)音情緒識(shí)別58-68
- 5.1 神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建58-64
- 5.1.1 BP網(wǎng)絡(luò)模型58-59
- 5.1.2 BP網(wǎng)絡(luò)的學(xué)習(xí)算法59-63
- 5.1.3 神經(jīng)網(wǎng)絡(luò)模型的具體設(shè)計(jì)63-64
- 5.2 語(yǔ)音情緒識(shí)別仿真結(jié)果對(duì)比分析64-67
- 5.2.1 不同參數(shù)下語(yǔ)音情緒識(shí)別仿真結(jié)果對(duì)比分析64-66
- 5.2.2 基于PCA-BP的情緒識(shí)別仿真結(jié)果對(duì)比分析66-67
- 5.3 本章小結(jié)67-68
- 第六章 總結(jié)與展望68-70
- 6.1 總結(jié)68
- 6.2 展望68-70
- 參考文獻(xiàn)70-74
- 致謝74-75
- 附件75
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 趙歡;王綱金;胡煉;彭秀娟;;車載環(huán)境下基于樣本熵的語(yǔ)音端點(diǎn)檢測(cè)方法[J];計(jì)算機(jī)研究與發(fā)展;2011年03期
2 馬瑞;張盛兵;鄭喬石;;一種語(yǔ)音端點(diǎn)檢測(cè)電路的設(shè)計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2010年14期
3 鄧艷容;景新幸;楊海燕;楊運(yùn)澤;;語(yǔ)音端點(diǎn)檢測(cè)研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年06期
,本文編號(hào):520310
本文鏈接:http://sikaile.net/kejilunwen/wltx/520310.html
最近更新
教材專著