基于語譜圖特征的語音情感識別研究
本文選題:語譜圖 + Gabor濾波器; 參考:《太原理工大學(xué)》2017年碩士論文
【摘要】:目前,在語音情感識別領(lǐng)域,研究者經(jīng)常選用的情感語音特征有音質(zhì)特征、頻域特征、時域特征等特征,而關(guān)注語音時域-頻域相關(guān)性的研究則相對較少,發(fā)展較晚。本文利用語譜圖反映語音時域-頻域相關(guān)性的特點,提取語譜圖多種不同的紋理特征,將所提特征應(yīng)用于語音情感識別。通過實驗分析,部分語譜圖紋理特征取得了比較好識別率,驗證了基于語譜圖特征的語音情感識別方法的可行性。本文主要以語譜圖為基礎(chǔ)對語譜圖紋理特征的提取和分類進(jìn)行了研究,主要完成的工作包含以下幾部分:(1)介紹了語音情感研究的背景、意義、發(fā)展現(xiàn)狀以及常用的圖像紋理特征提取方法和紋理特征分類方法。(2)利用Gabor小波分別結(jié)合灰度共生矩陣方法、Tamura方法、局部二值模式(LBP)方法提取語譜圖特征。(3)提出了改進(jìn)的局部二值模式方法、融合語譜圖LBP特征和局部Hu矩特征方法,并以柏林語音庫為基礎(chǔ)進(jìn)行情感語音識別,實驗結(jié)果顯示不同情感的綜合識別率有了比較明顯的提升。(4)實現(xiàn)了支持向量機(jī)和K近鄰分類方法對所提特征進(jìn)行分類識別,并研究了語譜圖灰度共生矩陣特征、Tamura特征、LBP特征、改進(jìn)的LBP特征、融合LBP特征與局部Hu距特征的情感識別效果,以及融合特征權(quán)值對識別率的影響。經(jīng)過比較不同方法下的識別率,改進(jìn)后的LBP方法與融合語譜圖LBP特征與局部Hu距特征方法取得了較好的實驗結(jié)果。
[Abstract]:At present, in the field of speech emotion recognition, researchers often choose affective speech features, such as phonological characteristics, frequency domain features, time domain features, etc. However, the research on the correlation between speech time domain and frequency domain is relatively few, and the development is relatively late.In this paper, the feature of correlation between speech time domain and frequency domain is reflected in the speech spectrum, and different texture features are extracted from the spectrum map, and the proposed features are applied to speech emotion recognition.Through experimental analysis, some of the texture features of spectral images have achieved a good recognition rate, which verifies the feasibility of the speech emotion recognition method based on the spectral image features.In this paper, the extraction and classification of texture features are studied on the basis of spectrogram. The main work includes the following parts: 1) introduce the background and significance of speech affective research.The current situation and the common methods of image texture feature extraction and texture feature classification. (2) using Gabor wavelet and gray level co-occurrence matrix method, respectively, Tamura method is used.This paper presents an improved local binary pattern method, which combines LBP features with local Hu moments features, and implements emotional speech recognition on the basis of Berlin phonetic corpus.The experimental results show that the comprehensive recognition rate of different emotions is significantly improved. (4) support vector machine and K-nearest neighbor classification method are used to classify and recognize the proposed features, and the gray level co-occurrence matrix feature Tamura feature and LBP feature of the spectral image are studied.The improved LBP feature, the emotion recognition effect of fusion LBP feature and local Hu distance feature, and the influence of fusion feature weight on recognition rate.By comparing the recognition rates of different methods, the improved LBP method, the fusion spectral LBP feature and the local Hu distance feature method have obtained good experimental results.
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 林奕琳;韋崗;楊康才;;語音情感識別的研究進(jìn)展[J];電路與系統(tǒng)學(xué)報;2007年01期
2 趙力;黃程韋;;實用語音情感識別中的若干關(guān)鍵技術(shù)[J];數(shù)據(jù)采集與處理;2014年02期
3 陳建廈,李翠華;語音情感識別的研究進(jìn)展[J];計算機(jī)工程;2005年13期
4 王茜;;一個語音情感識別系統(tǒng)的設(shè)計與實現(xiàn)[J];大眾科技;2006年08期
5 孫亞;;遠(yuǎn)程教學(xué)中語音情感識別系統(tǒng)的研究與實現(xiàn)[J];長春理工大學(xué)學(xué)報(高教版);2008年02期
6 章國寶;宋清華;費樹岷;趙艷;;語音情感識別研究[J];計算機(jī)技術(shù)與發(fā)展;2009年01期
7 石瑛;胡學(xué)鋼;方磊;;基于決策樹的多特征語音情感識別[J];計算機(jī)技術(shù)與發(fā)展;2009年01期
8 趙臘生;張強(qiáng);魏小鵬;;語音情感識別研究進(jìn)展[J];計算機(jī)應(yīng)用研究;2009年02期
9 張石清;趙知勁;;噪聲背景下的語音情感識別[J];西南交通大學(xué)學(xué)報;2009年03期
10 黃程韋;金峗;王青云;趙艷;趙力;;基于特征空間分解與融合的語音情感識別[J];信號處理;2010年06期
相關(guān)會議論文 前8條
1 陳建廈;;語音情感識別綜述[A];第一屆中國情感計算及智能交互學(xué)術(shù)會議論文集[C];2003年
2 楊桃香;楊鑒;畢福昆;;基于模糊聚類的語音情感識別[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2007)論文集[C];2007年
3 羅武駿;包永強(qiáng);趙力;;基于模糊支持向量機(jī)的語音情感識別方法[A];2012'中國西部聲學(xué)學(xué)術(shù)交流會論文集(Ⅱ)[C];2012年
4 王青;謝波;陳根才;;基于神經(jīng)網(wǎng)絡(luò)的漢語語音情感識別[A];第一屆中國情感計算及智能交互學(xué)術(shù)會議論文集[C];2003年
5 張鼎天;徐明星;;基于調(diào)制頻譜特征的自動語音情感識別[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
6 童燦;;基于boosting HMM的語音情感識別[A];2008年中國高校通信類院系學(xué)術(shù)研討會論文集(下冊)[C];2009年
7 戴明洋;楊大利;徐明星;;語音情感識別中UBM訓(xùn)練集的組成研究[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識別[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前7條
1 孫亞新;語音情感識別中的特征提取與識別算法研究[D];華南理工大學(xué);2015年
2 王坤俠;語音情感識別方法研究[D];合肥工業(yè)大學(xué);2015年
3 韓文靜;語音情感識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
4 謝波;普通話語音情感識別關(guān)鍵技術(shù)研究[D];浙江大學(xué);2006年
5 尤鳴宇;語音情感識別的關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年
6 劉佳;語音情感識別的研究與應(yīng)用[D];浙江大學(xué);2009年
7 趙臘生;語音情感特征提取與識別方法研究[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 陳曉東;基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別[D];華南理工大學(xué);2015年
2 孫志鋒;語音情感識別研究[D];陜西師范大學(xué);2015年
3 譚發(fā)曾;語音情感狀態(tài)模糊識別研究[D];電子科技大學(xué);2015年
4 陳鑫;相空間重構(gòu)在語音情感識別中的研究[D];長沙理工大學(xué);2014年
5 李昌群;基于特征選擇的語音情感識別[D];合肥工業(yè)大學(xué);2015年
6 陳文汐;基于核函數(shù)的語音情感識別技術(shù)的研究[D];東南大學(xué);2015年
7 薛文韜;基于深度學(xué)習(xí)和遷移學(xué)習(xí)的語音情感識別方法研究[D];江蘇大學(xué);2016年
8 宋明虎;電力行業(yè)電話電話客服語音情感識別[D];昆明理工大學(xué);2016年
9 陳肖;基于多粒度特征融合的維度語音情感識別方法研究[D];哈爾濱工業(yè)大學(xué);2016年
10 任浩;基于多級分類的語音情感識別[D];哈爾濱工業(yè)大學(xué);2016年
,本文編號:1743106
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1743106.html