基于語譜圖特征的語音情感識別研究
本文選題:語譜圖 + Gabor濾波器。 參考:《太原理工大學》2017年碩士論文
【摘要】:目前,在語音情感識別領域,研究者經(jīng)常選用的情感語音特征有音質(zhì)特征、頻域特征、時域特征等特征,而關注語音時域-頻域相關性的研究則相對較少,發(fā)展較晚。本文利用語譜圖反映語音時域-頻域相關性的特點,提取語譜圖多種不同的紋理特征,將所提特征應用于語音情感識別。通過實驗分析,部分語譜圖紋理特征取得了比較好識別率,驗證了基于語譜圖特征的語音情感識別方法的可行性。本文主要以語譜圖為基礎對語譜圖紋理特征的提取和分類進行了研究,主要完成的工作包含以下幾部分:(1)介紹了語音情感研究的背景、意義、發(fā)展現(xiàn)狀以及常用的圖像紋理特征提取方法和紋理特征分類方法。(2)利用Gabor小波分別結合灰度共生矩陣方法、Tamura方法、局部二值模式(LBP)方法提取語譜圖特征。(3)提出了改進的局部二值模式方法、融合語譜圖LBP特征和局部Hu矩特征方法,并以柏林語音庫為基礎進行情感語音識別,實驗結果顯示不同情感的綜合識別率有了比較明顯的提升。(4)實現(xiàn)了支持向量機和K近鄰分類方法對所提特征進行分類識別,并研究了語譜圖灰度共生矩陣特征、Tamura特征、LBP特征、改進的LBP特征、融合LBP特征與局部Hu距特征的情感識別效果,以及融合特征權值對識別率的影響。經(jīng)過比較不同方法下的識別率,改進后的LBP方法與融合語譜圖LBP特征與局部Hu距特征方法取得了較好的實驗結果。
[Abstract]:At present, in the field of speech emotion recognition, researchers often choose affective speech features, such as phonological characteristics, frequency domain features, time domain features, etc. However, the research on the correlation between speech time domain and frequency domain is relatively few, and the development is relatively late.In this paper, the feature of correlation between speech time domain and frequency domain is reflected in the speech spectrum, and different texture features are extracted from the spectrum map, and the proposed features are applied to speech emotion recognition.Through experimental analysis, some of the texture features of spectral images have achieved a good recognition rate, which verifies the feasibility of the speech emotion recognition method based on the spectral image features.In this paper, the extraction and classification of texture features are studied on the basis of spectrogram. The main work includes the following parts: 1) introduce the background and significance of speech affective research.The current situation and the common methods of image texture feature extraction and texture feature classification. (2) using Gabor wavelet and gray level co-occurrence matrix method, respectively, Tamura method is used.This paper presents an improved local binary pattern method, which combines LBP features with local Hu moments features, and implements emotional speech recognition on the basis of Berlin phonetic corpus.The experimental results show that the comprehensive recognition rate of different emotions is significantly improved. (4) support vector machine and K-nearest neighbor classification method are used to classify and recognize the proposed features, and the gray level co-occurrence matrix feature Tamura feature and LBP feature of the spectral image are studied.The improved LBP feature, the emotion recognition effect of fusion LBP feature and local Hu distance feature, and the influence of fusion feature weight on recognition rate.By comparing the recognition rates of different methods, the improved LBP method, the fusion spectral LBP feature and the local Hu distance feature method have obtained good experimental results.
【學位授予單位】:太原理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.34
【相似文獻】
相關期刊論文 前10條
1 林奕琳;韋崗;楊康才;;語音情感識別的研究進展[J];電路與系統(tǒng)學報;2007年01期
2 趙力;黃程韋;;實用語音情感識別中的若干關鍵技術[J];數(shù)據(jù)采集與處理;2014年02期
3 陳建廈,李翠華;語音情感識別的研究進展[J];計算機工程;2005年13期
4 王茜;;一個語音情感識別系統(tǒng)的設計與實現(xiàn)[J];大眾科技;2006年08期
5 孫亞;;遠程教學中語音情感識別系統(tǒng)的研究與實現(xiàn)[J];長春理工大學學報(高教版);2008年02期
6 章國寶;宋清華;費樹岷;趙艷;;語音情感識別研究[J];計算機技術與發(fā)展;2009年01期
7 石瑛;胡學鋼;方磊;;基于決策樹的多特征語音情感識別[J];計算機技術與發(fā)展;2009年01期
8 趙臘生;張強;魏小鵬;;語音情感識別研究進展[J];計算機應用研究;2009年02期
9 張石清;趙知勁;;噪聲背景下的語音情感識別[J];西南交通大學學報;2009年03期
10 黃程韋;金峗;王青云;趙艷;趙力;;基于特征空間分解與融合的語音情感識別[J];信號處理;2010年06期
相關會議論文 前8條
1 陳建廈;;語音情感識別綜述[A];第一屆中國情感計算及智能交互學術會議論文集[C];2003年
2 楊桃香;楊鑒;畢福昆;;基于模糊聚類的語音情感識別[A];第三屆和諧人機環(huán)境聯(lián)合學術會議(HHME2007)論文集[C];2007年
3 羅武駿;包永強;趙力;;基于模糊支持向量機的語音情感識別方法[A];2012'中國西部聲學學術交流會論文集(Ⅱ)[C];2012年
4 王青;謝波;陳根才;;基于神經(jīng)網(wǎng)絡的漢語語音情感識別[A];第一屆中國情感計算及智能交互學術會議論文集[C];2003年
5 張鼎天;徐明星;;基于調(diào)制頻譜特征的自動語音情感識別[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
6 童燦;;基于boosting HMM的語音情感識別[A];2008年中國高校通信類院系學術研討會論文集(下冊)[C];2009年
7 戴明洋;楊大利;徐明星;;語音情感識別中UBM訓練集的組成研究[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
8 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識別[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
相關博士學位論文 前7條
1 孫亞新;語音情感識別中的特征提取與識別算法研究[D];華南理工大學;2015年
2 王坤俠;語音情感識別方法研究[D];合肥工業(yè)大學;2015年
3 韓文靜;語音情感識別關鍵技術研究[D];哈爾濱工業(yè)大學;2013年
4 謝波;普通話語音情感識別關鍵技術研究[D];浙江大學;2006年
5 尤鳴宇;語音情感識別的關鍵技術研究[D];浙江大學;2007年
6 劉佳;語音情感識別的研究與應用[D];浙江大學;2009年
7 趙臘生;語音情感特征提取與識別方法研究[D];大連理工大學;2010年
相關碩士學位論文 前10條
1 陳曉東;基于卷積神經(jīng)網(wǎng)絡的語音情感識別[D];華南理工大學;2015年
2 孫志鋒;語音情感識別研究[D];陜西師范大學;2015年
3 譚發(fā)曾;語音情感狀態(tài)模糊識別研究[D];電子科技大學;2015年
4 陳鑫;相空間重構在語音情感識別中的研究[D];長沙理工大學;2014年
5 李昌群;基于特征選擇的語音情感識別[D];合肥工業(yè)大學;2015年
6 陳文汐;基于核函數(shù)的語音情感識別技術的研究[D];東南大學;2015年
7 薛文韜;基于深度學習和遷移學習的語音情感識別方法研究[D];江蘇大學;2016年
8 宋明虎;電力行業(yè)電話電話客服語音情感識別[D];昆明理工大學;2016年
9 陳肖;基于多粒度特征融合的維度語音情感識別方法研究[D];哈爾濱工業(yè)大學;2016年
10 任浩;基于多級分類的語音情感識別[D];哈爾濱工業(yè)大學;2016年
,本文編號:1743106
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1743106.html