天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于安卓的語音情感識別系統(tǒng)設(shè)計與實現(xiàn)

發(fā)布時間:2020-08-28 05:14
【摘要】:語音情感識別技術(shù)是當前情感計算與語音信號領(lǐng)域的熱點問題。作為人機交互之中的一個重要組成部分,在疾病診斷、刑偵破案、遠程教育等領(lǐng)域也有日趨廣泛的應(yīng)用。作為人機交互之中的一個重要組成部分,語音情感識別技術(shù)卻由于情感本身的定義不確定性與表征情感的特征的模糊性,使得語音情感識別技術(shù)成為了一個難題。為了解決語音情感識別技術(shù)中識別率不高且還不能做到人機交互應(yīng)用的難題,本文主要進行了以下幾點研究:1.引入非線性特征Teager能量算子,并將Teager能量算子與MFCC(Mel-Frequency Cepstral Coefficients,梅爾頻域倒譜系數(shù))相結(jié)合提取NFD_Mel(Nonlinear Frequency Domain Mel,非線性梅爾頻域參數(shù)),實驗結(jié)果表明該特征可以從非線性的角度提取特征,并與傳統(tǒng)特征相結(jié)合可以有效提高識別率,在德國柏林情感數(shù)據(jù)庫識別率達到了82.02%,相比不采用NFD_Mel的傳統(tǒng)方法,識別率提高了3.24%。2.我們創(chuàng)新性地提出了一種基于倒譜分離信號的非特定人語音情感識別方法:聲門與聲道信號都包含了豐富的情感信息,由于個人聲道的差異,通常聲道信息則更多的包含了個人特征,這對于我們非特定人的情感識別工作產(chǎn)生了很多的干擾。基于非特定人的情感識別效果則不如特定人。為了克服現(xiàn)有技術(shù)的不足,我們創(chuàng)新性地提出了一種基于倒譜分離信號的非特定人語音情感識別方法,該方法利用倒譜分離信號,保留全部的聲帶信息并摒棄一部分的聲道信息,同時尋找最佳分離點,最后對處理后的信號在復倒譜重構(gòu)并提取特征,可以有效提高非特定人語音情感識別率。本文將該方法與人耳聽覺效應(yīng)相結(jié)合提出一種新特征CSS-MFCC(Cepstrum separation signal Mel-Frequency Cepstral Coefficients,倒譜分離信號梅爾頻域倒譜系數(shù)),經(jīng)實驗表明將該特征與傳統(tǒng)特征相結(jié)合后可以有效提高識別率,在德國柏林情感數(shù)據(jù)庫識別率達到了84.29%。3.情感計算的最終目的是實現(xiàn)人與計算機之間的情感互動,所以我們提出了基于手機安卓系統(tǒng)的語音情感交互框架,設(shè)計并實現(xiàn)了基于安卓的語音情感識別系統(tǒng),該系統(tǒng)可以使得安卓手機實現(xiàn)語音情感的計算與識別。
【學位授予單位】:廣西師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.34
【圖文】:

情感模型,效價,情感


圖 1-1 激活度-效價情感模型有不同的特點:從模型的復雜角度,離散情感模型利用簡合人們?nèi)粘τ谇楦械亩x方式。但是維度情感模型的分需要考慮不同的維度屬性,還需要考慮到不同維度下的強都代表了一種獨特的情感;從而維度情感模型由于其每個情感難以判別且更加抽象。根據(jù)兩種情感模型的優(yōu)劣,本據(jù)庫音情感識別技術(shù)是基于語音情感數(shù)據(jù)庫進行的,所以數(shù)據(jù)。但是,由于語音情感的模糊性,語音情感數(shù)據(jù)庫的建立分類分為兩類:離散情感和維度情感。其次,根據(jù)情緒激引導型和自然型。目前,國內(nèi)外的大部分研究都是基于離流語音情感數(shù)據(jù)庫。

原理圖,情感識別,語音,原理圖


活度與控制)。共 947 句,16kHz 采樣,16bit 量化。.5 語音情感識別的一般過程語音情感識別是語音識別領(lǐng)域的一個分支。它主要涉及聲學、信息科學、人工科,其一般過程類似于模式識別過程:訓練階段和識別階段。第一個階段是情感理和語音特征提取的訓練,也可以對特征進行降維處理[29],然后利用這些特征建型,然后識別階段,我們提取待測語音相應(yīng)的語音情感特征的進行識別。以下為:1,預處理主要包括語音的預加重、分幀與加窗、區(qū)分噪聲段的端點檢測等。2,使用多種特征組合的方法,提取多種特征參數(shù)。一些研究者對語音情感的組行降維處理,然后利用處理后的特征向量進行識別。3,我們將特征分為訓練集與測試集,其中測試集輸入分類器模型進行分類器訓試集則用于測試分類器的效果。

頻譜,預加重,頻譜,分幀


圖2 -1預加重頻譜效果對比2 預處理加窗與分幀于語音信號具有短時平穩(wěn)性,即在短時段上語音相對平穩(wěn),各種性質(zhì)不變,信號的處理,容易丟失了時域信息。而短時的分析,能在一定程度上保留時們對語音信號進行分幀操作,為了讓語言信號在短時保持相對平穩(wěn)更便于以一般幀長在 10~30ms,通常為了彌補窗函數(shù)造成的兩端信號衰減,對信號部分重疊,該重疊部分為幀移,幀移一般為幀長的 0 至 50%。式 w( n )為分幀時所用窗函數(shù), s ( n )為語音信號, ( )ws n 為加窗分幀后的信號( ) ( ) ( )ws n s n w n了提高頻譜分辨率并且減少頻譜泄露,需要對信號進行加窗處理。而加窗步比較常用的有矩形窗、漢明窗兩種,它們的函數(shù)表達形式如下(幀長用 N 表形窗:

【參考文獻】

相關(guān)期刊論文 前9條

1 韓文靜;李海峰;阮華斌;馬琳;;語音情感識別研究進展綜述[J];軟件學報;2014年01期

2 黃程韋;趙艷;金峗;于寅驊;趙力;;實用語音情感的特征分析與識別的研究[J];電子與信息學報;2011年01期

3 余華;黃程韋;金峗;趙力;;基于粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)的語音情感識別[J];數(shù)據(jù)采集與處理;2011年01期

4 張石清;趙知勁;雷必成;楊廣映;;結(jié)合音質(zhì)特征和韻律特征的語音情感識別[J];電路與系統(tǒng)學報;2009年04期

5 喬冠楠;胡劍凌;劉鵬;;聲學參數(shù)和聽覺參數(shù)結(jié)合的語音情感交叉識別[J];電聲技術(shù);2009年06期

6 趙臘生;張強;魏小鵬;;語音情感識別研究進展[J];計算機應(yīng)用研究;2009年02期

7 高慧;蘇廣川;陳善廣;;基于Teager能量算子(TEO)非線性特征的語音情緒識別[J];航天醫(yī)學與醫(yī)學工程;2005年06期

8 趙力,錢向民,鄒采榮,吳鎮(zhèn)揚;語音信號中的情感識別研究[J];軟件學報;2001年07期

9 陳亮,張雄偉;語音信號非線性特征的研究[J];解放軍理工大學學報(自然科學版);2000年02期

相關(guān)博士學位論文 前4條

1 張昕然;跨庫語音情感識別若干關(guān)鍵技術(shù)研究[D];東南大學;2016年

2 王坤俠;語音情感識別方法研究[D];合肥工業(yè)大學;2015年

3 孫亞新;語音情感識別中的特征提取與識別算法研究[D];華南理工大學;2015年

4 孫穎;情感語音識別與合成的研究[D];太原理工大學;2011年

相關(guān)碩士學位論文 前2條

1 謝玲;語音情感識別的研究[D];廣西師范大學;2016年

2 安秀紅;基于特征參數(shù)的語音情感識別[D];太原理工大學;2011年



本文編號:2807153

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2807153.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3c6ce***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com