面向中文語音情感識別的改進棧式自編碼結(jié)構(gòu)
本文關(guān)鍵詞:面向中文語音情感識別的改進棧式自編碼結(jié)構(gòu) 出處:《東南大學(xué)學(xué)報(自然科學(xué)版)》2017年04期 論文類型:期刊論文
更多相關(guān)文章: 語音情感識別 改進的棧式自編碼 降噪自編碼 稀疏自編碼
【摘要】:為進一步提高漢語語音情感識別率,基于深度學(xué)習(xí)中的自編碼、降噪自編碼及稀疏自編碼的網(wǎng)絡(luò)結(jié)構(gòu),提出了一種改進的棧式自編碼結(jié)構(gòu).該結(jié)構(gòu)第1層使用降噪自編碼學(xué)習(xí)一個比輸入特征維數(shù)更大的隱藏特征,第2層采用稀疏自編碼學(xué)習(xí)稀疏性特征,最后使用softmax分類器進行分類識別.訓(xùn)練過程首先采用逐層預(yù)訓(xùn)練的方法,達到網(wǎng)絡(luò)參數(shù)全面初始化的目的,然后對整個網(wǎng)絡(luò)進行微調(diào).在中文語音庫上的情感識別實驗顯示,相較于單獨使用棧式降噪或稀疏自編碼,所提結(jié)構(gòu)具有更好的識別效果.此外,基于CASIA庫的對比實驗顯示,該結(jié)構(gòu)比K近鄰算法、稀疏表示方法、傳統(tǒng)支持向量機和人工神經(jīng)網(wǎng)絡(luò)識別率分別提高了53.7%,29.8%,14.3%和1.9%.在自行錄制的語音庫中,該結(jié)構(gòu)的識別率比人工神經(jīng)網(wǎng)絡(luò)提高了1.64%.
[Abstract]:In order to improve the emotion recognition rate of Chinese speech, the network structure is based on self-coding, de-noising self-coding and sparse self-coding in depth learning. An improved stack self-coding structure is proposed, in which layer 1 uses noise reduction self-coding to learn a hidden feature with larger dimension than input feature, and layer 2 uses sparse self-coding to learn sparse feature. Finally, the softmax classifier is used for classification recognition. Firstly, the method of pre-training layer by layer is used in the training process to achieve the goal of the overall initialization of network parameters. Then the whole network is fine-tuned. The experiment of emotion recognition on Chinese speech corpus shows that the proposed structure has better recognition effect than using stack noise reduction or sparse self-coding alone. The contrast experiments based on CASIA library show that the recognition rate of this structure is increased by 53.7% than that of K-nearest neighbor algorithm, sparse representation method, traditional support vector machine and artificial neural network, respectively. In the self-recorded corpus, the recognition rate of the structure is 1.64% higher than that of artificial neural network.
【作者單位】: 東南大學(xué)水聲信號處理教育部重點實驗室;南京工程學(xué)院通信工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61375028,61571106,61673108) 江蘇省青藍工程資助項目 江蘇省博士后科研資助計劃資助項目(1601011B) 江蘇省“六大人才高峰”資助項目(2016-DZXX-023) 中國博士后科學(xué)基金資助項目(2016M601695)
【分類號】:TN912.34
【正文快照】: 語音是人機交互最自然友好的方式之一,承載著說話人豐富的情感信息.但如今的人機交互并不能像人與人交流那樣自由,其原因是機器不能像人一樣判斷對方話語中的情感.語音情感識別在人工智能領(lǐng)域有著非常廣闊的未來,其終極目標(biāo)是讓機器能夠像人類一樣通過語音識別人類情感,實現(xiàn)更
【參考文獻】
相關(guān)期刊論文 前3條
1 張昕然;查誠;徐新洲;宋鵬;趙力;;基于LDA+kernel-KNNFLC的語音情感識別方法[J];東南大學(xué)學(xué)報(自然科學(xué)版);2015年01期
2 韓文靜;李海峰;;情感語音數(shù)據(jù)庫綜述[J];智能計算機與應(yīng)用;2013年01期
3 蔣丹寧;蔡蓮紅;;基于語音聲學(xué)特征的情感信息識別[J];清華大學(xué)學(xué)報(自然科學(xué)版);2006年01期
【共引文獻】
相關(guān)期刊論文 前10條
1 朱芳枚;趙力;梁瑞宇;王青云;鄒采榮;;面向中文語音情感識別的改進棧式自編碼結(jié)構(gòu)[J];東南大學(xué)學(xué)報(自然科學(xué)版);2017年04期
2 隋小蕓;朱廷劭;汪靜瑩;;基于局部特征優(yōu)化的語音情感識別[J];中國科學(xué)院大學(xué)學(xué)報;2017年04期
3 張昕然;巨曉正;宋鵬;查誠;趙力;;用于跨庫語音情感識別的DBN特征融合方法[J];信號處理;2017年05期
4 張雪英;張婷;孫穎;張衛(wèi);暢江;;情感語音數(shù)據(jù)庫優(yōu)化及PAD情感模型量化標(biāo)注[J];太原理工大學(xué)學(xué)報;2017年03期
5 王寶軍;薛雨麗;于適寧;毛峽;;多模情感數(shù)據(jù)庫的設(shè)計與評價[J];中國科技論文;2016年02期
6 張雪英;孫穎;張衛(wèi);暢江;;語音情感識別的關(guān)鍵技術(shù)[J];太原理工大學(xué)學(xué)報;2015年06期
7 王寶軍;薛雨麗;于適寧;毛峽;;多模情感數(shù)據(jù)庫的設(shè)計與評價[J];中國科技論文;2015年20期
8 孫凌云;何博偉;劉征;楊智淵;;基于語義細胞的語音情感識別[J];浙江大學(xué)學(xué)報(工學(xué)版);2015年06期
9 景少玲;毛峽;陳立江;張娜娜;;漢語雙模情感語音數(shù)據(jù)庫標(biāo)注及一致性檢測[J];北京航空航天大學(xué)學(xué)報;2015年10期
10 魏平杰;樊興華;;語音傾向性分析中的特征抽取研究[J];計算機應(yīng)用研究;2014年12期
【二級參考文獻】
相關(guān)期刊論文 前2條
1 黃程韋;趙艷;金峗;于寅驊;趙力;;實用語音情感的特征分析與識別的研究[J];電子與信息學(xué)報;2011年01期
2 趙力,將春輝,鄒采榮,吳鎮(zhèn)揚;語音信號中的情感特征分析和識別的研究[J];電子學(xué)報;2004年04期
【相似文獻】
相關(guān)期刊論文 前10條
1 趙力;黃程韋;;實用語音情感識別中的若干關(guān)鍵技術(shù)[J];數(shù)據(jù)采集與處理;2014年02期
2 陳建廈,李翠華;語音情感識別的研究進展[J];計算機工程;2005年13期
3 王茜;;一個語音情感識別系統(tǒng)的設(shè)計與實現(xiàn)[J];大眾科技;2006年08期
4 孫亞;;遠程教學(xué)中語音情感識別系統(tǒng)的研究與實現(xiàn)[J];長春理工大學(xué)學(xué)報(高教版);2008年02期
5 章國寶;宋清華;費樹岷;趙艷;;語音情感識別研究[J];計算機技術(shù)與發(fā)展;2009年01期
6 石瑛;胡學(xué)鋼;方磊;;基于決策樹的多特征語音情感識別[J];計算機技術(shù)與發(fā)展;2009年01期
7 趙臘生;張強;魏小鵬;;語音情感識別研究進展[J];計算機應(yīng)用研究;2009年02期
8 張石清;趙知勁;;噪聲背景下的語音情感識別[J];西南交通大學(xué)學(xué)報;2009年03期
9 黃程韋;金峗;王青云;趙艷;趙力;;基于特征空間分解與融合的語音情感識別[J];信號處理;2010年06期
10 袁健;賀祥;許華虎;馮肖維;劉玲;;服務(wù)機器人的語音情感識別與交互技術(shù)研究[J];小型微型計算機系統(tǒng);2010年07期
相關(guān)會議論文 前8條
1 陳建廈;;語音情感識別綜述[A];第一屆中國情感計算及智能交互學(xué)術(shù)會議論文集[C];2003年
2 楊桃香;楊鑒;畢福昆;;基于模糊聚類的語音情感識別[A];第三屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2007)論文集[C];2007年
3 羅武駿;包永強;趙力;;基于模糊支持向量機的語音情感識別方法[A];2012'中國西部聲學(xué)學(xué)術(shù)交流會論文集(Ⅱ)[C];2012年
4 王青;謝波;陳根才;;基于神經(jīng)網(wǎng)絡(luò)的漢語語音情感識別[A];第一屆中國情感計算及智能交互學(xué)術(shù)會議論文集[C];2003年
5 張鼎天;徐明星;;基于調(diào)制頻譜特征的自動語音情感識別[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
6 童燦;;基于boosting HMM的語音情感識別[A];2008年中國高校通信類院系學(xué)術(shù)研討會論文集(下冊)[C];2009年
7 戴明洋;楊大利;徐明星;;語音情感識別中UBM訓(xùn)練集的組成研究[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識別[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前7條
1 孫亞新;語音情感識別中的特征提取與識別算法研究[D];華南理工大學(xué);2015年
2 王坤俠;語音情感識別方法研究[D];合肥工業(yè)大學(xué);2015年
3 韓文靜;語音情感識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
4 謝波;普通話語音情感識別關(guān)鍵技術(shù)研究[D];浙江大學(xué);2006年
5 尤鳴宇;語音情感識別的關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年
6 劉佳;語音情感識別的研究與應(yīng)用[D];浙江大學(xué);2009年
7 趙臘生;語音情感特征提取與識別方法研究[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 陳曉東;基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別[D];華南理工大學(xué);2015年
2 孫志鋒;語音情感識別研究[D];陜西師范大學(xué);2015年
3 譚發(fā)曾;語音情感狀態(tài)模糊識別研究[D];電子科技大學(xué);2015年
4 陳鑫;相空間重構(gòu)在語音情感識別中的研究[D];長沙理工大學(xué);2014年
5 李昌群;基于特征選擇的語音情感識別[D];合肥工業(yè)大學(xué);2015年
6 陳文汐;基于核函數(shù)的語音情感識別技術(shù)的研究[D];東南大學(xué);2015年
7 薛文韜;基于深度學(xué)習(xí)和遷移學(xué)習(xí)的語音情感識別方法研究[D];江蘇大學(xué);2016年
8 宋明虎;電力行業(yè)電話電話客服語音情感識別[D];昆明理工大學(xué);2016年
9 陳肖;基于多粒度特征融合的維度語音情感識別方法研究[D];哈爾濱工業(yè)大學(xué);2016年
10 任浩;基于多級分類的語音情感識別[D];哈爾濱工業(yè)大學(xué);2016年
,本文編號:1425172
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1425172.html