天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

面向中文語音情感識(shí)別的改進(jìn)棧式自編碼結(jié)構(gòu)

發(fā)布時(shí)間:2018-01-14 20:26

  本文關(guān)鍵詞:面向中文語音情感識(shí)別的改進(jìn)棧式自編碼結(jié)構(gòu) 出處:《東南大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年04期  論文類型:期刊論文


  更多相關(guān)文章: 語音情感識(shí)別 改進(jìn)的棧式自編碼 降噪自編碼 稀疏自編碼


【摘要】:為進(jìn)一步提高漢語語音情感識(shí)別率,基于深度學(xué)習(xí)中的自編碼、降噪自編碼及稀疏自編碼的網(wǎng)絡(luò)結(jié)構(gòu),提出了一種改進(jìn)的棧式自編碼結(jié)構(gòu).該結(jié)構(gòu)第1層使用降噪自編碼學(xué)習(xí)一個(gè)比輸入特征維數(shù)更大的隱藏特征,第2層采用稀疏自編碼學(xué)習(xí)稀疏性特征,最后使用softmax分類器進(jìn)行分類識(shí)別.訓(xùn)練過程首先采用逐層預(yù)訓(xùn)練的方法,達(dá)到網(wǎng)絡(luò)參數(shù)全面初始化的目的,然后對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行微調(diào).在中文語音庫上的情感識(shí)別實(shí)驗(yàn)顯示,相較于單獨(dú)使用棧式降噪或稀疏自編碼,所提結(jié)構(gòu)具有更好的識(shí)別效果.此外,基于CASIA庫的對(duì)比實(shí)驗(yàn)顯示,該結(jié)構(gòu)比K近鄰算法、稀疏表示方法、傳統(tǒng)支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)識(shí)別率分別提高了53.7%,29.8%,14.3%和1.9%.在自行錄制的語音庫中,該結(jié)構(gòu)的識(shí)別率比人工神經(jīng)網(wǎng)絡(luò)提高了1.64%.
[Abstract]:In order to improve the emotion recognition rate of Chinese speech, the network structure is based on self-coding, de-noising self-coding and sparse self-coding in depth learning. An improved stack self-coding structure is proposed, in which layer 1 uses noise reduction self-coding to learn a hidden feature with larger dimension than input feature, and layer 2 uses sparse self-coding to learn sparse feature. Finally, the softmax classifier is used for classification recognition. Firstly, the method of pre-training layer by layer is used in the training process to achieve the goal of the overall initialization of network parameters. Then the whole network is fine-tuned. The experiment of emotion recognition on Chinese speech corpus shows that the proposed structure has better recognition effect than using stack noise reduction or sparse self-coding alone. The contrast experiments based on CASIA library show that the recognition rate of this structure is increased by 53.7% than that of K-nearest neighbor algorithm, sparse representation method, traditional support vector machine and artificial neural network, respectively. In the self-recorded corpus, the recognition rate of the structure is 1.64% higher than that of artificial neural network.
【作者單位】: 東南大學(xué)水聲信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室;南京工程學(xué)院通信工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61375028,61571106,61673108) 江蘇省青藍(lán)工程資助項(xiàng)目 江蘇省博士后科研資助計(jì)劃資助項(xiàng)目(1601011B) 江蘇省“六大人才高峰”資助項(xiàng)目(2016-DZXX-023) 中國(guó)博士后科學(xué)基金資助項(xiàng)目(2016M601695)
【分類號(hào)】:TN912.34
【正文快照】: 語音是人機(jī)交互最自然友好的方式之一,承載著說話人豐富的情感信息.但如今的人機(jī)交互并不能像人與人交流那樣自由,其原因是機(jī)器不能像人一樣判斷對(duì)方話語中的情感.語音情感識(shí)別在人工智能領(lǐng)域有著非常廣闊的未來,其終極目標(biāo)是讓機(jī)器能夠像人類一樣通過語音識(shí)別人類情感,實(shí)現(xiàn)更

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 張昕然;查誠(chéng);徐新洲;宋鵬;趙力;;基于LDA+kernel-KNNFLC的語音情感識(shí)別方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年01期

2 韓文靜;李海峰;;情感語音數(shù)據(jù)庫綜述[J];智能計(jì)算機(jī)與應(yīng)用;2013年01期

3 蔣丹寧;蔡蓮紅;;基于語音聲學(xué)特征的情感信息識(shí)別[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱芳枚;趙力;梁瑞宇;王青云;鄒采榮;;面向中文語音情感識(shí)別的改進(jìn)棧式自編碼結(jié)構(gòu)[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年04期

2 隋小蕓;朱廷劭;汪靜瑩;;基于局部特征優(yōu)化的語音情感識(shí)別[J];中國(guó)科學(xué)院大學(xué)學(xué)報(bào);2017年04期

3 張昕然;巨曉正;宋鵬;查誠(chéng);趙力;;用于跨庫語音情感識(shí)別的DBN特征融合方法[J];信號(hào)處理;2017年05期

4 張雪英;張婷;孫穎;張衛(wèi);暢江;;情感語音數(shù)據(jù)庫優(yōu)化及PAD情感模型量化標(biāo)注[J];太原理工大學(xué)學(xué)報(bào);2017年03期

5 王寶軍;薛雨麗;于適寧;毛峽;;多模情感數(shù)據(jù)庫的設(shè)計(jì)與評(píng)價(jià)[J];中國(guó)科技論文;2016年02期

6 張雪英;孫穎;張衛(wèi);暢江;;語音情感識(shí)別的關(guān)鍵技術(shù)[J];太原理工大學(xué)學(xué)報(bào);2015年06期

7 王寶軍;薛雨麗;于適寧;毛峽;;多模情感數(shù)據(jù)庫的設(shè)計(jì)與評(píng)價(jià)[J];中國(guó)科技論文;2015年20期

8 孫凌云;何博偉;劉征;楊智淵;;基于語義細(xì)胞的語音情感識(shí)別[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2015年06期

9 景少玲;毛峽;陳立江;張娜娜;;漢語雙模情感語音數(shù)據(jù)庫標(biāo)注及一致性檢測(cè)[J];北京航空航天大學(xué)學(xué)報(bào);2015年10期

10 魏平杰;樊興華;;語音傾向性分析中的特征抽取研究[J];計(jì)算機(jī)應(yīng)用研究;2014年12期

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 黃程韋;趙艷;金峗;于寅驊;趙力;;實(shí)用語音情感的特征分析與識(shí)別的研究[J];電子與信息學(xué)報(bào);2011年01期

2 趙力,將春輝,鄒采榮,吳鎮(zhèn)揚(yáng);語音信號(hào)中的情感特征分析和識(shí)別的研究[J];電子學(xué)報(bào);2004年04期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙力;黃程韋;;實(shí)用語音情感識(shí)別中的若干關(guān)鍵技術(shù)[J];數(shù)據(jù)采集與處理;2014年02期

2 陳建廈,李翠華;語音情感識(shí)別的研究進(jìn)展[J];計(jì)算機(jī)工程;2005年13期

3 王茜;;一個(gè)語音情感識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];大眾科技;2006年08期

4 孫亞;;遠(yuǎn)程教學(xué)中語音情感識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[J];長(zhǎng)春理工大學(xué)學(xué)報(bào)(高教版);2008年02期

5 章國(guó)寶;宋清華;費(fèi)樹岷;趙艷;;語音情感識(shí)別研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年01期

6 石瑛;胡學(xué)鋼;方磊;;基于決策樹的多特征語音情感識(shí)別[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年01期

7 趙臘生;張強(qiáng);魏小鵬;;語音情感識(shí)別研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2009年02期

8 張石清;趙知?jiǎng)?;噪聲背景下的語音情感識(shí)別[J];西南交通大學(xué)學(xué)報(bào);2009年03期

9 黃程韋;金峗;王青云;趙艷;趙力;;基于特征空間分解與融合的語音情感識(shí)別[J];信號(hào)處理;2010年06期

10 袁健;賀祥;許華虎;馮肖維;劉玲;;服務(wù)機(jī)器人的語音情感識(shí)別與交互技術(shù)研究[J];小型微型計(jì)算機(jī)系統(tǒng);2010年07期

相關(guān)會(huì)議論文 前8條

1 陳建廈;;語音情感識(shí)別綜述[A];第一屆中國(guó)情感計(jì)算及智能交互學(xué)術(shù)會(huì)議論文集[C];2003年

2 楊桃香;楊鑒;畢福昆;;基于模糊聚類的語音情感識(shí)別[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年

3 羅武駿;包永強(qiáng);趙力;;基于模糊支持向量機(jī)的語音情感識(shí)別方法[A];2012'中國(guó)西部聲學(xué)學(xué)術(shù)交流會(huì)論文集(Ⅱ)[C];2012年

4 王青;謝波;陳根才;;基于神經(jīng)網(wǎng)絡(luò)的漢語語音情感識(shí)別[A];第一屆中國(guó)情感計(jì)算及智能交互學(xué)術(shù)會(huì)議論文集[C];2003年

5 張鼎天;徐明星;;基于調(diào)制頻譜特征的自動(dòng)語音情感識(shí)別[A];第十二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

6 童燦;;基于boosting HMM的語音情感識(shí)別[A];2008年中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集(下冊(cè))[C];2009年

7 戴明洋;楊大利;徐明星;;語音情感識(shí)別中UBM訓(xùn)練集的組成研究[A];第十一屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識(shí)別[A];第十二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

相關(guān)博士學(xué)位論文 前7條

1 孫亞新;語音情感識(shí)別中的特征提取與識(shí)別算法研究[D];華南理工大學(xué);2015年

2 王坤俠;語音情感識(shí)別方法研究[D];合肥工業(yè)大學(xué);2015年

3 韓文靜;語音情感識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

4 謝波;普通話語音情感識(shí)別關(guān)鍵技術(shù)研究[D];浙江大學(xué);2006年

5 尤鳴宇;語音情感識(shí)別的關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年

6 劉佳;語音情感識(shí)別的研究與應(yīng)用[D];浙江大學(xué);2009年

7 趙臘生;語音情感特征提取與識(shí)別方法研究[D];大連理工大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 陳曉東;基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識(shí)別[D];華南理工大學(xué);2015年

2 孫志鋒;語音情感識(shí)別研究[D];陜西師范大學(xué);2015年

3 譚發(fā)曾;語音情感狀態(tài)模糊識(shí)別研究[D];電子科技大學(xué);2015年

4 陳鑫;相空間重構(gòu)在語音情感識(shí)別中的研究[D];長(zhǎng)沙理工大學(xué);2014年

5 李昌群;基于特征選擇的語音情感識(shí)別[D];合肥工業(yè)大學(xué);2015年

6 陳文汐;基于核函數(shù)的語音情感識(shí)別技術(shù)的研究[D];東南大學(xué);2015年

7 薛文韜;基于深度學(xué)習(xí)和遷移學(xué)習(xí)的語音情感識(shí)別方法研究[D];江蘇大學(xué);2016年

8 宋明虎;電力行業(yè)電話電話客服語音情感識(shí)別[D];昆明理工大學(xué);2016年

9 陳肖;基于多粒度特征融合的維度語音情感識(shí)別方法研究[D];哈爾濱工業(yè)大學(xué);2016年

10 任浩;基于多級(jí)分類的語音情感識(shí)別[D];哈爾濱工業(yè)大學(xué);2016年

,

本文編號(hào):1425172

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1425172.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶81dd1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com