半監(jiān)督判別分析的跨庫語音情感識(shí)別
本文關(guān)鍵詞:半監(jiān)督判別分析的跨庫語音情感識(shí)別
更多相關(guān)文章: 語音情感識(shí)別 判別分析 訓(xùn)練樣本 投影方向 測試樣本 Berlin 散度 樣本間 分類器 特征向量
【摘要】:針對訓(xùn)練樣本與測試樣本來自不同語音情感數(shù)據(jù)庫造成特征向量空間分布不匹配的問題,采用半監(jiān)督判別分析減小二者的差異。首先尋找有標(biāo)簽的訓(xùn)練樣本和來自另一個(gè)庫的部分無標(biāo)簽訓(xùn)練樣本之間的最優(yōu)投影方向。基于一致性假設(shè)即相近的點(diǎn)更有可能具有相同的類別,利用p近鄰圖對無標(biāo)簽訓(xùn)練樣本相近點(diǎn)之間的關(guān)系進(jìn)行建模,從而獲得無標(biāo)簽樣本的分布信息。在保證無標(biāo)簽樣本間流形結(jié)構(gòu)的同時(shí),使所有訓(xùn)練樣本類間散度和類內(nèi)散度的比值達(dá)到最大,從而得到最優(yōu)的投影方向。采用兩組實(shí)驗(yàn)進(jìn)行驗(yàn)證,第1組用eNTERFACE庫訓(xùn)練去測試Berlin庫,識(shí)別率為51.41%,第2組用Berlin庫訓(xùn)練測試eNTERFACE庫,識(shí)別率為45.76%,相比未采用半監(jiān)督判別分析的識(shí)別結(jié)果分別有了13.72%和22.81%的提高,說明該算法的有效性。通過實(shí)驗(yàn)前后數(shù)據(jù)的可視化分析,說明利用半監(jiān)督判別分析確實(shí)減小了不同庫之間特征向量空間分布的不匹配問題,從而提高跨庫語音情感識(shí)別率。
【作者單位】: 江蘇師范大學(xué)物理與電子工程學(xué)院;東南大學(xué)水聲信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室;東南大學(xué)兒童發(fā)展與學(xué)習(xí)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 語音情感識(shí)別;判別分析;訓(xùn)練樣本;投影方向;測試樣本;Berlin;散度;樣本間;分類器;特征向量;
【基金】:國家自然科學(xué)基金(61231002,61273266,11274144,61301295) 江蘇高校優(yōu)勢學(xué)科建設(shè)工程項(xiàng)目(PAPD)資助
【分類號(hào)】:TN912.34
【正文快照】: 據(jù)庫同時(shí)訓(xùn)練,得到一個(gè)分類器,然后對測試樣本進(jìn)^-蘭 行分類。結(jié)果表明,第2種方法的識(shí)別率高于第1種91 3 方法。Zhang提出了一種無監(jiān)督的學(xué)習(xí)方法用于跨庫語音情感識(shí)別在人機(jī)交互中起到越來越重要的的語音情感識(shí)別,采用6個(gè)語音庫’從喚^度和效作用,獲得越來越多國內(nèi)外研究人員
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙力,將春輝,鄒采榮,吳鎮(zhèn)揚(yáng);語音信號(hào)中的情感特征分析和識(shí)別的研究[J];電子學(xué)報(bào);2004年04期
2 黃程韋;趙艷;金峗;于寅驊;趙力;;實(shí)用語音情感的特征分析與識(shí)別的研究[J];電子與信息學(xué)報(bào);2011年01期
3 韓文靜;李海峰;韓紀(jì)慶;;基于長短時(shí)特征融合的語音情感識(shí)別方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年S1期
4 金峗;趙艷;黃程韋;趙力;;耳語音情感數(shù)據(jù)庫的設(shè)計(jì)與建立[J];聲學(xué)技術(shù);2010年01期
5 ;Study on automatic prediction of sentential stress for Chinese Putonghua Text-to-Speech system with natural style[J];Chinese Journal of Acoustics;2007年01期
6 ;Whispered speaker identification based on feature and model hybrid compensation[J];Chinese Journal of Acoustics;2012年04期
7 TAO Zhi;ZHAO Heming;TAN Xuedan;GU Jihua;ZHANG Xiaojun;WU Di;;Conversion from whispered speech to normal speech using the extended bilinear transformation method[J];Chinese Journal of Acoustics;2013年04期
8 CHEN Xueqin;ZHAO Heming;;Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components[J];Chinese Journal of Acoustics;2013年04期
9 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期
10 ZHANG Xiaodan;HUANG Chengwei;ZHAO Li;ZOU Cairong;;Recognition of practical speech emotion using improved shuffled frog leaping algorithm[J];Chinese Journal of Acoustics;2014年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭微;李正周;田蕾;;基于DSP的智能語音控制系統(tǒng)設(shè)計(jì)[J];傳感器與微系統(tǒng);2012年02期
2 任培花;孫宏志;;基于言語過濾、情感補(bǔ)償?shù)幕铙w聲紋識(shí)別系統(tǒng)的設(shè)計(jì)[J];重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年01期
3 陳清;;英語兒歌中的語言象似性特征研究[J];長沙鐵道學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2009年01期
4 林奕琳;韋崗;楊康才;;語音情感識(shí)別的研究進(jìn)展[J];電路與系統(tǒng)學(xué)報(bào);2007年01期
5 余伶俐;蔡自興;陳明義;;語音信號(hào)的情感特征分析與識(shí)別研究綜述[J];電路與系統(tǒng)學(xué)報(bào);2007年04期
6 狄金海;趙艷;趙力;;模糊矢量量化在語音情感識(shí)別中的應(yīng)用[J];電聲技術(shù);2008年10期
7 國辛純;郭繼昌;竇修全;;基于HMM的語音信號(hào)情感識(shí)別研究[J];電子測量技術(shù);2006年05期
8 卞金洪;王吉林;;利用性別判識(shí)技術(shù)的說話人識(shí)別系統(tǒng)的研究[J];信息化研究;2011年01期
9 余華;徐開軍;;基于模糊集理論的語音情感識(shí)別[J];信息化研究;2011年02期
10 張石清;李樂民;趙知?jiǎng)?;基于一種改進(jìn)的監(jiān)督流形學(xué)習(xí)算法的語音情感識(shí)別[J];電子與信息學(xué)報(bào);2010年11期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前8條
1 李雅;潘詩鋒;陶建華;;采用重音調(diào)整模型的HMM語音合成系統(tǒng)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
2 陳雁翔;;漢語情感語音數(shù)據(jù)庫的設(shè)計(jì)與測試[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
3 張立華;楊瑩春;;情感語音變化規(guī)律的實(shí)驗(yàn)分析研究初步[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
4 韓文靜;李海峰;韓紀(jì)慶;;基于長短時(shí)特征融合的語音情感識(shí)別方法研究[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
5 戴紅霞;趙力;;文本無關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年
6 李悅;黃永明;章國寶;劉海彬;;基于角度差和散度均值特征的人臉表情識(shí)別[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊)[C];2013年
7 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識(shí)別[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
8 高瑩瑩;朱維彬;;漢語朗讀語音中言語情感產(chǎn)生機(jī)制與計(jì)算模型研究——階段性結(jié)果[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 尉洪;漢語基元音素獨(dú)立分量譜分析對比及語音合成研究[D];云南大學(xué);2011年
2 蘇莊鑾;情感語音合成[D];中國科學(xué)技術(shù)大學(xué);2006年
3 劉偉鋒;人臉表情識(shí)別研究[D];中國科學(xué)技術(shù)大學(xué);2007年
4 金學(xué)成;基于語音信號(hào)的情感識(shí)別研究[D];中國科學(xué)技術(shù)大學(xué);2007年
5 孫愛珍;計(jì)算文體學(xué)工作模式探究[D];河南大學(xué);2008年
6 孫偉;基于粒子濾波的視頻目標(biāo)跟蹤關(guān)鍵技術(shù)及應(yīng)用研究[D];西安電子科技大學(xué);2009年
7 孫凱;面向觀眾的電影情感內(nèi)容表示與識(shí)別方法研究[D];華中科技大學(xué);2009年
8 謝s,
本文編號(hào):805342
本文鏈接:http://sikaile.net/kejilunwen/wltx/805342.html