面向情感語音轉(zhuǎn)換的韻律轉(zhuǎn)換方法
本文選題:混合高斯模型 + 離散余弦變換 ; 參考:《聲學(xué)學(xué)報》2014年04期
【摘要】:面向情感語音轉(zhuǎn)換,該文提出了一種韻律轉(zhuǎn)換方法。該方法包含基頻轉(zhuǎn)換和時長轉(zhuǎn)換兩個部分,前者選擇離散余弦變換(DCT)參數(shù)化基頻,根據(jù)基頻的層次結(jié)構(gòu)特點(diǎn),將基頻分解為短語層和音節(jié)層兩個層次,使用基于混合高斯模型(GMM)的轉(zhuǎn)換方法對兩個層次分別進(jìn)行轉(zhuǎn)換;后者使用基于分類回歸樹(CART)的方法以聲韻母為基本單位對時長進(jìn)行轉(zhuǎn)換。一個包含三種基本情感的語料庫用作訓(xùn)練和測試,客觀評測以及主觀評測實(shí)驗(yàn)結(jié)果顯示該方法可有效進(jìn)行情感韻律轉(zhuǎn)換,其中悲傷情感在主觀實(shí)驗(yàn)中達(dá)到了接近100%的正確率。
[Abstract]:In this paper, a prosodic conversion method is proposed for affective speech conversion. The method consists of two parts: fundamental frequency conversion and time-length conversion. The former selects DCT (discrete cosine transform) parameterized fundamental frequency, which is decomposed into phrase layer and syllable layer according to the characteristics of fundamental frequency hierarchy. The conversion method based on mixed Gao Si model (GMM) is used to transform the two levels, and the latter uses the method based on the classification regression tree to convert the duration of time with the rhyme and initials as the basic unit. A corpus of three basic emotions is used for training and testing. The experimental results of objective evaluation and subjective evaluation show that the proposed method is effective in the conversion of emotional prosody. The correct rate of sadness emotion is nearly 100% in the subjective experiment.
【作者單位】: 中國科學(xué)技術(shù)大學(xué)自動化系;語音及語言信息處理國家工程實(shí)驗(yàn)室;中國科學(xué)院合肥智能機(jī)械研究所;
【基金】:安徽省科技攻關(guān)計劃語音專項(xiàng)(11010202192) 國家自然科學(xué)基金(61303150) 安徽省自主創(chuàng)新專項(xiàng)資金智能語音技術(shù)研發(fā)和產(chǎn)業(yè)化專項(xiàng)(13Z02008) 中國博士后科學(xué)基金(2012M521248)資助
【分類號】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 蘇莊鑾;汪增福;;基于統(tǒng)計方法的普通話情感語調(diào)模型[J];自動化學(xué)報;2007年07期
【共引文獻(xiàn)】
相關(guān)會議論文 前1條
1 毛峽;魏鵬飛;薛雨麗;;基于改進(jìn)聲調(diào)核模型的漢語普通話聲調(diào)識別[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前2條
1 黃云峰;車間調(diào)度和諧范式與多智能體系統(tǒng)情智集成的研究[D];重慶大學(xué);2010年
2 榮蓉;漢語普通話聲調(diào)的聽感格局[D];南開大學(xué);2013年
相關(guān)碩士學(xué)位論文 前5條
1 張瑩;普通話的態(tài)度語音韻律研究[D];南京師范大學(xué);2011年
2 劉艷;普通話的情感語音韻律分析[D];南京師范大學(xué);2011年
3 王一淇;“八度標(biāo)調(diào)、唱調(diào)法”應(yīng)用于對英語母語者的聲調(diào)教學(xué)探索[D];遼寧大學(xué);2013年
4 謝小靜;7至12歲漢語兒童焦點(diǎn)語調(diào)格局聲學(xué)研究[D];湖南大學(xué);2013年
5 王紅麗;基于FDA的語音基頻建模的研究[D];西北師范大學(xué);2013年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 趙力,王治平,盧韋,鄒采榮,吳鎮(zhèn)揚(yáng);全局和時序結(jié)構(gòu)特征并用的語音信號情感特征識別方法[J];自動化學(xué)報;2004年03期
2 吳宗濟(jì);趙元任先生在漢語聲調(diào)研究上的貢獻(xiàn)[J];清華大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);1996年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 戴佳駿;周軍;;基于運(yùn)動矢量場的混合高斯建模的背景分離方法[J];微計算機(jī)信息;2006年22期
2 卞金洪;王吉林;;利用性別判識技術(shù)的說話人識別系統(tǒng)的研究[J];信息化研究;2011年01期
3 戴紅霞;趙力;;考慮性別差異的與文本無關(guān)說話人識別系統(tǒng)的實(shí)現(xiàn)[J];電聲技術(shù);2006年03期
4 謝凱添;景占榮;;基于無線傳感器網(wǎng)絡(luò)的多目標(biāo)分類[J];微計算機(jī)應(yīng)用;2008年06期
5 徐璐;胡福喬;;基于混合高斯模型的攝像機(jī)移動檢測[J];計算機(jī)應(yīng)用與軟件;2010年06期
6 山拜·達(dá)拉拜;曹紅麗;尤努斯·艾沙;;基于遺傳算法的K-means初始化EM算法及聚類應(yīng)用[J];現(xiàn)代電子技術(shù);2010年15期
7 包永強(qiáng);趙力;鄒采榮;;說話人識別模型失配下的似然得分補(bǔ)償變換[J];電路與系統(tǒng)學(xué)報;2006年04期
8 謝建平;;基于MVQM說話人識別系統(tǒng)的DSP實(shí)現(xiàn)[J];微電子學(xué)與計算機(jī);2006年06期
9 曹紅麗;山拜·達(dá)拉拜;;混合EM算法研究及聚類應(yīng)用[J];通信技術(shù);2010年11期
10 龍興明,周靜;基于混合高斯模型的圖象去噪方法研究[J];計算機(jī)工程與應(yīng)用;2005年21期
相關(guān)會議論文 前6條
1 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年
2 李旭健;房勝;梁永全;;視頻監(jiān)控中運(yùn)動物體提取系統(tǒng)的設(shè)計和實(shí)現(xiàn)[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年
3 王平波;蔡志明;;有色非高斯數(shù)據(jù)的混合高斯自回歸模型建模研究[A];中國聲學(xué)學(xué)會2006年全國聲學(xué)學(xué)術(shù)會議論文集[C];2006年
4 倪素萍;張建平;顏永紅;呂士楠;;語音音色變換的現(xiàn)有技術(shù)分析[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
5 李桂春;鄭能恒;李霞;;基于模糊隸屬值加權(quán)的MFCC特征提取算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2011)論文集【poster】[C];2011年
6 吳佩珊;楊鑒;;云南民族語口音漢語普通話語音識別中的聲學(xué)建模[A];第二十七屆中國控制會議論文集[C];2008年
相關(guān)博士學(xué)位論文 前4條
1 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年
2 黃青華;基于源信號模型的盲分離技術(shù)研究及應(yīng)用[D];上海交通大學(xué);2007年
3 李邵梅;文本無關(guān)短語音說話人識別技術(shù)研究[D];解放軍信息工程大學(xué);2011年
4 李小軍;獨(dú)立分量分析及其在陣列信號處理中的應(yīng)用[D];西安電子科技大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 曹紅麗;混合高斯模型的混合EM算法研究及聚類應(yīng)用[D];新疆大學(xué);2010年
2 程換麗;視頻監(jiān)控中遺留物體的檢測研究[D];河北科技大學(xué);2014年
3 王吉林;利用矢量量化(VQ)和混合高斯模型(GMM)的說話人識別的研究[D];東南大學(xué);2004年
4 孫迎肖;運(yùn)動目標(biāo)檢測在銀行視頻集中監(jiān)控系統(tǒng)中的應(yīng)用[D];河北師范大學(xué);2014年
5 李圓;基于GMM說話人分類的說話人識別系統(tǒng)研究[D];華北電力大學(xué)(河北);2008年
6 吳德輝;基于因子分析的魯棒性話者確認(rèn)方法研究[D];中國科學(xué)技術(shù)大學(xué);2009年
7 史昕亮;運(yùn)動對象分割及基于對象的MPEG-4編碼[D];浙江大學(xué);2007年
8 魏利利;音頻信號分類算法研究[D];大連理工大學(xué);2009年
9 施愛春;分布式聲源定位與跟蹤算法研究[D];復(fù)旦大學(xué);2011年
10 郭亦鵬;基于視頻監(jiān)控的大空間室內(nèi)火災(zāi)煙霧識別方法[D];華中科技大學(xué);2011年
,本文編號:1882069
本文鏈接:http://sikaile.net/kejilunwen/wltx/1882069.html