差分和加權(quán)Mel倒譜混合參數(shù)應(yīng)用于說(shuō)話人識(shí)別
本文選題:說(shuō)話人識(shí)別 + 加權(quán)Mel頻率倒譜系數(shù); 參考:《微電子學(xué)與計(jì)算機(jī)》2014年09期
【摘要】:說(shuō)話人識(shí)別是信息技術(shù)和生物學(xué)的新一代身份驗(yàn)證方式,在說(shuō)話人識(shí)別的研究中,特征參數(shù)的提取直接影響到識(shí)別系統(tǒng)最終的識(shí)別效率.通過(guò)對(duì)Mel頻率倒譜系數(shù)特征參數(shù)進(jìn)行分析研究,基于Mel頻率倒譜系數(shù)改進(jìn)加權(quán)函數(shù),將體現(xiàn)個(gè)人語(yǔ)音特性的加權(quán)特征參數(shù)與反映語(yǔ)音幀間變化的差分Mel頻率倒譜系數(shù)進(jìn)行維度篩選,再進(jìn)行參數(shù)混合.實(shí)驗(yàn)結(jié)果表明,通過(guò)改進(jìn)加權(quán)函數(shù)提取得到的特征參數(shù)與差分Mel頻率倒譜系數(shù)的混合參數(shù)在矢量量化的說(shuō)話人識(shí)別系統(tǒng)中,碼本容量為16和32時(shí)可以達(dá)到100%的識(shí)別率.
[Abstract]:Speaker recognition is a new generation of authentication in information technology and biology. In the research of speaker recognition, the extraction of feature parameters directly affects the final recognition efficiency of the recognition system. By analyzing the characteristic parameters of Mel frequency cepstrum coefficient, the weighting function is improved based on Mel frequency cepstrum coefficient. The weighted feature parameters which reflect the individual speech characteristics and the difference Mel frequency cepstrum coefficients which reflect the variation of speech frames are selected in dimension and then the parameters are mixed. The experimental results show that the mixed parameters of the characteristic parameters extracted by the improved weighting function and the Cepstrum coefficients of the differential Mel frequency can achieve a recognition rate of 100% when the codebook capacity is 16 and 32 in the vector quantized speaker recognition system.
【作者單位】: 桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院;桂林電子科技大學(xué)信息與通信學(xué)院;
【基金】:廣西自然科學(xué)基金(2012GXNSFAA053221) 國(guó)家自然科學(xué)基金(61363005)
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 崔玉紅,胡光銳,何旭明;基于混合進(jìn)化計(jì)算的GMM優(yōu)化方法及其在說(shuō)話人辨認(rèn)中的應(yīng)用[J];應(yīng)用科學(xué)學(xué)報(bào);2002年02期
2 林平瀾;王仁華;;動(dòng)態(tài)HMM及其在說(shuō)話人識(shí)別中的應(yīng)用[J];信號(hào)處理;1993年04期
3 周靜芳,陳一寧,李科,劉加;基于高斯語(yǔ)音濾波的穩(wěn)健文本無(wú)關(guān)說(shuō)話人識(shí)別[J];計(jì)算機(jī)工程;2005年02期
4 鄧浩江,王守覺,邢藏菊,李倩;基于聚類統(tǒng)計(jì)與文本無(wú)關(guān)的說(shuō)話人識(shí)別研究[J];電路與系統(tǒng)學(xué)報(bào);2001年03期
5 王煒,王炳錫,王波;信道補(bǔ)償技術(shù)的發(fā)展及其在說(shuō)話人識(shí)別上的應(yīng)用[J];電聲技術(shù);2004年04期
6 韓雁,陳利華;說(shuō)話人計(jì)算機(jī)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
7 吳曉娟,韓先花,聶開寶;模糊C-均值(FCM)聚類法與矢量量化法相結(jié)合用于說(shuō)話人識(shí)別[J];電子與信息學(xué)報(bào);2002年06期
8 單進(jìn);;說(shuō)話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期
9 戴紅霞,趙力;采用幀概率變換的與文本無(wú)關(guān)說(shuō)話人識(shí)別系統(tǒng)的實(shí)現(xiàn)[J];電聲技術(shù);2004年09期
10 劉雅琴,杜海明;基于矢量量化的說(shuō)話人識(shí)別[J];洛陽(yáng)師范學(xué)院學(xué)報(bào);2005年05期
相關(guān)會(huì)議論文 前10條
1 李桂春;鄭能恒;李霞;;基于模糊隸屬值加權(quán)的MFCC特征提取算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
2 司羅;胡起秀;金琴;;完全無(wú)監(jiān)督的雙人對(duì)話中的說(shuō)話人分隔[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
3 周昊朗;王嵐;陳珂;;一個(gè)面向說(shuō)話人識(shí)別的漢語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
4 周昊朗;王嵐;吳璽宏;遲惠生;;一個(gè)面向說(shuō)話人識(shí)別的漢語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù)[A];信號(hào)與信息處理技術(shù)——第一屆信號(hào)與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
5 侯麗敏;謝娟敏;;共振峰瞬時(shí)頻率特征用于說(shuō)話人識(shí)別[A];第九屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
6 周靜芳;陳一寧;劉潤(rùn)生;;一種新的說(shuō)話人識(shí)別信道補(bǔ)償技術(shù)[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
7 吳志強(qiáng);陳珂;遲惠生;;語(yǔ)音識(shí)別技術(shù)與說(shuō)話人識(shí)別技術(shù)的結(jié)合——文本無(wú)關(guān)說(shuō)話人識(shí)別的另一種方法[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
8 卓群;歐貴文;;基于模糊高斯混合模型的說(shuō)話人識(shí)別算法的一些改進(jìn)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
9 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說(shuō)話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
10 羅海風(fēng);龍長(zhǎng)才;;多話者環(huán)境下說(shuō)話人辨識(shí)聽覺線索研究[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年
相關(guān)重要報(bào)紙文章 前1條
1 中科院自動(dòng)化所生物特征認(rèn)證與測(cè)評(píng)中心 白俊梅;聽到的真實(shí)嗎?[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 單振宇;情感說(shuō)話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年
2 姜濤;網(wǎng)絡(luò)環(huán)境下說(shuō)話人識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
3 王琳琳;說(shuō)話人識(shí)別中的時(shí)變魯棒性問(wèn)題研究[D];清華大學(xué);2013年
4 王爾玉;基于若干聲紋信息空間的說(shuō)話人識(shí)別技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
5 方遠(yuǎn)香;基于音素分類的短語(yǔ)音說(shuō)話人識(shí)別[D];清華大學(xué);2012年
6 蔣曄;基于短語(yǔ)音和信道變化的說(shuō)話人識(shí)別研究[D];南京理工大學(xué);2013年
7 黃挺;情感說(shuō)話人識(shí)別中的基頻失配及其補(bǔ)償方法研究[D];浙江大學(xué);2011年
8 李邵梅;文本無(wú)關(guān)短語(yǔ)音說(shuō)話人識(shí)別技術(shù)研究[D];解放軍信息工程大學(xué);2011年
9 龔呈卉;基于聯(lián)合因子分析的耳語(yǔ)音說(shuō)話人識(shí)別研究[D];蘇州大學(xué);2014年
10 張冰;人類聽覺信息處理機(jī)制的心理物理學(xué)研究[D];華中科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 張偉偉;說(shuō)話人識(shí)別技術(shù)的研究[D];燕山大學(xué);2010年
2 李偉娟;基于智能群體和盲源分離的說(shuō)話人識(shí)別[D];蘭州理工大學(xué);2010年
3 王芳;說(shuō)話人識(shí)別中一種特征參數(shù)的研究[D];安徽工業(yè)大學(xué);2010年
4 傅庚申;說(shuō)話人識(shí)別算法研究[D];大連理工大學(xué);2005年
5 潘鵬;會(huì)議室環(huán)境下基于音頻視頻信息融合的多說(shuō)話人識(shí)別[D];蘭州理工大學(xué);2011年
6 楊延龍;與文本無(wú)關(guān)的說(shuō)話人識(shí)別的關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2010年
7 徐良軍;基于語(yǔ)音信號(hào)時(shí)變特性的說(shuō)話人識(shí)別[D];蘇州大學(xué);2010年
8 陳文翔;面向OPHONE手機(jī)的說(shuō)話人識(shí)別技術(shù)移植研究[D];浙江大學(xué);2011年
9 陳強(qiáng);基于GMM的說(shuō)話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2010年
10 黃肖忠;基于韻律特征的SVM說(shuō)話人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
,本文編號(hào):1799716
本文鏈接:http://sikaile.net/kejilunwen/wltx/1799716.html