差分和加權(quán)Mel倒譜混合參數(shù)應(yīng)用于說話人識(shí)別
本文選題:說話人識(shí)別 + 加權(quán)Mel頻率倒譜系數(shù)�。� 參考:《微電子學(xué)與計(jì)算機(jī)》2014年09期
【摘要】:說話人識(shí)別是信息技術(shù)和生物學(xué)的新一代身份驗(yàn)證方式,在說話人識(shí)別的研究中,特征參數(shù)的提取直接影響到識(shí)別系統(tǒng)最終的識(shí)別效率.通過對Mel頻率倒譜系數(shù)特征參數(shù)進(jìn)行分析研究,基于Mel頻率倒譜系數(shù)改進(jìn)加權(quán)函數(shù),將體現(xiàn)個(gè)人語音特性的加權(quán)特征參數(shù)與反映語音幀間變化的差分Mel頻率倒譜系數(shù)進(jìn)行維度篩選,再進(jìn)行參數(shù)混合.實(shí)驗(yàn)結(jié)果表明,通過改進(jìn)加權(quán)函數(shù)提取得到的特征參數(shù)與差分Mel頻率倒譜系數(shù)的混合參數(shù)在矢量量化的說話人識(shí)別系統(tǒng)中,碼本容量為16和32時(shí)可以達(dá)到100%的識(shí)別率.
[Abstract]:Speaker recognition is a new generation of authentication in information technology and biology. In the research of speaker recognition, the extraction of feature parameters directly affects the final recognition efficiency of the recognition system. By analyzing the characteristic parameters of Mel frequency cepstrum coefficient, the weighting function is improved based on Mel frequency cepstrum coefficient. The weighted feature parameters which reflect the individual speech characteristics and the difference Mel frequency cepstrum coefficients which reflect the variation of speech frames are selected in dimension and then the parameters are mixed. The experimental results show that the mixed parameters of the characteristic parameters extracted by the improved weighting function and the Cepstrum coefficients of the differential Mel frequency can achieve a recognition rate of 100% when the codebook capacity is 16 and 32 in the vector quantized speaker recognition system.
【作者單位】: 桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院;桂林電子科技大學(xué)信息與通信學(xué)院;
【基金】:廣西自然科學(xué)基金(2012GXNSFAA053221) 國家自然科學(xué)基金(61363005)
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 崔玉紅,胡光銳,何旭明;基于混合進(jìn)化計(jì)算的GMM優(yōu)化方法及其在說話人辨認(rèn)中的應(yīng)用[J];應(yīng)用科學(xué)學(xué)報(bào);2002年02期
2 林平瀾;王仁華;;動(dòng)態(tài)HMM及其在說話人識(shí)別中的應(yīng)用[J];信號(hào)處理;1993年04期
3 周靜芳,陳一寧,李科,劉加;基于高斯語音濾波的穩(wěn)健文本無關(guān)說話人識(shí)別[J];計(jì)算機(jī)工程;2005年02期
4 鄧浩江,王守覺,邢藏菊,李倩;基于聚類統(tǒng)計(jì)與文本無關(guān)的說話人識(shí)別研究[J];電路與系統(tǒng)學(xué)報(bào);2001年03期
5 王煒,王炳錫,王波;信道補(bǔ)償技術(shù)的發(fā)展及其在說話人識(shí)別上的應(yīng)用[J];電聲技術(shù);2004年04期
6 韓雁,陳利華;說話人計(jì)算機(jī)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
7 吳曉娟,韓先花,聶開寶;模糊C-均值(FCM)聚類法與矢量量化法相結(jié)合用于說話人識(shí)別[J];電子與信息學(xué)報(bào);2002年06期
8 單進(jìn);;說話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期
9 戴紅霞,趙力;采用幀概率變換的與文本無關(guān)說話人識(shí)別系統(tǒng)的實(shí)現(xiàn)[J];電聲技術(shù);2004年09期
10 劉雅琴,杜海明;基于矢量量化的說話人識(shí)別[J];洛陽師范學(xué)院學(xué)報(bào);2005年05期
相關(guān)會(huì)議論文 前10條
1 李桂春;鄭能恒;李霞;;基于模糊隸屬值加權(quán)的MFCC特征提取算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
2 司羅;胡起秀;金琴;;完全無監(jiān)督的雙人對話中的說話人分隔[A];第九屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
3 周昊朗;王嵐;陳珂;;一個(gè)面向說話人識(shí)別的漢語語音數(shù)據(jù)庫[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
4 周昊朗;王嵐;吳璽宏;遲惠生;;一個(gè)面向說話人識(shí)別的漢語語音數(shù)據(jù)庫[A];信號(hào)與信息處理技術(shù)——第一屆信號(hào)與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
5 侯麗敏;謝娟敏;;共振峰瞬時(shí)頻率特征用于說話人識(shí)別[A];第九屆中國語音學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
6 周靜芳;陳一寧;劉潤生;;一種新的說話人識(shí)別信道補(bǔ)償技術(shù)[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
7 吳志強(qiáng);陳珂;遲惠生;;語音識(shí)別技術(shù)與說話人識(shí)別技術(shù)的結(jié)合——文本無關(guān)說話人識(shí)別的另一種方法[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
8 卓群;歐貴文;;基于模糊高斯混合模型的說話人識(shí)別算法的一些改進(jìn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
9 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊)[C];2007年
10 羅海風(fēng);龍長才;;多話者環(huán)境下說話人辨識(shí)聽覺線索研究[A];中國聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年
相關(guān)重要報(bào)紙文章 前1條
1 中科院自動(dòng)化所生物特征認(rèn)證與測評中心 白俊梅;聽到的真實(shí)嗎?[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年
2 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
3 王琳琳;說話人識(shí)別中的時(shí)變魯棒性問題研究[D];清華大學(xué);2013年
4 王爾玉;基于若干聲紋信息空間的說話人識(shí)別技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2012年
5 方遠(yuǎn)香;基于音素分類的短語音說話人識(shí)別[D];清華大學(xué);2012年
6 蔣曄;基于短語音和信道變化的說話人識(shí)別研究[D];南京理工大學(xué);2013年
7 黃挺;情感說話人識(shí)別中的基頻失配及其補(bǔ)償方法研究[D];浙江大學(xué);2011年
8 李邵梅;文本無關(guān)短語音說話人識(shí)別技術(shù)研究[D];解放軍信息工程大學(xué);2011年
9 龔呈卉;基于聯(lián)合因子分析的耳語音說話人識(shí)別研究[D];蘇州大學(xué);2014年
10 張冰;人類聽覺信息處理機(jī)制的心理物理學(xué)研究[D];華中科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 張偉偉;說話人識(shí)別技術(shù)的研究[D];燕山大學(xué);2010年
2 李偉娟;基于智能群體和盲源分離的說話人識(shí)別[D];蘭州理工大學(xué);2010年
3 王芳;說話人識(shí)別中一種特征參數(shù)的研究[D];安徽工業(yè)大學(xué);2010年
4 傅庚申;說話人識(shí)別算法研究[D];大連理工大學(xué);2005年
5 潘鵬;會(huì)議室環(huán)境下基于音頻視頻信息融合的多說話人識(shí)別[D];蘭州理工大學(xué);2011年
6 楊延龍;與文本無關(guān)的說話人識(shí)別的關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2010年
7 徐良軍;基于語音信號(hào)時(shí)變特性的說話人識(shí)別[D];蘇州大學(xué);2010年
8 陳文翔;面向OPHONE手機(jī)的說話人識(shí)別技術(shù)移植研究[D];浙江大學(xué);2011年
9 陳強(qiáng);基于GMM的說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2010年
10 黃肖忠;基于韻律特征的SVM說話人識(shí)別[D];中國科學(xué)技術(shù)大學(xué);2010年
,本文編號(hào):1799716
本文鏈接:http://sikaile.net/kejilunwen/wltx/1799716.html