說話人識別的特征組合方法
本文關(guān)鍵詞:說話人識別的特征組合方法
更多相關(guān)文章: 說話人識別 梅爾頻率倒譜系數(shù) 線性預(yù)測系數(shù) 矢量量化 高斯混合模型
【摘要】:針對說話人識別中線性預(yù)測系數(shù)(LPC)和梅爾頻率倒譜系數(shù)(MFCC)的直接組合會增加特征參數(shù)的維數(shù)和出現(xiàn)運(yùn)算量大的問題,提出了將LPC參數(shù)融入到MFCC參數(shù)的計算中的特征提取方法。首先,計算語音信號的LPC系數(shù),求出LPC功率譜;其次,將LPC功率譜通過三角形濾波器組,并取對數(shù);最后,將取對數(shù)后的輸出做離散余弦變換,得到新特征線性預(yù)測梅爾頻率倒譜系數(shù)(LPMFCC)。LPMFCC參數(shù)兼具LPC參數(shù)的聲道特性和MFCC參數(shù)的聽覺特性,雖增加了一步計算,但不增加參數(shù)的維數(shù),運(yùn)算量相對較少。實驗結(jié)果表明,在純凈語音環(huán)境下,提出的LPMFCC參數(shù)的說話人識別率較LPC參數(shù)和MFCC參數(shù)的說話人識別率分別提升了18.57%和10%,在不同噪聲環(huán)境下,分別提高了13.22%和4.55%。
【作者單位】: 湘潭大學(xué)物理與光電工程學(xué)院;
【關(guān)鍵詞】: 說話人識別 梅爾頻率倒譜系數(shù) 線性預(yù)測系數(shù) 矢量量化 高斯混合模型
【基金】:國家自然科學(xué)基金資助項目(60972147)
【分類號】:TN912.34
【正文快照】: 0引言說話人識別技術(shù)以其獨特的方便性、經(jīng)濟(jì)性、準(zhǔn)確性受到了世人的矚目,被廣泛應(yīng)用到信息安全領(lǐng)域、通信領(lǐng)域、司法領(lǐng)域和軍事領(lǐng)域[1]。而如何從說話人的語音信號中提取出具有說話人個性、易分類且不隨時間空間變化的特征是說話人識別技術(shù)的難點及研究目標(biāo)[2]。目前,說話人
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 王書詔;邱天爽;;說話人識別研究綜述[J];電聲技術(shù);2007年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 周春暉;基于MFCC特征和GMM模型的說話人識別系統(tǒng)研究[D];蘭州理工大學(xué);2013年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳蘊(yùn)谷;;基于譜減法和經(jīng)驗?zāi)J椒纸獾恼Z音增強(qiáng)[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2010年01期
2 李飛;李紅蓮;;支持向量機(jī)大規(guī)模樣本快速訓(xùn)練算法[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2012年02期
3 馮哲;孫吉貴;張長勝;王巖;;漢語語音合成的研究進(jìn)展[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2007年02期
4 張余生;夏秀渝;楊莎;;基于神經(jīng)網(wǎng)絡(luò)和卡爾曼濾波算法的說話人識別[J];成都信息工程學(xué)院學(xué)報;2008年04期
5 冀常鵬;高茉;;嘈雜環(huán)境下語音信號端點檢測方法研究[J];成都信息工程學(xué)院學(xué)報;2011年03期
6 吳晶;柳洪軼;;基于子帶編碼的數(shù)字音頻水印算法研究[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2008年03期
7 張東;林暉;;基于子帶編碼的數(shù)字音頻隱藏算法研究[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2009年04期
8 趙立業(yè);;數(shù)字助聽器系統(tǒng)中的回聲消除方法[J];傳感器與微系統(tǒng);2009年11期
9 王易川;李智忠;;基于Mel倒譜和BP神經(jīng)網(wǎng)絡(luò)的船舶目標(biāo)分類研究[J];傳感器與微系統(tǒng);2011年06期
10 王宏;郭艷麗;賈新民;;基于HMM的孤立字識別[J];昌吉學(xué)院學(xué)報;2006年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 黃湘松;基于混淆網(wǎng)絡(luò)的漢語語音檢索技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 尹偉;基于模型的語音增強(qiáng)方法及質(zhì)量評估研究[D];武漢大學(xué);2009年
3 曾慶虎;機(jī)械傳動系統(tǒng)關(guān)鍵零部件故障預(yù)測技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
4 許敏強(qiáng);基于話者統(tǒng)計特征和SVM的文本無關(guān)話者確認(rèn)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
5 梁彥霞;低速率多帶激勵線性預(yù)測語音編碼技術(shù)的研究[D];西安電子科技大學(xué);2011年
6 李燁;基于多帶激勵模型的低速率語音編碼技術(shù)研究[D];西安電子科技大學(xué);2011年
7 尉洪;漢語基元音素獨立分量譜分析對比及語音合成研究[D];云南大學(xué);2011年
8 呂釗;噪聲環(huán)境下的語音識別算法研究[D];安徽大學(xué);2011年
9 劉紀(jì)平;多重演化神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用[D];武漢大學(xué);2011年
10 呂曉玲;基于聽覺信息的機(jī)器人聲源定位技術(shù)研究[D];河北工業(yè)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王萍;語音情感識別研究[D];山東科技大學(xué);2010年
2 樓侃;基于DSP的語音信號環(huán)境噪聲降噪處理技術(shù)的研究[D];長春理工大學(xué);2010年
3 靳志強(qiáng);報告廳環(huán)境下語音增強(qiáng)方法研究[D];鄭州大學(xué);2010年
4 王文姝;基于模糊理論的關(guān)鍵詞識別算法研究[D];哈爾濱工程大學(xué);2010年
5 劉維巍;語音信號基音周期檢測算法研究[D];哈爾濱工程大學(xué);2010年
6 孫大為;數(shù)字化單邊帶水聲語音通信系統(tǒng)的研究與實現(xiàn)[D];哈爾濱工程大學(xué);2010年
7 陳偉偉;基于鼾聲檢測的睡眠呼吸暫停低通氣綜合癥診斷[D];大連理工大學(xué);2010年
8 翟文博;基于SIP協(xié)議框架的語音通信系統(tǒng)的研究與設(shè)計[D];大連理工大學(xué);2010年
9 楊炬亮;音樂背景噪聲下語音增強(qiáng)技術(shù)的研究[D];遼寧工程技術(shù)大學(xué);2010年
10 張宇;基于倒譜特征的說話人識別方法研究[D];大連海事大學(xué);2010年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 甄斌,吳璽宏,劉志敏,遲惠生;語音識別和說話人識別中各倒譜分量的相對重要性[J];北京大學(xué)學(xué)報(自然科學(xué)版);2001年03期
2 劉鳴,戴蓓倩,李輝,李霄寒,陸偉;基于離散小波變換和感知頻域濾波的語音特征參數(shù)[J];電路與系統(tǒng)學(xué)報;2000年01期
3 趙力,鄒采榮,吳鎮(zhèn)揚(yáng);HMM在說話人識別中的應(yīng)用[J];電路與系統(tǒng)學(xué)報;2001年03期
4 李燕萍;唐振民;丁輝;張燕;;基于GMM特征變換和模糊LS-SVM的說話人辨認(rèn)[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2008年S1期
5 張學(xué)鋒;王芳;夏萍;;融合LPC與MFCC的特征參數(shù)[J];計算機(jī)工程;2011年04期
6 徐濤,,楊國慶,陳松燦;數(shù)據(jù)融合的概念、方法及應(yīng)用[J];南京航空航天大學(xué)學(xué)報;1995年02期
7 馬靜;李國勇;王s
本文編號:1007457
本文鏈接:http://sikaile.net/kejilunwen/wltx/1007457.html