基于模糊神經(jīng)網(wǎng)絡(luò)的說(shuō)話人識(shí)別方法研究
【圖文】:
完成預(yù)處理的語(yǔ)音信號(hào)具有更多的高頻分量,更少的噪聲以及更為均勻的頻率分布。(1)預(yù)加重受聲門激勵(lì)和生理結(jié)構(gòu)的影響,語(yǔ)音信號(hào)的平均功率譜中頻率大于 800Hz 的部分會(huì)按 6dB 倍頻程衰減。為了增加高頻成分,我們通常采用數(shù)字濾波器對(duì)語(yǔ)音信號(hào)預(yù)加重,從而保持語(yǔ)音信號(hào)頻譜的均勻性與平滑性[37]。平滑、均勻的語(yǔ)音信號(hào)可以用相同的信噪比計(jì)算出它的頻譜,為下一步的頻譜分析做準(zhǔn)備。 本次課題中的說(shuō)話人識(shí)別系統(tǒng)采用的是一階數(shù)字濾波器: 11 H z z (2-1)其中 為預(yù)加重系數(shù),通常在范圍 0.9< <1 內(nèi)取值,在本次試驗(yàn)中 取值為0.97。圖 2-2 中,(a)為在說(shuō)話人語(yǔ)音樣本庫(kù)中隨機(jī)選取的一個(gè)說(shuō)話人的語(yǔ)音信號(hào)圖,(b)為對(duì)應(yīng)的頻譜圖。
(a) (b)圖 2-3 濾波器響應(yīng)與部分語(yǔ)音信號(hào)濾波后的頻譜圖 2-3 中,(a)為濾波器的幅頻響應(yīng)與相位響應(yīng)。取出第 200 到 455 點(diǎn)的語(yǔ)音信號(hào)觀察其特性,即(b)圖為部分語(yǔ)音信號(hào)的頻譜及其濾波后的頻譜。(2)分幀連續(xù)長(zhǎng)時(shí)語(yǔ)音信號(hào)具有時(shí)變特性,然而對(duì)于時(shí)長(zhǎng)在 10ms 到 30ms 范圍內(nèi)的語(yǔ)音信號(hào),它的頻譜特征變化小,狀態(tài)穩(wěn)定,具有短時(shí)平穩(wěn)性。在說(shuō)話人識(shí)別領(lǐng)域,建立說(shuō)話人識(shí)別系統(tǒng)都以短時(shí)語(yǔ)音分析技術(shù)[38, 39]為基礎(chǔ)。長(zhǎng)時(shí)語(yǔ)音信號(hào)分割為多個(gè)長(zhǎng)度相等的語(yǔ)音片段的過(guò)程稱為分幀,,其中每一語(yǔ)音片段稱作一幀。幀的長(zhǎng)度通常在[10,30]毫秒范圍內(nèi)取值。經(jīng)過(guò)分幀,能表征說(shuō)話人聲音特性的語(yǔ)音幀就可以代替整段長(zhǎng)時(shí)語(yǔ)音信號(hào)。(3)加窗為了使每一幀的兩端能夠平滑過(guò)渡,一般對(duì)語(yǔ)音幀加窗處理。主瓣和旁瓣的寬度是決定窗函數(shù)性能的主要因素。矩形窗函數(shù)主瓣集中、頻率識(shí)別精度高但是
【學(xué)位授予單位】:南昌航空大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TN912.34;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉倩;李時(shí);;細(xì)菌趨藥性算法在說(shuō)話人識(shí)別中的應(yīng)用[J];宿州學(xué)院學(xué)報(bào);2017年11期
2 趙艷;呂亮;趙力;;基于修正Fukunaga-Koontz變換的說(shuō)話人識(shí)別方法[J];電子器件;2018年04期
3 李為州;楊印根;;說(shuō)話人識(shí)別中基于深度信念網(wǎng)絡(luò)的超向量降維的研究[J];電腦知識(shí)與技術(shù);2017年22期
4 雷震春;萬(wàn)艷紅;羅劍;朱明華;;基于Mahalanobis距離的說(shuō)話人識(shí)別模型研究[J];中國(guó)語(yǔ)音學(xué)報(bào);2016年00期
5 王華朋;李寧;許鋒;蔡能斌;;基于元音共振峰特征的法庭說(shuō)話人識(shí)別[J];中國(guó)刑警學(xué)院學(xué)報(bào);2014年02期
6 王華朋;楊軍;許勇;;應(yīng)用似然比框架的法庭說(shuō)話人識(shí)別[J];數(shù)據(jù)采集與處理;2013年02期
7 檀蕊蓮;劉建平;;說(shuō)話人識(shí)別技術(shù)的研究進(jìn)展[J];科技資訊;2007年33期
8 寧飛,陳頻;說(shuō)話人識(shí)別的幾種方法[J];電聲技術(shù);2001年12期
9 曹業(yè)敏,侯風(fēng)雷,王炳錫;說(shuō)話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
10 王華朋;楊軍;吳鳴;許勇;;基于自適應(yīng)同源方差控制的法庭自動(dòng)說(shuō)話人識(shí)別[J];應(yīng)用科學(xué)學(xué)報(bào);2014年06期
相關(guān)會(huì)議論文 前10條
1 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說(shuō)話人識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年
2 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無(wú)關(guān)說(shuō)話人識(shí)別[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
3 吳璽宏;劉文舉;;聽神經(jīng)計(jì)算模型及其在抗噪說(shuō)話人識(shí)別中的應(yīng)用[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
4 任舒彬;楊瑩春;吳朝暉;;面向多通道說(shuō)話人識(shí)別的預(yù)處理方法實(shí)驗(yàn)研究(類別:聲紋鑒定)[A];第六屆全國(guó)現(xiàn)代語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集(下)[C];2003年
5 劉大力;趙力;;與文本無(wú)關(guān)說(shuō)話人識(shí)別系統(tǒng)的性能比較[A];2004年全國(guó)物理聲學(xué)會(huì)議論文集[C];2004年
6 張陳昊;鄭方;王琳琳;;基于多音素類模型的文本無(wú)關(guān)短語(yǔ)音說(shuō)話人識(shí)別[A];需將論文集名稱修改為“第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC2013)論文集[C];2013年
7 周昊朗;王嵐;陳珂;;一個(gè)面向說(shuō)話人識(shí)別的漢語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
8 龍川;景新幸;楊海燕;;矢量量化與協(xié)方差矩陣結(jié)合的說(shuō)話人識(shí)別方法[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
9 周昊朗;王嵐;吳璽宏;遲惠生;;一個(gè)面向說(shuō)話人識(shí)別的漢語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù)[A];信號(hào)與信息處理技術(shù)——第一屆信號(hào)與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
10 王波;王炳錫;徐毅瓊;;基于多分類器的抗噪聲說(shuō)話人識(shí)別系統(tǒng)[A];現(xiàn)代通信理論與信號(hào)處理進(jìn)展——2003年通信理論與信號(hào)處理年會(huì)論文集[C];2003年
相關(guān)重要報(bào)紙文章 前2條
1 汪永安;科大訊飛說(shuō)話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年
2 吳長(zhǎng)鋒;科大訊飛勇奪說(shuō)話人識(shí)別國(guó)際大賽第一[N];科技日?qǐng)?bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 徐瓏婷;基于稀疏分解的說(shuō)話人識(shí)別技術(shù)研究[D];南京郵電大學(xué);2017年
2 陸偉;基于缺失特征的文本無(wú)關(guān)說(shuō)話人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年
3 俞一彪;基于互信息理論的說(shuō)話人識(shí)別研究[D];上海大學(xué);2004年
4 付中華;說(shuō)話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
5 侯麗敏;基于非線性理論和信息融合的說(shuō)話人識(shí)別[D];上海大學(xué);2005年
6 雷震春;支持向量機(jī)在說(shuō)話人識(shí)別中的應(yīng)用研究[D];浙江大學(xué);2006年
7 姚志強(qiáng);說(shuō)話人識(shí)別中提高GMM性能方法的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
8 包永強(qiáng);噪聲環(huán)境下說(shuō)話人識(shí)別的研究[D];東南大學(xué);2006年
9 林琳;基于模糊聚類與遺傳算法的說(shuō)話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年
10 解焱陸;基于特征變換和分類的文本無(wú)關(guān)電話語(yǔ)音說(shuō)話人識(shí)別研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 梅文星;說(shuō)話人識(shí)別中通用背景模型研究及深度學(xué)習(xí)初探[D];浙江大學(xué);2019年
2 樊云云;面向說(shuō)話人識(shí)別的深度學(xué)習(xí)方法研究[D];南昌航空大學(xué);2019年
3 楊志勇;基于模糊神經(jīng)網(wǎng)絡(luò)的說(shuō)話人識(shí)別方法研究[D];南昌航空大學(xué);2019年
4 韓旭;噪聲環(huán)境下基于RNN的說(shuō)話人識(shí)別方法研究[D];哈爾濱理工大學(xué);2019年
5 徐鈺婷;跨語(yǔ)言背景下基于單元音的說(shuō)話人識(shí)別研究[D];深圳大學(xué);2018年
6 陳莉芬;基于英語(yǔ)爆破音和摩擦音的跨語(yǔ)言說(shuō)話人識(shí)別研究[D];深圳大學(xué);2018年
7 易中曼;關(guān)于法庭說(shuō)話人識(shí)別的評(píng)估[D];西南政法大學(xué);2018年
8 郭慧陽(yáng);基于深度學(xué)習(xí)的說(shuō)話人識(shí)別技術(shù)研究[D];廈門大學(xué);2018年
9 楊楠;基于深度學(xué)習(xí)的說(shuō)話人識(shí)別研究與實(shí)現(xiàn)[D];鄭州大學(xué);2019年
10 方祥;基于多信息融合的說(shuō)話人識(shí)別[D];哈爾濱理工大學(xué);2018年
本文編號(hào):2594965
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2594965.html