基于連續(xù)隱馬爾可夫模型的語音識別抗噪問題研究
發(fā)布時間:2021-06-16 19:47
隨著信息化時代的來臨,隱馬爾可夫模型(HMM)被廣泛應(yīng)用在語音識別領(lǐng)域,并已成為該領(lǐng)域最受關(guān)注最有效的建模方法之一。隨著人們對智能化要求越來越高,基于HMM的語音識別技術(shù)也在不斷改進(jìn),尤其在噪聲環(huán)境下,原識別系統(tǒng)與現(xiàn)實語音無法高度匹配,這使得系統(tǒng)識別率大幅降低。因此本文將基于HMM的連續(xù)情形(CHMM)下,研究語音識別系統(tǒng)的可靠性和抗噪能力。本文首先基于最大互信息(MMI)訓(xùn)練準(zhǔn)則對CHMM進(jìn)行改進(jìn),初步提高系統(tǒng)的識別率。之后在信號空間研究白噪聲背景下,提出基于線性預(yù)測隱馬爾可夫模型(LPHMM),利用Gaussian有色噪聲白化方法(GCNW)和最小均方誤差估計(MMSE)得到一種語音增強方法(LWM),比較其與經(jīng)典語音增強算法譜減法(SS)的抗噪效果;在特征空間,基于特征參數(shù)梅爾頻率倒譜系數(shù)(MFCC),通過加權(quán)對其實現(xiàn)優(yōu)化,結(jié)合時域特征短時能量(En)和短時平均過零率(ZCR)得到一種特征參數(shù)提取方法(MFFEZ);在模型空間,基于對加性噪聲和信道函數(shù)聯(lián)合補償?shù)哪P脱a償方法(MACA),結(jié)合MFFEZ特征提取,得到MFFEZ-MCAC模型,并比較噪聲環(huán)境下其與MACA模型的識別率...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別原理圖
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-7-中可知,預(yù)加重前后語音信號的高頻部分的幅頻有明顯提升。a)濾波器幅頻特性a)Filteramplitude-frequencycharacteristicsb)濾波器相頻特性b)Filterphasefrequencycharacteristics圖2-2數(shù)字濾波器特性Fig.2-2Digitalfiltercharacteristicsa)原始語音時域信號b)預(yù)加重后語音時域信號a)Originalvoicetimedomainsignalb)Speechtimedomainsignalafterpre-emphasis
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-10-112nmZsgnxmsgnxmnm其中,sgnx為符號函數(shù),其定義為1,01,0xnsgnxnxn由上述定義可知,過零率易受低頻影響,為解決這一問題,通過設(shè)置門限T,將過零率更改為跨過正負(fù)閾值,即1{|[][1]|2|[][1]}nmZsgnxmTsgnxmTsgnxmTsgnxmTnm雙門限端點檢測的基本思想:首先,將整個端點檢測分為四個部分:靜音部分、過渡部分、語音部分、結(jié)束。設(shè)置一個變量用于指示實驗期間的當(dāng)前狀態(tài)。默認(rèn)初始狀態(tài)為靜音部分,若能量或者過零率超過低閾值,則標(biāo)記進(jìn)入過渡部分。當(dāng)兩個參數(shù)值低于低閾值時,則認(rèn)為返回靜音部分,并且若過渡部分中兩個參數(shù)中任何一個大于高閾值,則認(rèn)為進(jìn)入語音部分。語音段中,當(dāng)參數(shù)均低于低閾值,并且計時長度小于最短時間門限,則認(rèn)為此段語音是噪音部分,繼續(xù)讀取,否則標(biāo)記終點。如圖2-4所示,此為一段數(shù)字“9”的語音信號,利用雙門限端點檢測算法檢測該段信號,其中紅色范圍內(nèi)為尋找的有效語音信號段。圖2-4能量和過零率端點檢測Fig.2-4Energyandzero-crossingrateendpointdetection
【參考文獻(xiàn)】:
期刊論文
[1]魯棒性語音識別技術(shù)研究綜述[J]. 黃志東. 信息通信. 2019(11)
[2]語音識別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的面罩語音識別[J]. 王霞,杜桂明,王光艷,張艷. 傳感器與微系統(tǒng). 2017(10)
[4]應(yīng)用于語種識別的加權(quán)音素對數(shù)似然比特征[J]. 張健,徐杰,包秀國,周若華,顏永紅. 清華大學(xué)學(xué)報(自然科學(xué)版). 2017(10)
[5]基于時頻特征的光纖周界入侵振動信號識別與定位[J]. 朱程輝,王建平,李奇越,左冬森,李帷韜. 中國激光. 2016(06)
[6]噪聲魯棒語音識別研究綜述[J]. 雷建軍,楊震,劉剛,郭軍. 計算機(jī)應(yīng)用研究. 2009(04)
[7]一種對加性噪聲和信道函數(shù)聯(lián)合補償?shù)哪P凸烙嫹椒╗J]. 王智國,吳及,戴禮榮,王仁華. 聲學(xué)學(xué)報(中文版). 2008(03)
[8]基于最大互信息的連續(xù)型隱馬爾可夫模型參數(shù)訓(xùn)練方法[J]. 陳文鋒,李兵,武海鋒. 云南大學(xué)學(xué)報(自然科學(xué)版). 2006(S1)
[9]連續(xù)隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)在說話人識別中的比較[J]. 周茉,劉蓉,陳琦. 計算機(jī)與數(shù)字工程. 2006(09)
[10]基于段長分布的HMM語音識別模型[J]. 王作英,肖熙. 電子學(xué)報. 2004(01)
博士論文
[1]抗噪聲語音識別新技術(shù)的研究[D]. 寧更新.華南理工大學(xué) 2006
碩士論文
[1]語音識別抗噪算法的研究[D]. 肖勇.中南大學(xué) 2009
本文編號:3233680
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別原理圖
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-7-中可知,預(yù)加重前后語音信號的高頻部分的幅頻有明顯提升。a)濾波器幅頻特性a)Filteramplitude-frequencycharacteristicsb)濾波器相頻特性b)Filterphasefrequencycharacteristics圖2-2數(shù)字濾波器特性Fig.2-2Digitalfiltercharacteristicsa)原始語音時域信號b)預(yù)加重后語音時域信號a)Originalvoicetimedomainsignalb)Speechtimedomainsignalafterpre-emphasis
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-10-112nmZsgnxmsgnxmnm其中,sgnx為符號函數(shù),其定義為1,01,0xnsgnxnxn由上述定義可知,過零率易受低頻影響,為解決這一問題,通過設(shè)置門限T,將過零率更改為跨過正負(fù)閾值,即1{|[][1]|2|[][1]}nmZsgnxmTsgnxmTsgnxmTsgnxmTnm雙門限端點檢測的基本思想:首先,將整個端點檢測分為四個部分:靜音部分、過渡部分、語音部分、結(jié)束。設(shè)置一個變量用于指示實驗期間的當(dāng)前狀態(tài)。默認(rèn)初始狀態(tài)為靜音部分,若能量或者過零率超過低閾值,則標(biāo)記進(jìn)入過渡部分。當(dāng)兩個參數(shù)值低于低閾值時,則認(rèn)為返回靜音部分,并且若過渡部分中兩個參數(shù)中任何一個大于高閾值,則認(rèn)為進(jìn)入語音部分。語音段中,當(dāng)參數(shù)均低于低閾值,并且計時長度小于最短時間門限,則認(rèn)為此段語音是噪音部分,繼續(xù)讀取,否則標(biāo)記終點。如圖2-4所示,此為一段數(shù)字“9”的語音信號,利用雙門限端點檢測算法檢測該段信號,其中紅色范圍內(nèi)為尋找的有效語音信號段。圖2-4能量和過零率端點檢測Fig.2-4Energyandzero-crossingrateendpointdetection
【參考文獻(xiàn)】:
期刊論文
[1]魯棒性語音識別技術(shù)研究綜述[J]. 黃志東. 信息通信. 2019(11)
[2]語音識別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的面罩語音識別[J]. 王霞,杜桂明,王光艷,張艷. 傳感器與微系統(tǒng). 2017(10)
[4]應(yīng)用于語種識別的加權(quán)音素對數(shù)似然比特征[J]. 張健,徐杰,包秀國,周若華,顏永紅. 清華大學(xué)學(xué)報(自然科學(xué)版). 2017(10)
[5]基于時頻特征的光纖周界入侵振動信號識別與定位[J]. 朱程輝,王建平,李奇越,左冬森,李帷韜. 中國激光. 2016(06)
[6]噪聲魯棒語音識別研究綜述[J]. 雷建軍,楊震,劉剛,郭軍. 計算機(jī)應(yīng)用研究. 2009(04)
[7]一種對加性噪聲和信道函數(shù)聯(lián)合補償?shù)哪P凸烙嫹椒╗J]. 王智國,吳及,戴禮榮,王仁華. 聲學(xué)學(xué)報(中文版). 2008(03)
[8]基于最大互信息的連續(xù)型隱馬爾可夫模型參數(shù)訓(xùn)練方法[J]. 陳文鋒,李兵,武海鋒. 云南大學(xué)學(xué)報(自然科學(xué)版). 2006(S1)
[9]連續(xù)隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)在說話人識別中的比較[J]. 周茉,劉蓉,陳琦. 計算機(jī)與數(shù)字工程. 2006(09)
[10]基于段長分布的HMM語音識別模型[J]. 王作英,肖熙. 電子學(xué)報. 2004(01)
博士論文
[1]抗噪聲語音識別新技術(shù)的研究[D]. 寧更新.華南理工大學(xué) 2006
碩士論文
[1]語音識別抗噪算法的研究[D]. 肖勇.中南大學(xué) 2009
本文編號:3233680
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3233680.html
最近更新
教材專著