基于特征流融合的帶噪語(yǔ)音檢測(cè)算法
發(fā)布時(shí)間:2021-05-16 21:12
針對(duì)語(yǔ)音通話中語(yǔ)音段的起始檢測(cè)性能不佳,檢測(cè)語(yǔ)音連續(xù)性結(jié)構(gòu)受到破壞的問(wèn)題,提出了一種基于特征流融合的帶噪語(yǔ)音檢測(cè)算法。首先,根據(jù)語(yǔ)音特性分別提取時(shí)域特征流、譜圖特征流和統(tǒng)計(jì)特征流;其次,利用不同的語(yǔ)音特征流分別對(duì)帶噪音頻中的語(yǔ)音段進(jìn)行概率估測(cè);最后,將各個(gè)特征流估測(cè)得到的語(yǔ)音估測(cè)概率進(jìn)行加權(quán)融合,并利用隱馬爾可夫模型對(duì)語(yǔ)音估測(cè)概率進(jìn)行短時(shí)狀態(tài)處理。通過(guò)對(duì)復(fù)合語(yǔ)音數(shù)據(jù)庫(kù)在多類型噪聲與不同信噪比條件下的性能測(cè)試表明,所提算法相對(duì)于基于貝葉斯與DNN分類器的基線模型相比,語(yǔ)音檢測(cè)正確率分別提高了21.26%與11.01%,顯著提高了目標(biāo)語(yǔ)音的質(zhì)量。
【文章來(lái)源】:通信學(xué)報(bào). 2020,41(04)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【參考文獻(xiàn)】:
期刊論文
[1]基于馬爾可夫的有限自動(dòng)機(jī)入侵容忍系統(tǒng)模型[J]. 羅智勇,楊旭,孫廣路,謝志強(qiáng),劉嘉輝. 通信學(xué)報(bào). 2019(10)
[2]Speech recognition algorithm based on neural network and hidden Markov model[J]. Zhao Jianhui,Gao Hongbo,Liu Yuchao,Cheng Bo. The Journal of China Universities of Posts and Telecommunications. 2018(04)
本文編號(hào):3190407
【文章來(lái)源】:通信學(xué)報(bào). 2020,41(04)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【參考文獻(xiàn)】:
期刊論文
[1]基于馬爾可夫的有限自動(dòng)機(jī)入侵容忍系統(tǒng)模型[J]. 羅智勇,楊旭,孫廣路,謝志強(qiáng),劉嘉輝. 通信學(xué)報(bào). 2019(10)
[2]Speech recognition algorithm based on neural network and hidden Markov model[J]. Zhao Jianhui,Gao Hongbo,Liu Yuchao,Cheng Bo. The Journal of China Universities of Posts and Telecommunications. 2018(04)
本文編號(hào):3190407
本文鏈接:http://sikaile.net/kejilunwen/wltx/3190407.html
最近更新
教材專著