噪聲環(huán)境下的魯棒語音識(shí)別技術(shù)研究
本文關(guān)鍵詞:噪聲環(huán)境下的魯棒語音識(shí)別技術(shù)研究
更多相關(guān)文章: 魯棒語音識(shí)別 高斯牛頓法 VTS補(bǔ)償 非線性補(bǔ)償 自適應(yīng)訓(xùn)練
【摘要】:隨著科技的發(fā)展和計(jì)算機(jī)的普及,各種智能化產(chǎn)品開始逐漸深入人們的生活,如智能手機(jī)、智能家居等產(chǎn)品。智能市場的崛起,使得人們對(duì)人機(jī)交流方式有了更高的要求,這無疑促進(jìn)了語音識(shí)別技術(shù)的發(fā)展,使之成為自然語言處理領(lǐng)域中的一個(gè)重要研究方向。目前的語音識(shí)別系統(tǒng)對(duì)實(shí)驗(yàn)室語音可以達(dá)到非常高的識(shí)別精度,但由于噪聲的存在使得系統(tǒng)應(yīng)用到現(xiàn)實(shí)環(huán)境中后很難與混入噪聲的測試語音匹配,導(dǎo)致系統(tǒng)的識(shí)別性能變差。魯棒語音識(shí)別的目標(biāo)就是使系統(tǒng)在不同的環(huán)境中保證穩(wěn)定的識(shí)別率。常用的非線性補(bǔ)償模型有矢量泰勒級(jí)數(shù)(Vector Taylor Series,VTS)、基于數(shù)據(jù)驅(qū)動(dòng)的并行模型合并(Data Driven Parallel Model Combination,DPMC)以及UT(Unscented Transformation)變換補(bǔ)償?shù)。本論文選用VTS方法從特征補(bǔ)償和模型補(bǔ)償兩個(gè)方面探討了噪聲環(huán)境下的魯棒語音識(shí)別技術(shù)。論文研究了信號(hào)空間的語音增強(qiáng)算法,進(jìn)而研究了在特征空間用VTS結(jié)合EM噪聲估計(jì)進(jìn)行特征補(bǔ)償?shù)姆椒▉硖岣咦R(shí)別系統(tǒng)的環(huán)境適應(yīng)性。如果特征補(bǔ)償后的語音特征中含有噪聲,這些噪聲會(huì)向后傳遞并在系統(tǒng)后端累積,且更改模型參數(shù)相對(duì)更易實(shí)現(xiàn),因此論文又研究了模型空間的VTS補(bǔ)償和基于高斯牛頓(Gauss-Newton,GN)的噪聲估計(jì)方法。實(shí)驗(yàn)數(shù)據(jù)顯示模型空間進(jìn)行模型補(bǔ)償對(duì)系統(tǒng)的抗噪性能改善效果比特征空間明顯。高斯牛頓法能夠得到更精確的噪聲參數(shù)估計(jì)和更高的收斂率,在模型參數(shù)訓(xùn)練過程中系統(tǒng)的迭代次數(shù)要少于基于EM噪聲估計(jì)的VTS補(bǔ)償算法,能夠有效節(jié)省系統(tǒng)的計(jì)算量,同時(shí)比改進(jìn)前系統(tǒng)誤識(shí)率平均下降了0.53%-2.34%。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 賀無名;;語音識(shí)別技術(shù)及其研究進(jìn)展[J];中國科技信息;2006年18期
2 黃昆;;嵌入式,語音識(shí)別技術(shù)新趨向[J];中國計(jì)算機(jī)用戶;2006年45期
3 高新濤;陳乖麗;;語音識(shí)別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J];甘肅科技縱橫;2007年04期
4 李曉延;;語音識(shí)別技術(shù)更上層樓[J];今日電子;2011年11期
5 劉東輝;;語音識(shí)別技術(shù)探析[J];信息與電腦(理論版);2012年06期
6 周英;;關(guān)于語音識(shí)別技術(shù)發(fā)展趨勢的分析[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年19期
7 郭洪榮;;計(jì)算機(jī)語音識(shí)別技術(shù)的應(yīng)用分析[J];黑龍江科技信息;2012年31期
8 周曉林,劉德斌,劉林;語音識(shí)別技術(shù)在吉林省電網(wǎng)調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用[J];東北電力技術(shù);1994年08期
9 楊變英;語音識(shí)別技術(shù)在汽車上的應(yīng)用[J];世界產(chǎn)品與技術(shù);1998年02期
10 李旭澤;;試論語音識(shí)別技術(shù)的研究與發(fā)展[J];青春歲月;2012年02期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 蔡偉建;;人工神經(jīng)網(wǎng)絡(luò)理論在語音識(shí)別技術(shù)中的應(yīng)用[A];第八屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2010年
2 張化云;韓兆兵;徐波;;語音服務(wù)器中的語音識(shí)別技術(shù)[A];開創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2001年
3 方棣棠;李樹青;;語音識(shí)別技術(shù)突破之路——如何使語音識(shí)別技術(shù)走向?qū)嵱肹A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
4 賈磊;;深度神經(jīng)網(wǎng)絡(luò)建模的最新工業(yè)進(jìn)展和結(jié)合語義理解的語音識(shí)別技術(shù)[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
5 趙美澤;王峰;;基于消除混響的語音識(shí)別技術(shù)研究[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國青年通信學(xué)術(shù)會(huì)議論文集(下)[C];2008年
6 蔡志博;俞鐵城;;語音識(shí)別技術(shù)的應(yīng)用[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
7 呂成國;趙冰;;低信噪比下語音識(shí)別技術(shù)的研究[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的語音識(shí)別技術(shù)研究[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
9 黃媛;俞舸;呂士楠;;車載識(shí)別庫的設(shè)計(jì)和制作[A];中國聲學(xué)學(xué)會(huì)2006年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年
10 張茹;韓紀(jì)慶;;基于DTW算法的自動(dòng)發(fā)音錯(cuò)誤檢測[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 陳琳;語音識(shí)別技術(shù)升級(jí),,人機(jī)對(duì)話時(shí)代來臨[N];第一財(cái)經(jīng)日?qǐng)?bào);2007年
2 京晨;中科院最新語音識(shí)別技術(shù)面世[N];福建科技報(bào);2002年
3 IBM中國研究中心 沈麗琴博士;語音識(shí)別技術(shù)離我們有多遠(yuǎn)[N];光明日?qǐng)?bào);2000年
4 ;語音識(shí)別技術(shù)前景誘人[N];人民郵電;2001年
5 ;用語言“改變”世界[N];計(jì)算機(jī)世界;2001年
6 英國《經(jīng)濟(jì)學(xué)人》;有錯(cuò)請(qǐng)糾正:語音識(shí)別技術(shù)新進(jìn)展[N];世界報(bào);2010年
7 ;精彩演繹語音識(shí)別技術(shù)[N];人民郵電;2001年
8 記者 王雙;我市參加第九屆“高交會(huì)”收獲成果[N];盤錦日?qǐng)?bào);2007年
9 記者 薛冬;中文語音識(shí)別技術(shù)取得突破[N];光明日?qǐng)?bào);2002年
10 王朝選;科大訊飛語音識(shí)別技術(shù)取得重大進(jìn)展[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語音識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 張軍;抗噪聲語音識(shí)別技術(shù)的研究[D];華南理工大學(xué);2003年
3 董婧;魯棒語音識(shí)別技術(shù)的研究[D];吉林大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張朝陽;語音識(shí)別技術(shù)在盲用導(dǎo)航系統(tǒng)中的應(yīng)用[D];北方工業(yè)大學(xué);2011年
2 羅云;語音識(shí)別技術(shù)在超聲波系統(tǒng)中的應(yīng)用[D];四川大學(xué);2005年
3 洪祥元;基于語音識(shí)別技術(shù)的智能地球儀系統(tǒng)設(shè)計(jì)[D];北京交通大學(xué);2012年
4 陳一寧;英語口語學(xué)習(xí)中的語音識(shí)別技術(shù)[D];上海交通大學(xué);2010年
5 李晨;結(jié)合語音識(shí)別技術(shù)的音樂哼唱檢索研究[D];西北大學(xué);2008年
6 燕濤;基于嵌入式語音識(shí)別技術(shù)的研究[D];大慶石油學(xué)院;2009年
7 涂惠燕;移動(dòng)設(shè)備平臺(tái)上英語口語學(xué)習(xí)中的語音識(shí)別技術(shù)[D];上海交通大學(xué);2011年
8 朱莉明;基于可穿戴計(jì)算平臺(tái)的語音識(shí)別技術(shù)的研究[D];西北大學(xué);2007年
9 王秀景;語音識(shí)別技術(shù)研究與實(shí)現(xiàn)[D];山東科技大學(xué);2011年
10 付大麗;語音識(shí)別技術(shù)在醫(yī)用配伍表中的應(yīng)用研究[D];西安工程大學(xué);2013年
本文編號(hào):1196311
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1196311.html