天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向藏語拉薩話語音識別的語音增強(qiáng)方法研究

發(fā)布時(shí)間:2021-08-04 02:45
  語音增強(qiáng)是針對語音傳遞中經(jīng)常遇到的噪音干擾的問題而設(shè)計(jì)的一種噪音削弱、語音強(qiáng)化的方法。而在語音識別的時(shí)候總會有各種或多或少的背景噪音夾雜在語音中。那么語音增強(qiáng)就可以有效的降低背景噪音、強(qiáng)化語音、提升語音識別的效果。本文選題來源于國家自然科學(xué)基金項(xiàng)目多民族語言語音識別。該項(xiàng)課題實(shí)施中需要解決語音識的噪音問題,故就有了本論文的研究的目的。本文選題的目和意義是解決帶噪語音識別困難,改善聽取語音質(zhì)量。研究更有效的區(qū)分噪音和藏語拉薩話的增強(qiáng)系統(tǒng),提升識別的準(zhǔn)確率。本文展開了以下的工作:著重探討和分析了語音增強(qiáng)的技術(shù)和藏語語音處理的方法。概述了藏語發(fā)音特點(diǎn)和藏語語音學(xué)相關(guān)知識,在語音預(yù)處理和語音數(shù)字信號處理知識進(jìn)行了概要介紹。對于語音增強(qiáng)語料的標(biāo)準(zhǔn)和采集相關(guān)流程采用了標(biāo)準(zhǔn)的方法,介紹了如何完成了實(shí)驗(yàn)語料的采集和制作,測試語料的制作和測試。本文實(shí)驗(yàn)選擇了傳統(tǒng)單通道語音增方法并對該方法進(jìn)行研究。傳統(tǒng)語音增強(qiáng)方法中研究了幾類具有代表性的方法,并進(jìn)一步探討了傳統(tǒng)語音增強(qiáng)算法的基本原理。分析了各種方法下的語音增強(qiáng)系統(tǒng)的框圖,對于各種傳統(tǒng)單通道語音增強(qiáng)的技術(shù)路線進(jìn)行了分析,研究了實(shí)驗(yàn)結(jié)果。同時(shí)本文著重探討和分... 

【文章來源】:西北民族大學(xué)甘肅省

【文章頁數(shù)】:62 頁

【學(xué)位級別】:碩士

【部分圖文】:

面向藏語拉薩話語音識別的語音增強(qiáng)方法研究


自適應(yīng)濾波系統(tǒng)流程圖

系統(tǒng)流程圖,譜減法,系統(tǒng)流程圖


西北民族大學(xué)碩士學(xué)位論文20圖4-2 譜減法系統(tǒng)流程圖譜減法增強(qiáng)系統(tǒng)方法步驟1)對y(t)進(jìn)行短時(shí)傅立葉變換求得Y(w)2)通過無話段語音幀長NI,估計(jì)噪音功率譜 2 D( )對噪聲進(jìn)行估計(jì)、提取噪聲功率譜3)語音功率譜和噪音功率譜相減。4)估計(jì)的幅度乘以相位信號。| ( )|*yX w ( )5)逆傅立葉變換得到了估計(jì)的語音 x ( t)通過以上的方法就可以得到增強(qiáng)后的語音,該方法的數(shù)據(jù)我們將在第五章稍后討論。4.4 維納濾波語音增強(qiáng)維納濾波法的思路是:對于帶噪語音信號,確定濾波器的沖擊響應(yīng)和傳遞函數(shù)的特點(diǎn),使得帶噪語音信號經(jīng)過該濾波器后得到最接近于增強(qiáng)后的的語音信號。采用維納濾波的好處是增強(qiáng)后的殘留噪聲類似于白噪聲,而不是有節(jié)奏起伏的音樂噪聲。維納濾波是平穩(wěn)條件下時(shí)域波形的最小均方誤差準(zhǔn)則估計(jì)[17]。由于沒有考慮到語音頻譜分量的幅度對人的聽覺最重要,因此采用維納濾波來增強(qiáng)語音存在一定的缺陷。維納濾波器的方法對信號的復(fù)頻譜生成的一個(gè)線性估計(jì)器,在(復(fù)頻譜)噪聲和語音的 DFT 系數(shù)為獨(dú)立高斯隨機(jī)變量的條件下,該估計(jì)值從最小均方誤差意義上看為最優(yōu)。4.4.1 維納濾波原理輸入信號通過一個(gè)線性時(shí)不限系統(tǒng)之后產(chǎn)生一個(gè)輸出信號 y ( n )。使輸出信號 d*(n)盡量逼近期望信號 d(n) 。這可以通過計(jì)算估計(jì)誤差 e(n),使其最小化來實(shí)

系統(tǒng)流程圖,維納濾波,系統(tǒng)流程圖,幅度譜


2) 在對加窗分幀后進(jìn)行快速傅立葉變換,分別求出幅度譜、相位譜,并將其保存下來3) 使用帶噪語音初始的無話段語音幀 NI,估計(jì)出噪音平均功率譜和平均幅度譜。4) 使用 VAD 檢測算法分析帶噪語音幀的無話段語音幀,利用幀實(shí)時(shí)更新噪音的平均功率譜或者幅度譜。5) 先計(jì)算有話段幀的后驗(yàn)信噪比概率、再(4.27)估計(jì)出語音幀幀的先驗(yàn)信噪比、進(jìn)一步就求解出了帶噪語音幀下的維納濾波器的傳遞函數(shù)。6) 求解出語音幀的濾波器的輸出的幅度譜。7) 將輸出的幅度譜和語音的相位譜結(jié)合,并進(jìn)行傅立葉逆變換、再將語音還原到時(shí)域階段,到還原階段將增強(qiáng)好的語音幀拼接起來,得到增強(qiáng)后的語音信號。具體的系統(tǒng)框圖如下。

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)譜減法的語音增強(qiáng)研究[J]. 劉志坤,唐小明,朱洪偉.  計(jì)算機(jī)仿真. 2009(06)
[2]藏語文-音自動規(guī)則轉(zhuǎn)換及其實(shí)現(xiàn)[J]. 李永宏,孔江平,于洪志.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
[3]西藏古代的文法研究[J]. 周煒.  西南民族學(xué)院學(xué)報(bào)(哲學(xué)社會科學(xué)版). 1999(04)

碩士論文
[1]語音識別技術(shù)在人機(jī)交互中的應(yīng)用研究[D]. 高雪.北方工業(yè)大學(xué) 2017
[2]基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究[D]. 魏泉水.南京大學(xué) 2016
[3]基于深度學(xué)習(xí)與并行計(jì)算的語音增強(qiáng)系統(tǒng)[D]. 石博天.內(nèi)蒙古大學(xué) 2016
[4]基于GPU的深度神經(jīng)網(wǎng)絡(luò)模型并行及優(yōu)化方法研究[D]. 張函.華中科技大學(xué) 2016
[5]藏語語音識別技術(shù)研究[D]. 拉龍東智.西藏大學(xué) 2015
[6]西安方言的聲學(xué)特征分析和韻律建模的研究[D]. 郭威彤.西北師范大學(xué) 2009
[7]LMS算法的改進(jìn)研究及其在語音增強(qiáng)方面的應(yīng)用和性能評估[D]. 樊殊昱.電子科技大學(xué) 2007
[8]基于小波變換的語音信號增強(qiáng)方法研究[D]. 黃蘇雨.南昌大學(xué) 2007



本文編號:3320842

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/3320842.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f6f6c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com