基于閾值的英語語音自動識別系統(tǒng)研究
發(fā)布時間:2021-03-25 03:44
語音識別系統(tǒng)的關(guān)鍵在于噪聲的處理,主要包含兩個階段,即基于閾值的噪聲檢測和降噪處理,主要用于英語等語言的自動識別處理。在噪聲檢測階段,系統(tǒng)基于所收集的語音的信噪比(SNR)值自動確定何時提高語音質(zhì)量;在降噪處理階段,采用獨立分量分析(ICA)和子空間語音增強(SSE)來降低噪聲。通過實驗證明增強語音的SNR值超過接收到的噪聲語音的SNR值約20dB至25dB,降噪程序?qū)⒄Z音識別率提高了約15%至25%,因此該系統(tǒng)能夠降低噪聲對多種噪聲環(huán)境的影響,提高語音質(zhì)量,達(dá)到英語語音識別的目的。
【文章來源】:微型電腦應(yīng)用. 2020,36(08)
【文章頁數(shù)】:3 頁
【部分圖文】:
基于閾值的噪聲檢測的過程圖
為了驗證所提算法的有效性,采用16-DOF RobotinnoTM的人形機器人。對于線性陣列,在人形機器人的肩部上放置兩個間隔為0.1m的全向麥克風(fēng),測試環(huán)境的布局圖,如圖2所示。實驗室的長度和寬度分別為7米和6米;線性陣列以8 kHz的采樣率收集測試語音信號;從機器人到揚聲器的距離為1.5米,從機器人到噪聲源的距離為2米。SNR閾值ε設(shè)置為10。在實驗中,三個測試方向(30°,60°和90°)用于收集語音信號,三個方向(45°,90°和135°)用于記錄噪聲信號。
有噪聲語音的語音識別率,如圖3所示。與文獻(xiàn)[6-7]的研究方法與所提出的基于HMM的系統(tǒng)進(jìn)行比較。在實驗中檢查了具有0 dB,5 dB和10 dB的有噪聲語音的三個SNR值。 結(jié)果表明,該方法可以比噪聲語音提高識別率約15%至25%,證明所提出的采用組合噪聲分離和語音增強方法的系統(tǒng)可以有效地去除多種類型的噪聲,提高語音識別過程的語音質(zhì)量。
本文編號:3098956
【文章來源】:微型電腦應(yīng)用. 2020,36(08)
【文章頁數(shù)】:3 頁
【部分圖文】:
基于閾值的噪聲檢測的過程圖
為了驗證所提算法的有效性,采用16-DOF RobotinnoTM的人形機器人。對于線性陣列,在人形機器人的肩部上放置兩個間隔為0.1m的全向麥克風(fēng),測試環(huán)境的布局圖,如圖2所示。實驗室的長度和寬度分別為7米和6米;線性陣列以8 kHz的采樣率收集測試語音信號;從機器人到揚聲器的距離為1.5米,從機器人到噪聲源的距離為2米。SNR閾值ε設(shè)置為10。在實驗中,三個測試方向(30°,60°和90°)用于收集語音信號,三個方向(45°,90°和135°)用于記錄噪聲信號。
有噪聲語音的語音識別率,如圖3所示。與文獻(xiàn)[6-7]的研究方法與所提出的基于HMM的系統(tǒng)進(jìn)行比較。在實驗中檢查了具有0 dB,5 dB和10 dB的有噪聲語音的三個SNR值。 結(jié)果表明,該方法可以比噪聲語音提高識別率約15%至25%,證明所提出的采用組合噪聲分離和語音增強方法的系統(tǒng)可以有效地去除多種類型的噪聲,提高語音識別過程的語音質(zhì)量。
本文編號:3098956
本文鏈接:http://sikaile.net/kejilunwen/wltx/3098956.html
最近更新
教材專著