噪聲下的語音識(shí)別算法研究
發(fā)布時(shí)間:2020-06-26 02:06
【摘要】:隨著科學(xué)的進(jìn)步和技術(shù)的發(fā)展,語音識(shí)別算法和相應(yīng)的識(shí)別系統(tǒng)已經(jīng)相當(dāng)成熟。動(dòng)態(tài)時(shí)間規(guī)整算法(DTW)、矢量量化算法(VQ)、隱馬爾可夫模型(HMM)以及人工神經(jīng)網(wǎng)絡(luò)(ANN)等算法,使得語音識(shí)別無論是識(shí)別率還是識(shí)別效率上都有較大的提升。目前,在實(shí)驗(yàn)室環(huán)境下,語音識(shí)別系統(tǒng)對(duì)純凈語音的識(shí)別率能夠達(dá)到95%以上,具有一個(gè)非常高的識(shí)別精度。但是復(fù)雜噪聲環(huán)境中,具有各種來源的噪聲。在這樣的噪聲環(huán)境下,語音識(shí)別系統(tǒng)的識(shí)別率會(huì)受到很大的影響,由于訓(xùn)練樣本與樣本庫特征的失配,使得系統(tǒng)的識(shí)別性能急劇下降。因此,若要將語音識(shí)別系統(tǒng)進(jìn)行有效的實(shí)際應(yīng)用,如何設(shè)計(jì)出抗噪聲的識(shí)別將是目前真正需要解決的問題。本文首先從近幾十年的語音識(shí)別的發(fā)展出發(fā),介紹了語音識(shí)別系統(tǒng)的基本概念以及整體結(jié)構(gòu),包括對(duì)語音信號(hào)進(jìn)行采樣,語音分離去噪,預(yù)加重,分幀加窗,進(jìn)行端點(diǎn)檢測(cè)等過程進(jìn)行了介紹,并詳細(xì)對(duì)端點(diǎn)檢測(cè)的兩種方法進(jìn)行分析說明。之后對(duì)車載語音識(shí)別系統(tǒng)進(jìn)行了介紹,并結(jié)合相關(guān)需求,引入戰(zhàn)場(chǎng)指揮車車載語音識(shí)別系統(tǒng)的概念,通過公交車環(huán)境對(duì)戰(zhàn)場(chǎng)指揮車進(jìn)行模擬,驗(yàn)證去噪算法的性能。然后本文介紹了車載語音識(shí)別系統(tǒng)所面對(duì)的汽車噪聲,從噪聲來源和噪聲頻譜特性對(duì)汽車噪聲進(jìn)行分析。接著從去噪技術(shù)入手,研究在噪聲存在的情況下語音信號(hào)分離方法。重點(diǎn)介紹了基于盲信號(hào)分離和禁忌搜索算法的去噪聲技術(shù),將盲信號(hào)分離技術(shù)用于車載復(fù)雜噪聲環(huán)境下的去噪,通過測(cè)試波形分離,驗(yàn)證在復(fù)雜環(huán)境下的盲信號(hào)分離性能。接下來本文介紹語音信號(hào)的特征參數(shù)的提取。對(duì)比LPC系數(shù)、LPCC系數(shù)以及MFCC系數(shù),并在最后的實(shí)驗(yàn)中進(jìn)行對(duì)比選擇。在進(jìn)行特征參數(shù)提取后,本文又對(duì)矢量量化技術(shù)進(jìn)行介紹,重點(diǎn)介紹設(shè)計(jì)碼本的LBG算法。此外,本文還對(duì)基于HMM的語音識(shí)別技術(shù)進(jìn)行了研究。包括對(duì)HMM模型概念的介紹,HMM在語音識(shí)別系統(tǒng)中存在的三個(gè)問題。并從問題出發(fā),通過對(duì)這三個(gè)問題的解決來建立基于HMM的語音識(shí)別系統(tǒng)。在此基礎(chǔ)上,提出多段式HMM算法,將原有的語音識(shí)別系統(tǒng)進(jìn)行改進(jìn)。最后,為了驗(yàn)證去噪算法以及多段式HMM語音識(shí)別系統(tǒng)的性能,設(shè)計(jì)了一系列的實(shí)驗(yàn)。首先選取四個(gè)小型的語音庫在四種不同的環(huán)境下進(jìn)行識(shí)別系統(tǒng)的性能測(cè)試,包括特征參數(shù)的選取、碼本容量和HMM狀態(tài)數(shù)的確定,以及在不同環(huán)境中受到的環(huán)境噪聲影響的大小等。之后,為了驗(yàn)證去噪算法的性能,設(shè)計(jì)了在四種具有不同種類噪聲的環(huán)境下進(jìn)行的識(shí)別率和識(shí)別時(shí)間的對(duì)比實(shí)驗(yàn)。在不同的環(huán)境中,使用動(dòng)態(tài)時(shí)間規(guī)整算法、基于小波變換的語音增強(qiáng)算法以及本文所采用的基于盲信號(hào)分離的多段式HMM識(shí)別算法,分別獲取這三種算法的識(shí)別率以及識(shí)別時(shí)間。通過這兩個(gè)最直觀的數(shù)據(jù)來對(duì)算法性能進(jìn)行驗(yàn)證。
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TN912.34
【圖文】:
圖1-1典型語音識(shí)別系統(tǒng)基本框架圖逡逑語音識(shí)別系統(tǒng)實(shí)際是模式識(shí)別學(xué)科在實(shí)際中的應(yīng)用口]。首先,W人類語音特逡逑點(diǎn)為基礎(chǔ),計(jì)算機(jī)建立相應(yīng)的語音模型。通過分析輸入語音信號(hào),提取信號(hào)中的逡逑語音特征,建立語音識(shí)別系統(tǒng)中所需的模板庫。當(dāng)有待識(shí)別語音輸入到識(shí)別系統(tǒng)逡逑中,計(jì)算機(jī)同樣對(duì)該語音信號(hào)進(jìn)行特征提取,并通過某種搜索和匹配算法,將該逡逑特征與在計(jì)算機(jī)中存儲(chǔ)的模板進(jìn)行匹配,從而尋找出與輸入信號(hào)特征匹配的基本逡逑識(shí)別結(jié)果,再經(jīng)過后處理之后,計(jì)算機(jī)會(huì)給出最終的識(shí)別結(jié)果。在整個(gè)識(shí)別系統(tǒng)逡逑中,影響識(shí)別率的關(guān)鍵就在于特征的選擇、模板庫的優(yōu)劣化及匹配算法的性能[6]。逡逑1.1.2語音識(shí)別技術(shù)的應(yīng)用逡逑目前,語音識(shí)別系統(tǒng)的應(yīng)用范圍相當(dāng)廣泛,如信息查詢、服務(wù)系統(tǒng)、汽車導(dǎo)逡逑航設(shè)備、智能語音翻譯、工業(yè)控制系統(tǒng)等[7]。在這些領(lǐng)域中,操作人員往往因?yàn)殄义鲜直徽加,或者不存在鍵盤輸入條件,無法用傳統(tǒng)的方式進(jìn)行正常的人機(jī)交互。逡逑此時(shí),要想增加控制操作,應(yīng)該X椉有碌氖褂玫慕換シ絞健@糜鏌舳曰鞣⒊鰣義
本文編號(hào):2729664
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TN912.34
【圖文】:
圖1-1典型語音識(shí)別系統(tǒng)基本框架圖逡逑語音識(shí)別系統(tǒng)實(shí)際是模式識(shí)別學(xué)科在實(shí)際中的應(yīng)用口]。首先,W人類語音特逡逑點(diǎn)為基礎(chǔ),計(jì)算機(jī)建立相應(yīng)的語音模型。通過分析輸入語音信號(hào),提取信號(hào)中的逡逑語音特征,建立語音識(shí)別系統(tǒng)中所需的模板庫。當(dāng)有待識(shí)別語音輸入到識(shí)別系統(tǒng)逡逑中,計(jì)算機(jī)同樣對(duì)該語音信號(hào)進(jìn)行特征提取,并通過某種搜索和匹配算法,將該逡逑特征與在計(jì)算機(jī)中存儲(chǔ)的模板進(jìn)行匹配,從而尋找出與輸入信號(hào)特征匹配的基本逡逑識(shí)別結(jié)果,再經(jīng)過后處理之后,計(jì)算機(jī)會(huì)給出最終的識(shí)別結(jié)果。在整個(gè)識(shí)別系統(tǒng)逡逑中,影響識(shí)別率的關(guān)鍵就在于特征的選擇、模板庫的優(yōu)劣化及匹配算法的性能[6]。逡逑1.1.2語音識(shí)別技術(shù)的應(yīng)用逡逑目前,語音識(shí)別系統(tǒng)的應(yīng)用范圍相當(dāng)廣泛,如信息查詢、服務(wù)系統(tǒng)、汽車導(dǎo)逡逑航設(shè)備、智能語音翻譯、工業(yè)控制系統(tǒng)等[7]。在這些領(lǐng)域中,操作人員往往因?yàn)殄义鲜直徽加,或者不存在鍵盤輸入條件,無法用傳統(tǒng)的方式進(jìn)行正常的人機(jī)交互。逡逑此時(shí),要想增加控制操作,應(yīng)該X椉有碌氖褂玫慕換シ絞健@糜鏌舳曰鞣⒊鰣義
本文編號(hào):2729664
本文鏈接:http://sikaile.net/kejilunwen/wltx/2729664.html
最近更新
教材專著