基于波束形成與DNN的遠(yuǎn)距離語(yǔ)音識(shí)別方法研究
【圖文】:
圖 2.1 語(yǔ)音識(shí)別原理框圖Fig. 2.1 System diagram of speech recognition theory圖 2.1 中,信號(hào)處理模塊的功能是對(duì)采集到的音頻信號(hào)進(jìn)行預(yù)處理。具體包括采樣量化、預(yù)加重、分幀加窗、端點(diǎn)檢測(cè)等,由于遠(yuǎn)距離場(chǎng)景下采集到的語(yǔ)音信號(hào)會(huì)受到噪聲和混響的影響,因此還可以對(duì)其進(jìn)行初步降噪去混響處理。特征提取模塊的功能是對(duì)預(yù)處理后的信號(hào)提取能夠表征語(yǔ)音且易于訓(xùn)練的特征。常用特征包括線性預(yù)測(cè)倒譜系數(shù)(Linear Prediction Cepstral Coefficient,LPCC)、Mel 域倒譜系數(shù)(Mel Frequency CepstraCoefficient,MFCC)、Mel 濾波器組(Mel Filter Bank,,F(xiàn)bank)特征等。提取的特征向量送入到聲學(xué)模型進(jìn)行訓(xùn)練,常用的聲學(xué)模型有 DNN-HMM 聲學(xué)模型和端到端(End tEnd)聲學(xué)模型。訓(xùn)練好的模型結(jié)合語(yǔ)言模型和發(fā)音字典進(jìn)行解碼操作,從而得到最終的識(shí)別結(jié)果。從圖中也可以看到,特征提取模塊、聲學(xué)模型模塊和解碼模塊的性能均是影響語(yǔ)音識(shí)別結(jié)果的關(guān)鍵。2.2 麥克風(fēng)陣列目前,遠(yuǎn)距離場(chǎng)景下的語(yǔ)音識(shí)別仍然未實(shí)現(xiàn)令人滿意的識(shí)別結(jié)果。與單麥克風(fēng)相比
圖 2.2 麥克風(fēng)陣列示例圖Fig. 2.2 The schematic diagram of microphone array結(jié)構(gòu)各陣元擺放位置的差異,陣列拓?fù)浣Y(jié)構(gòu)主要立體陣。每一種陣列又可以進(jìn)一步分為兩;隨機(jī)間距。常見的拓?fù)浣Y(jié)構(gòu)一般為均勻陣勻球陣等,拓?fù)浣Y(jié)構(gòu)圖分別如圖 2.3(a)、(a)均勻線陣
【學(xué)位授予單位】:遼寧工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 楊勇;李勁松;孫明偉;;基于REMOS的遠(yuǎn)距離語(yǔ)音識(shí)別模型補(bǔ)償方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
2 MU PengCheng;LI Dan;YIN QinYe;GUO Wei;;Robust MVDR beamforming based on covariance matrix reconstruction[J];Science China(Information Sciences);2013年04期
相關(guān)博士學(xué)位論文 前1條
1 王冬霞;麥克風(fēng)陣列語(yǔ)音增強(qiáng)的若干方法研究[D];大連理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前6條
1 時(shí)雪煜;基于回歸神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別抗噪研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
2 李平;遠(yuǎn)距離混合語(yǔ)音識(shí)別方法的研究[D];遼寧工業(yè)大學(xué);2016年
3 王宜童;分布式陣列聲源定位方法的研究[D];遼寧工業(yè)大學(xué);2016年
4 王宏敏;麥克風(fēng)陣列語(yǔ)音增強(qiáng)及DSP實(shí)現(xiàn)[D];遼寧工業(yè)大學(xué);2015年
5 李理;基于HTK的麥克風(fēng)陣列語(yǔ)音識(shí)別方法的研究[D];遼寧工業(yè)大學(xué);2015年
6 周城旭;頻率不變波束形成的研究[D];遼寧工業(yè)大學(xué);2013年
本文編號(hào):2620878
本文鏈接:http://sikaile.net/kejilunwen/wltx/2620878.html