復(fù)雜聲學(xué)場景下魯棒性語音識別研究
發(fā)布時間:2021-08-12 08:16
自古以來,語音作為人類生活中最常用的溝通方式,大家通過各自獨特的語言直抒胸臆,表達(dá)訴求,傳承文明。因此,語音對人類文明的發(fā)展與社會進(jìn)步有著至關(guān)重要的作用。在人工智能技術(shù)中,語音識別技術(shù)就是將人類的語言信息轉(zhuǎn)變?yōu)闄C(jī)器能夠理解的文本信息,最終實現(xiàn)人類與機(jī)器的交互,使機(jī)器做出正確的反饋。語音識別技術(shù)是自然人機(jī)交互的重要橋梁,能夠大力地促進(jìn)人工智能的發(fā)展。但是,現(xiàn)實生活中,不管是機(jī)器還是人類接受到的語音信號都是通過空氣等媒介才能間接地傳遞過來,因此,這些聲波信號極易受到各種噪聲干擾以及不同環(huán)境存在的回聲、混響等影響導(dǎo)致失真,甚在在更復(fù)雜的聲學(xué)場景下,還會把目標(biāo)語音完全掩蓋,這就對我們的語音識別系統(tǒng)在真實場景中的應(yīng)用提出了巨大的挑戰(zhàn)。本文首先將語音識別的前端與后端相結(jié)合,通過語音分離和降噪等增強(qiáng)算法對其展開研究。除此之外,語音識別在現(xiàn)實復(fù)雜場景下的魯棒性問題,還需要考慮說話人本身的多變性因素,比如語速的快慢等。因此我們還開始了針對語速變化場景的魯棒性研究。論文的主要工作如下:(1)語音識別基線系統(tǒng)搭建。針對復(fù)雜聲學(xué)場景的語音識別魯棒性問題,本文在國際魯棒性語音識別評測任務(wù)CHi ME-5上進(jìn)行算...
【文章來源】:上海師范大學(xué)上海市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別系統(tǒng)結(jié)構(gòu)框圖
第2章語音識別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時,要求所描述的傳輸路徑能夠準(zhǔn)確及時地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉斫鉀Q不同的應(yīng)用場景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時可以將參考信號x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來估計麥克風(fēng)中采集到的回聲信號,進(jìn)而實現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
第2章語音識別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時,要求所描述的傳輸路徑能夠準(zhǔn)確及時地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉斫鉀Q不同的應(yīng)用場景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時可以將參考信號x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來估計麥克風(fēng)中采集到的回聲信號,進(jìn)而實現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
本文編號:3337956
【文章來源】:上海師范大學(xué)上海市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
語音識別系統(tǒng)結(jié)構(gòu)框圖
第2章語音識別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時,要求所描述的傳輸路徑能夠準(zhǔn)確及時地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉斫鉀Q不同的應(yīng)用場景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時可以將參考信號x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來估計麥克風(fēng)中采集到的回聲信號,進(jìn)而實現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
第2章語音識別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時,要求所描述的傳輸路徑能夠準(zhǔn)確及時地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉斫鉀Q不同的應(yīng)用場景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時可以將參考信號x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來估計麥克風(fēng)中采集到的回聲信號,進(jìn)而實現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
本文編號:3337956
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3337956.html
最近更新
教材專著