基于深度學(xué)習(xí)的語(yǔ)音識(shí)別方法研究
【圖文】:
圖 2-1 語(yǔ)音識(shí)別系統(tǒng)原理框圖Fig. 2-1 Principle block diagram of speech recognition system 可知,語(yǔ)音識(shí)別需要經(jīng)過(guò)兩個(gè)階段,一個(gè)是對(duì)語(yǔ)音音的識(shí)別階段。其中,對(duì)于訓(xùn)練階段,其基本任務(wù)利用提取算法提取出的特征參數(shù)作為聲學(xué)模型輸入進(jìn)行歸納分類(lèi),借助高效的訓(xùn)練算法使得語(yǔ)音特征階段主要是將預(yù)先設(shè)定的測(cè)試集提取的語(yǔ)音特征參練后的結(jié)果進(jìn)行特征匹配,,得到一個(gè)相似度考量,識(shí)別決策[15]。因此,對(duì)于語(yǔ)音識(shí)別整個(gè)流程,語(yǔ)音建是語(yǔ)音識(shí)別中首要解決的問(wèn)題。號(hào)的預(yù)處理的預(yù)處理分為三個(gè)基本操作:預(yù)加重、分幀加窗以
圖 2-8 MFCC 語(yǔ)音特征參數(shù)提取流程圖Fig. 2-8 Flow chart of MFCC speech feature parameter extraction由圖 2-8 可知,MFCC 語(yǔ)音特征參數(shù)提取過(guò)程如下:1. 首先語(yǔ)音信號(hào)進(jìn)行預(yù)處理,對(duì)于分幀加窗,選擇使用漢明窗;對(duì)于端點(diǎn)測(cè),使用本文的譜熵法[25]。然后再通過(guò) FFT 變換,最后獲得語(yǔ)音信號(hào)的頻譜。2. 通過(guò)上述獲得的語(yǔ)音頻譜,計(jì)算得到語(yǔ)音的能量譜。為了模擬人耳聽(tīng)覺(jué)制,利用疊加參數(shù)的方式處理語(yǔ)音信號(hào),即使用M 個(gè) Mel 濾波器組進(jìn)行濾波理后,每個(gè)頻帶中的能量進(jìn)行加權(quán)疊加。記第k 個(gè)濾波器輸出功率譜為 S (k)。0.30.40.50.60.70.80.91歸一化幅值Mel濾 波 器 組 的 頻 率 響 應(yīng) 曲 線
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:TN912.34;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周弘燁;;語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J];中國(guó)新通信;2019年04期
2 程建軍;胡立志;;關(guān)于深度學(xué)習(xí)的語(yǔ)音識(shí)別應(yīng)用研究[J];科技經(jīng)濟(jì)導(dǎo)刊;2019年12期
3 姜姝姝;;語(yǔ)音識(shí)別64年大突破[J];機(jī)器人產(chǎn)業(yè);2016年06期
4 吳俊宇;;語(yǔ)音識(shí)別為何“叫好不叫座”?[J];通信世界;2016年16期
5 徐鑫;;語(yǔ)音識(shí)別的未來(lái)之路[J];通信世界;2016年16期
6 張連仲;;帶著使命感出發(fā)[J];英語(yǔ)學(xué)習(xí);2017年01期
7 張凱;;榮威eRX5靜態(tài)體驗(yàn) “人性化”語(yǔ)音識(shí)別是亮點(diǎn)[J];新能源汽車(chē)新聞;2017年01期
8 劉寶華;;語(yǔ)音識(shí)別老祖宗[J];經(jīng)營(yíng)者(汽車(chē)商業(yè)評(píng)論);2017年03期
9 司馬寧;;智能電視,語(yǔ)音識(shí)別或成突破口[J];消費(fèi)指南;2017年05期
10 ;寶馬 用科技打造“未來(lái)之家”[J];中國(guó)汽車(chē)市場(chǎng);2016年11期
相關(guān)會(huì)議論文 前10條
1 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
2 于東;賈磊;徐波;;面向語(yǔ)音識(shí)別錯(cuò)誤恢復(fù)的澄清式疑問(wèn)句生成[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 邢安昊;黎塔;顏永紅;;利用二重打分方法的激活詞語(yǔ)音識(shí)別[A];中國(guó)聲學(xué)學(xué)會(huì)第十屆青年學(xué)術(shù)會(huì)議論文集[C];2013年
4 文成義;何海燕;張玉扶;;基于新型神經(jīng)網(wǎng)絡(luò)的不定人語(yǔ)音識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年
5 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年
6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語(yǔ)音識(shí)別算法研究[A];第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1998)論文集[C];1998年
7 杜利民;;語(yǔ)音識(shí)別中的魯棒性問(wèn)題[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
8 宋君;葛余博;;應(yīng)用于魯棒語(yǔ)音識(shí)別的置信度加權(quán)特征丟失法[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
9 張明新;倪宏;陳國(guó)平;張東濱;;一種用于并行模型噪聲魯棒語(yǔ)音識(shí)別的特征構(gòu)造方法[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
10 熊軍軍;馬瑞堂;李成榮;;兒童語(yǔ)音識(shí)別的研究現(xiàn)狀[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 通訊員 魏霈侃;從學(xué)霸、學(xué)者到創(chuàng)業(yè)者的華麗轉(zhuǎn)身[N];中國(guó)教育報(bào);2016年
2 特約撰稿人 Lamont Wood 編譯 Charles;語(yǔ)音識(shí)別成長(zhǎng)起來(lái),并走向移動(dòng)應(yīng)用[N];計(jì)算機(jī)世界;2018年
3 本報(bào)記者 陶力;阿里全資收購(gòu)先聲互聯(lián) 推動(dòng)語(yǔ)音識(shí)別場(chǎng)景落地[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2018年
4 洪蕾;阿里研發(fā)高工業(yè)噪聲環(huán)境下語(yǔ)音識(shí)別及傳輸技術(shù)[N];中國(guó)信息化周報(bào);2018年
5 本報(bào)記者 郭科;登月早已實(shí)現(xiàn),同期啟動(dòng)的語(yǔ)音識(shí)別還在路上[N];科技日?qǐng)?bào);2018年
6 本報(bào)記者 王星平;語(yǔ)音識(shí)別商用尷尬 應(yīng)用場(chǎng)景垂直化路有多遠(yuǎn)[N];中國(guó)企業(yè)報(bào);2016年
7 本報(bào)記者 余建華;從“綠皮車(chē)時(shí)代”邁入“高鐵時(shí)代”[N];人民法院報(bào);2017年
8 陳宗周;機(jī)器在聆聽(tīng)[N];電腦報(bào);2017年
9 本報(bào)記者 黃旭 熊雯琳;云知聲:與巨頭共舞,成為AI領(lǐng)域BAT的密碼[N];電腦報(bào);2017年
10 本報(bào)記者 錢(qián)一彬;手機(jī)“黑科技”為何叫好不叫座[N];人民日?qǐng)?bào);2017年
相關(guān)博士學(xué)位論文 前10條
1 屠彥輝;復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的魯棒性語(yǔ)音識(shí)別的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年
2 賀蘇寧;基于語(yǔ)音識(shí)別基元聲學(xué)整體結(jié)構(gòu)特征的識(shí)別模型研究[D];電子科技大學(xué);2005年
3 陳立偉;基于HMM和ANN的漢語(yǔ)語(yǔ)音識(shí)別[D];哈爾濱工程大學(xué);2005年
4 徐金甫;基于特征提取的抗噪聲語(yǔ)音識(shí)別研究[D];華南理工大學(xué);2000年
5 寧更新;抗噪聲語(yǔ)音識(shí)別新技術(shù)的研究[D];華南理工大學(xué);2006年
6 沈海峰;語(yǔ)音識(shí)別中的環(huán)境補(bǔ)償研究[D];北京郵電大學(xué);2006年
7 李小兵;高效簡(jiǎn)約的語(yǔ)音識(shí)別聲學(xué)模型[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
8 孫f
本文編號(hào):2605205
本文鏈接:http://sikaile.net/kejilunwen/wltx/2605205.html