基于深度學(xué)習(xí)的語音識別方法研究
【圖文】:
圖 2-1 語音識別系統(tǒng)原理框圖Fig. 2-1 Principle block diagram of speech recognition system 可知,語音識別需要經(jīng)過兩個階段,一個是對語音音的識別階段。其中,對于訓(xùn)練階段,其基本任務(wù)利用提取算法提取出的特征參數(shù)作為聲學(xué)模型輸入進(jìn)行歸納分類,借助高效的訓(xùn)練算法使得語音特征階段主要是將預(yù)先設(shè)定的測試集提取的語音特征參練后的結(jié)果進(jìn)行特征匹配,,得到一個相似度考量,識別決策[15]。因此,對于語音識別整個流程,語音建是語音識別中首要解決的問題。號的預(yù)處理的預(yù)處理分為三個基本操作:預(yù)加重、分幀加窗以
圖 2-8 MFCC 語音特征參數(shù)提取流程圖Fig. 2-8 Flow chart of MFCC speech feature parameter extraction由圖 2-8 可知,MFCC 語音特征參數(shù)提取過程如下:1. 首先語音信號進(jìn)行預(yù)處理,對于分幀加窗,選擇使用漢明窗;對于端點測,使用本文的譜熵法[25]。然后再通過 FFT 變換,最后獲得語音信號的頻譜。2. 通過上述獲得的語音頻譜,計算得到語音的能量譜。為了模擬人耳聽覺制,利用疊加參數(shù)的方式處理語音信號,即使用M 個 Mel 濾波器組進(jìn)行濾波理后,每個頻帶中的能量進(jìn)行加權(quán)疊加。記第k 個濾波器輸出功率譜為 S (k)。0.30.40.50.60.70.80.91歸一化幅值Mel濾 波 器 組 的 頻 率 響 應(yīng) 曲 線
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN912.34;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周弘燁;;語音識別大揭秘:計算機(jī)如何處理聲音?[J];中國新通信;2019年04期
2 程建軍;胡立志;;關(guān)于深度學(xué)習(xí)的語音識別應(yīng)用研究[J];科技經(jīng)濟(jì)導(dǎo)刊;2019年12期
3 姜姝姝;;語音識別64年大突破[J];機(jī)器人產(chǎn)業(yè);2016年06期
4 吳俊宇;;語音識別為何“叫好不叫座”?[J];通信世界;2016年16期
5 徐鑫;;語音識別的未來之路[J];通信世界;2016年16期
6 張連仲;;帶著使命感出發(fā)[J];英語學(xué)習(xí);2017年01期
7 張凱;;榮威eRX5靜態(tài)體驗 “人性化”語音識別是亮點[J];新能源汽車新聞;2017年01期
8 劉寶華;;語音識別老祖宗[J];經(jīng)營者(汽車商業(yè)評論);2017年03期
9 司馬寧;;智能電視,語音識別或成突破口[J];消費(fèi)指南;2017年05期
10 ;寶馬 用科技打造“未來之家”[J];中國汽車市場;2016年11期
相關(guān)會議論文 前10條
1 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
2 于東;賈磊;徐波;;面向語音識別錯誤恢復(fù)的澄清式疑問句生成[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 邢安昊;黎塔;顏永紅;;利用二重打分方法的激活詞語音識別[A];中國聲學(xué)學(xué)會第十屆青年學(xué)術(shù)會議論文集[C];2013年
4 文成義;何海燕;張玉扶;;基于新型神經(jīng)網(wǎng)絡(luò)的不定人語音識別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC1992)論文集[C];1992年
5 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC1992)論文集[C];1992年
6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語音識別算法研究[A];第五屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC1998)論文集[C];1998年
7 杜利民;;語音識別中的魯棒性問題[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
8 宋君;葛余博;;應(yīng)用于魯棒語音識別的置信度加權(quán)特征丟失法[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
9 張明新;倪宏;陳國平;張東濱;;一種用于并行模型噪聲魯棒語音識別的特征構(gòu)造方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
10 熊軍軍;馬瑞堂;李成榮;;兒童語音識別的研究現(xiàn)狀[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前10條
1 通訊員 魏霈侃;從學(xué)霸、學(xué)者到創(chuàng)業(yè)者的華麗轉(zhuǎn)身[N];中國教育報;2016年
2 特約撰稿人 Lamont Wood 編譯 Charles;語音識別成長起來,并走向移動應(yīng)用[N];計算機(jī)世界;2018年
3 本報記者 陶力;阿里全資收購先聲互聯(lián) 推動語音識別場景落地[N];21世紀(jì)經(jīng)濟(jì)報道;2018年
4 洪蕾;阿里研發(fā)高工業(yè)噪聲環(huán)境下語音識別及傳輸技術(shù)[N];中國信息化周報;2018年
5 本報記者 郭科;登月早已實現(xiàn),同期啟動的語音識別還在路上[N];科技日報;2018年
6 本報記者 王星平;語音識別商用尷尬 應(yīng)用場景垂直化路有多遠(yuǎn)[N];中國企業(yè)報;2016年
7 本報記者 余建華;從“綠皮車時代”邁入“高鐵時代”[N];人民法院報;2017年
8 陳宗周;機(jī)器在聆聽[N];電腦報;2017年
9 本報記者 黃旭 熊雯琳;云知聲:與巨頭共舞,成為AI領(lǐng)域BAT的密碼[N];電腦報;2017年
10 本報記者 錢一彬;手機(jī)“黑科技”為何叫好不叫座[N];人民日報;2017年
相關(guān)博士學(xué)位論文 前10條
1 屠彥輝;復(fù)雜場景下基于深度學(xué)習(xí)的魯棒性語音識別的研究[D];中國科學(xué)技術(shù)大學(xué);2019年
2 賀蘇寧;基于語音識別基元聲學(xué)整體結(jié)構(gòu)特征的識別模型研究[D];電子科技大學(xué);2005年
3 陳立偉;基于HMM和ANN的漢語語音識別[D];哈爾濱工程大學(xué);2005年
4 徐金甫;基于特征提取的抗噪聲語音識別研究[D];華南理工大學(xué);2000年
5 寧更新;抗噪聲語音識別新技術(shù)的研究[D];華南理工大學(xué);2006年
6 沈海峰;語音識別中的環(huán)境補(bǔ)償研究[D];北京郵電大學(xué);2006年
7 李小兵;高效簡約的語音識別聲學(xué)模型[D];中國科學(xué)技術(shù)大學(xué);2006年
8 孫f
本文編號:2605205
本文鏈接:http://sikaile.net/kejilunwen/wltx/2605205.html