基于深度卷積神經(jīng)網(wǎng)絡(luò)的中文語(yǔ)音識(shí)別
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TN912.34;TP183
【圖文】:
圖 2-1 語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)Fig.2-1 Structure of speech recognition system2.1 概述識(shí)別之初,需將數(shù)據(jù)庫(kù)中的中文語(yǔ)音信號(hào)數(shù)字化并收集語(yǔ)音信息。根據(jù)奈奎斯特(Nyquist)采樣定理:采樣頻率s_maxf 和信號(hào)最高頻率maxF 之間滿足:_maxmaxf2 Fs (2-1)正常人類語(yǔ)音頻率在 40~4000Hz,因此本文設(shè)置采樣頻率 8KHz,該頻率下可以得到較為完整的原始語(yǔ)音信息。之后,對(duì)采樣的中文語(yǔ)音信號(hào)進(jìn)行預(yù)處理。包括預(yù)加重、分幀和加窗。最后,提取處理后語(yǔ)音信息的 MFCC 特征,作為聲學(xué)模型的輸入。在中文語(yǔ)音識(shí)別系統(tǒng)的構(gòu)建過程中,選擇常用的清華大學(xué)語(yǔ)料庫(kù) Thchs-30 進(jìn)行訓(xùn)
圖 2-2 文件語(yǔ)譜圖Fig. 2-2 Spectrogram of the file 語(yǔ)音信號(hào)預(yù)處理高精度的語(yǔ)音信號(hào)可以更好的實(shí)現(xiàn)語(yǔ)音的表征,魯棒性更佳。因此,需要將始信號(hào)進(jìn)行處理得到精度更高的語(yǔ)音特征,即語(yǔ)音信號(hào)預(yù)處理。1 語(yǔ)音信號(hào)預(yù)加重語(yǔ)音信號(hào)從人口腔聲門發(fā)出后存在衰減[17]。因此,需要在 FFT 之前進(jìn)行預(yù)加峭的頻譜變得平坦。中文語(yǔ)音識(shí)別系統(tǒng)中,采用一階高通濾波器實(shí)現(xiàn)預(yù)加重如圖 2-3 所示。
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 桑亞超;李龍杰;袁傳青;霍慶磊;張樂;;關(guān)于語(yǔ)音識(shí)別在空調(diào)上的應(yīng)用與改善[J];日用電器;2019年07期
2 周弘燁;;語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J];中國(guó)新通信;2019年04期
3 程建軍;胡立志;;關(guān)于深度學(xué)習(xí)的語(yǔ)音識(shí)別應(yīng)用研究[J];科技經(jīng)濟(jì)導(dǎo)刊;2019年12期
4 姜姝姝;;語(yǔ)音識(shí)別64年大突破[J];機(jī)器人產(chǎn)業(yè);2016年06期
5 吳俊宇;;語(yǔ)音識(shí)別為何“叫好不叫座”?[J];通信世界;2016年16期
6 徐鑫;;語(yǔ)音識(shí)別的未來(lái)之路[J];通信世界;2016年16期
7 張連仲;;帶著使命感出發(fā)[J];英語(yǔ)學(xué)習(xí);2017年01期
8 張凱;;榮威eRX5靜態(tài)體驗(yàn) “人性化”語(yǔ)音識(shí)別是亮點(diǎn)[J];新能源汽車新聞;2017年01期
9 劉寶華;;語(yǔ)音識(shí)別老祖宗[J];經(jīng)營(yíng)者(汽車商業(yè)評(píng)論);2017年03期
10 司馬寧;;智能電視,語(yǔ)音識(shí)別或成突破口[J];消費(fèi)指南;2017年05期
相關(guān)會(huì)議論文 前10條
1 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
2 于東;賈磊;徐波;;面向語(yǔ)音識(shí)別錯(cuò)誤恢復(fù)的澄清式疑問句生成[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 邢安昊;黎塔;顏永紅;;利用二重打分方法的激活詞語(yǔ)音識(shí)別[A];中國(guó)聲學(xué)學(xué)會(huì)第十屆青年學(xué)術(shù)會(huì)議論文集[C];2013年
4 文成義;何海燕;張玉扶;;基于新型神經(jīng)網(wǎng)絡(luò)的不定人語(yǔ)音識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年
5 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年
6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語(yǔ)音識(shí)別算法研究[A];第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1998)論文集[C];1998年
7 杜利民;;語(yǔ)音識(shí)別中的魯棒性問題[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
8 宋君;葛余博;;應(yīng)用于魯棒語(yǔ)音識(shí)別的置信度加權(quán)特征丟失法[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
9 張明新;倪宏;陳國(guó)平;張東濱;;一種用于并行模型噪聲魯棒語(yǔ)音識(shí)別的特征構(gòu)造方法[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
10 熊軍軍;馬瑞堂;李成榮;;兒童語(yǔ)音識(shí)別的研究現(xiàn)狀[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 通訊員 魏霈侃;從學(xué)霸、學(xué)者到創(chuàng)業(yè)者的華麗轉(zhuǎn)身[N];中國(guó)教育報(bào);2016年
2 特約撰稿人 Lamont Wood 編譯 Charles;語(yǔ)音識(shí)別成長(zhǎng)起來(lái),并走向移動(dòng)應(yīng)用[N];計(jì)算機(jī)世界;2018年
3 本報(bào)記者 陶力;阿里全資收購(gòu)先聲互聯(lián) 推動(dòng)語(yǔ)音識(shí)別場(chǎng)景落地[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2018年
4 洪蕾;阿里研發(fā)高工業(yè)噪聲環(huán)境下語(yǔ)音識(shí)別及傳輸技術(shù)[N];中國(guó)信息化周報(bào);2018年
5 本報(bào)記者 郭科;登月早已實(shí)現(xiàn),同期啟動(dòng)的語(yǔ)音識(shí)別還在路上[N];科技日?qǐng)?bào);2018年
6 本報(bào)記者 王星平;語(yǔ)音識(shí)別商用尷尬 應(yīng)用場(chǎng)景垂直化路有多遠(yuǎn)[N];中國(guó)企業(yè)報(bào);2016年
7 本報(bào)記者 余建華;從“綠皮車時(shí)代”邁入“高鐵時(shí)代”[N];人民法院報(bào);2017年
8 陳宗周;機(jī)器在聆聽[N];電腦報(bào);2017年
9 本報(bào)記者 黃旭 熊雯琳;云知聲:與巨頭共舞,成為AI領(lǐng)域BAT的密碼[N];電腦報(bào);2017年
10 本報(bào)記者 錢一彬;手機(jī)“黑科技”為何叫好不叫座[N];人民日?qǐng)?bào);2017年
相關(guān)博士學(xué)位論文 前10條
1 屠彥輝;復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的魯棒性語(yǔ)音識(shí)別的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年
2 賀蘇寧;基于語(yǔ)音識(shí)別基元聲學(xué)整體結(jié)構(gòu)特征的識(shí)別模型研究[D];電子科技大學(xué);2005年
3 陳立偉;基于HMM和ANN的漢語(yǔ)語(yǔ)音識(shí)別[D];哈爾濱工程大學(xué);2005年
4 徐金甫;基于特征提取的抗噪聲語(yǔ)音識(shí)別研究[D];華南理工大學(xué);2000年
5 寧更新;抗噪聲語(yǔ)音識(shí)別新技術(shù)的研究[D];華南理工大學(xué);2006年
6 沈海峰;語(yǔ)音識(shí)別中的環(huán)境補(bǔ)償研究[D];北京郵電大學(xué);2006年
7 李小兵;高效簡(jiǎn)約的語(yǔ)音識(shí)別聲學(xué)模型[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
8 孫f
本文編號(hào):2717568
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2717568.html