天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的中文兒童語音識(shí)別聲學(xué)模型研究

發(fā)布時(shí)間:2021-12-22 20:50
  兒童語音識(shí)別技術(shù)存在巨大的潛在市場(chǎng),但大部分的語音識(shí)別研究都聚焦于成人,當(dāng)下對(duì)兒童語音識(shí)別技術(shù)的研究較少,且兒童在發(fā)音及語言表達(dá)方面的特殊性也給兒童語音識(shí)別的研究帶來了極大的挑戰(zhàn)。因此本文從基于深度學(xué)習(xí)的中文兒童聲學(xué)建模角度出發(fā),對(duì)現(xiàn)有的聲學(xué)模型進(jìn)行優(yōu)化,進(jìn)一步研究新的兒童聲學(xué)建模方法來提高中文兒童語音識(shí)別的準(zhǔn)確率和解碼效率。首先,本文圍繞深度學(xué)習(xí)的聲學(xué)建模技術(shù),研究了時(shí)延神經(jīng)網(wǎng)絡(luò)(TDNN)和LSTM(Long Short-Term Memory)網(wǎng)絡(luò)的模型結(jié)構(gòu),并分析了TDNN-LSTM模型在計(jì)算復(fù)雜度方面的問題,采用改進(jìn)的OPGRU(Output-Gate Projected Gated recurrent unit)結(jié)構(gòu)來代替LSTM。實(shí)驗(yàn)表明基于TDNN-OPGRU的聲學(xué)模型,不僅比TDNN-LSTM的聲學(xué)模型識(shí)別性能好,而且比TDNN-LSTM的解碼速度快30%。針對(duì)兒童在生理學(xué)上的特性,通過在網(wǎng)絡(luò)前段加入CNN(Convolutional Neural Networks)來捕獲更有利于兒童語音識(shí)別的聲學(xué)特征信息,最終采用基于CNN-TDNN-OPGRU的兒童語音聲學(xué)模型,... 

【文章來源】:蘭州理工大學(xué)甘肅省

【文章頁數(shù)】:70 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的中文兒童語音識(shí)別聲學(xué)模型研究


三角斜波及頻譜圖

頻譜圖,清音,濁音,頻譜圖


圖 2.3 清音和濁音的頻譜圖 輻射模型音信號(hào)的產(chǎn)生最終需要經(jīng)過口和唇,將語音的聲壓波與速度波的比值定義阻抗,它反映了口和唇的輻射效應(yīng)。于口和唇的輻射大部分集中在高頻階段,所以輻射模型ZR 可以用高通濾,表示式為:10(1 z ) ZR R (2.7為輻射效應(yīng)造成的能量損耗與輻射阻抗 R(z)成正比,其頻響曲線簡(jiǎn)化為器。在實(shí)際語音信號(hào)分析時(shí),也會(huì)采用“預(yù)加重”技術(shù)來恢復(fù)原有信號(hào)上,可以將語音信號(hào)模型表示為激勵(lì)、聲道、輻射函數(shù)的級(jí)聯(lián),表達(dá)式為X (z) U ( z )V ( z ) R( z )(2.8音信號(hào)的預(yù)處理

高通濾波器,頻響,語音信號(hào)


的采樣在信號(hào)最高頻率的兩倍以上時(shí),可以保證信息還原。實(shí)采樣頻率一般在 8~32KHz 之間。指在幅度上對(duì)語音進(jìn)行離散處理,由于語音信號(hào)經(jīng)過采樣后的化,但是在幅度上還是連續(xù)的,所以需要進(jìn)行量化,將語音波實(shí)際中,量化度一般為 8bit 或 16bit。重技術(shù)[31]是為了提高語音信號(hào)高頻部分的分辨率。由于語音信應(yīng)的影響,高頻部分的衰減相較低頻部分衰減要大很多,因此來增強(qiáng)語音信號(hào)的高頻分辨率,其表達(dá)式為:1(z)=1- z H H (z)為一階 FIR 高通濾波器,對(duì)于濁音, 通常為 0.95 或 0. 取值一般更小。 時(shí)刻輸入為 x ( n ),則經(jīng)過預(yù)加重后的結(jié)果如公式 2.10 所示:y ( n) x( n) x( n 1)(

【參考文獻(xiàn)】:
期刊論文
[1]語言發(fā)音模型研究綜述[J]. 張金光.  計(jì)算機(jī)工程與應(yīng)用. 2018(12)
[2]基于短時(shí)能量的語音端點(diǎn)檢測(cè)算法研究[J]. 張仁志,崔慧娟.  電聲技術(shù). 2005(07)

碩士論文
[1]RNN-DNN語音識(shí)別系統(tǒng)研究及其應(yīng)用[D]. 吳俊峰.華南理工大學(xué) 2018



本文編號(hào):3547067

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3547067.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c0d1d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com