基于深度卷積神經(jīng)網(wǎng)絡的藏語語音識別研究
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
圖2-2加窗分幀示意圖
青海師范大學碩士學位論文14模型。語音信號加重,可以有效地減少高頻段的波動性,增加高頻段的信噪比,從而減少其受到噪聲的干擾,減少語音信號的信息損失,保留更多的可以進行識別的信息。提升語音信號的高頻部分,通常是將語音信號輸入一階高通濾波器,通過響應函數(shù)對于語音波形進行變換。一階高通....
圖3-1神經(jīng)元模型
基于深度卷積神經(jīng)網(wǎng)絡的藏語語音識別研究17圖3-1神經(jīng)元模型神經(jīng)網(wǎng)絡的訓練方式就是調(diào)參,即將權(quán)值調(diào)整為最適合分類的最佳參數(shù),從而達到最好的識別性能。圖3-1中,1x,2x,3x為輸入,箭頭線稱為“連接”,作為傳輸數(shù)據(jù)的通道,1w,2w和3w分別為每一個“連接”上的一個權(quán)值,b為偏....
圖4-1語譜原始語音分幀加窗
基于深度卷積神經(jīng)網(wǎng)絡的藏語語音識別研究234.2語譜圖特征提取語譜圖是語音信號的二維表示方式,使時域和頻域進行結(jié)合,清楚地表示出了語音信號的頻譜特征隨著時間的變化而產(chǎn)生的變化。語譜圖的提取過程如圖4-1所示:圖4-1語譜圖提取過程圖4-1中語譜圖橫軸表示時間變量,縱軸表示語音信號....
圖4-3疊加卷積層深度CNN模型
基于深度卷積神經(jīng)網(wǎng)絡的藏語語音識別研究25小,本文設計了更深層的CNN進行藏語語音識別。本文采用的深度CNN基本架構(gòu)如圖4-3所示:圖4-3疊加卷積層深度CNN模型與傳統(tǒng)CNN結(jié)構(gòu)不同,深度CNN直接使用多卷積層對整句語音信號進行建模,并在每個卷積層后再疊加一層相同的卷積層,形成....
本文編號:4033675
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/4033675.html