基于雙向循環(huán)神經(jīng)網(wǎng)絡的漢語語音識別
發(fā)布時間:2024-03-22 04:15
當前基于深度神經(jīng)網(wǎng)絡模型中,雖然其隱含層可設置多層,對復雜問題適應能力強,但每層之間的節(jié)點連接是相互獨立的,這種結構特性導致了在語音序列中無法利用上下文相關信息來提高識別效果,而傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡雖然做出了改進,但是只能對上文信息進行利用。針對以上問題,該文采用可以同時利用語音序列中上下文相關信息的雙向循環(huán)神經(jīng)網(wǎng)絡模型與深度神經(jīng)網(wǎng)絡模型相結合,并應用于語音識別。構建具有5層隱含層的模型,其中第3層為雙向循環(huán)神經(jīng)網(wǎng)絡結構,其他層采用深度神經(jīng)網(wǎng)絡結構。實驗結果表明:加入了雙向循環(huán)神經(jīng)網(wǎng)絡結構的模型與其他模型相比,較好地提高了識別正確率;噪聲對雙向循環(huán)神經(jīng)網(wǎng)絡漢語識別有重要影響,尤其是訓練集和測試集附加噪聲類型不同時,單一的含噪聲語音的訓練模型無法適應不同噪聲類型的語音識別;調(diào)整神經(jīng)網(wǎng)絡模型中隱含層神經(jīng)元數(shù)量后,識別正確率并不是一直隨著隱含層中神經(jīng)元數(shù)量的增加而增加,神經(jīng)元數(shù)量數(shù)目增加到一定程度后正確率出現(xiàn)了降低的趨勢。
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 循環(huán)神經(jīng)網(wǎng)絡結構
1.1 人工神經(jīng)網(wǎng)絡
1.2 單向循環(huán)神經(jīng)網(wǎng)絡
1.3 雙向循環(huán)神經(jīng)網(wǎng)絡
2 漢語識別實驗
2.1 實驗設計
2.2 數(shù)據(jù)集描述
2.3 模型的構建
2.4 實驗結果與分析
3 結論
本文編號:3934620
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 循環(huán)神經(jīng)網(wǎng)絡結構
1.1 人工神經(jīng)網(wǎng)絡
1.2 單向循環(huán)神經(jīng)網(wǎng)絡
1.3 雙向循環(huán)神經(jīng)網(wǎng)絡
2 漢語識別實驗
2.1 實驗設計
2.2 數(shù)據(jù)集描述
2.3 模型的構建
2.4 實驗結果與分析
3 結論
本文編號:3934620
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3934620.html
最近更新
教材專著