基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的漢語語音識別
發(fā)布時(shí)間:2024-03-22 04:15
當(dāng)前基于深度神經(jīng)網(wǎng)絡(luò)模型中,雖然其隱含層可設(shè)置多層,對復(fù)雜問題適應(yīng)能力強(qiáng),但每層之間的節(jié)點(diǎn)連接是相互獨(dú)立的,這種結(jié)構(gòu)特性導(dǎo)致了在語音序列中無法利用上下文相關(guān)信息來提高識別效果,而傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)雖然做出了改進(jìn),但是只能對上文信息進(jìn)行利用。針對以上問題,該文采用可以同時(shí)利用語音序列中上下文相關(guān)信息的雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型與深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,并應(yīng)用于語音識別。構(gòu)建具有5層隱含層的模型,其中第3層為雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其他層采用深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明:加入了雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的模型與其他模型相比,較好地提高了識別正確率;噪聲對雙向循環(huán)神經(jīng)網(wǎng)絡(luò)漢語識別有重要影響,尤其是訓(xùn)練集和測試集附加噪聲類型不同時(shí),單一的含噪聲語音的訓(xùn)練模型無法適應(yīng)不同噪聲類型的語音識別;調(diào)整神經(jīng)網(wǎng)絡(luò)模型中隱含層神經(jīng)元數(shù)量后,識別正確率并不是一直隨著隱含層中神經(jīng)元數(shù)量的增加而增加,神經(jīng)元數(shù)量數(shù)目增加到一定程度后正確率出現(xiàn)了降低的趨勢。
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.1 人工神經(jīng)網(wǎng)絡(luò)
1.2 單向循環(huán)神經(jīng)網(wǎng)絡(luò)
1.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2 漢語識別實(shí)驗(yàn)
2.1 實(shí)驗(yàn)設(shè)計(jì)
2.2 數(shù)據(jù)集描述
2.3 模型的構(gòu)建
2.4 實(shí)驗(yàn)結(jié)果與分析
3 結(jié)論
本文編號:3934620
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.1 人工神經(jīng)網(wǎng)絡(luò)
1.2 單向循環(huán)神經(jīng)網(wǎng)絡(luò)
1.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2 漢語識別實(shí)驗(yàn)
2.1 實(shí)驗(yàn)設(shè)計(jì)
2.2 數(shù)據(jù)集描述
2.3 模型的構(gòu)建
2.4 實(shí)驗(yàn)結(jié)果與分析
3 結(jié)論
本文編號:3934620
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3934620.html
最近更新
教材專著