基于深度神經(jīng)網(wǎng)絡(luò)的語音識別系統(tǒng)研究
發(fā)布時間:2017-10-12 08:40
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音識別系統(tǒng)研究
更多相關(guān)文章: 模式識別 深度神經(jīng)網(wǎng)絡(luò) 語音識別 隱馬爾科夫模型 模型重構(gòu)
【摘要】:語音識別是人機交互模式識別領(lǐng)域的一個重要課題,構(gòu)建了一種基于深度神經(jīng)網(wǎng)絡(luò)的語音識別系統(tǒng),使用了抗噪對比散度法和抗噪最小平方誤差法對模型進行無監(jiān)督訓(xùn)練;使用了均值歸一化進行模型優(yōu)化,提高了網(wǎng)絡(luò)對訓(xùn)練集的擬合度,并且降低了語音識別的錯誤率;使用多狀態(tài)激活函數(shù)進行了模型優(yōu)化,這不僅使得不帶噪測試和帶噪聲測試的語音識別錯誤率進一步下降,并能在一定程度上減輕過擬合現(xiàn)象;并通過奇異值分解和重構(gòu)的方法對模型進行了降維。實驗結(jié)果表明,此系統(tǒng)可以在不影響語音識別錯誤率的基礎(chǔ)上極大地降低系統(tǒng)的復(fù)雜性。
【作者單位】: 北京林業(yè)大學(xué)工學(xué)院;
【關(guān)鍵詞】: 模式識別 深度神經(jīng)網(wǎng)絡(luò) 語音識別 隱馬爾科夫模型 模型重構(gòu)
【基金】:國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃資助項目(201510022062)資助
【分類號】:TN912.34;TP183
【正文快照】: 1引言語音識別是將人類所發(fā)出的語音轉(zhuǎn)化為文字或符號的技術(shù)。從40年前開始對聲學(xué)特征的抽取,到如今使用深度神經(jīng)網(wǎng)絡(luò)作為主體的自動語音識別系統(tǒng),語音識別技術(shù)已經(jīng)逐步完善。但語音識別技術(shù)也面臨著一些問題,比如在語音識別中單純地提取出聲音頻譜作為特征并不能達到很高的識
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪洪波;;語音識別系統(tǒng)在配送中心的應(yīng)用[J];信息與電腦;2006年06期
2 楊q,
本文編號:1017756
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1017756.html
最近更新
教材專著