基于深度學習神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別的研究
本文關(guān)鍵詞:基于深度學習神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別的研究
更多相關(guān)文章: 語音識別 人工神經(jīng)網(wǎng)絡(luò) 深度學習 自編碼器 規(guī)整網(wǎng)絡(luò)
【摘要】:為了提高語音識別系統(tǒng)性能,研究提出將自編碼器深度學習神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音識別中。該網(wǎng)絡(luò)結(jié)構(gòu)引入貪婪逐層預(yù)訓練學習算法,通過預(yù)訓練和微調(diào)兩個步驟提取出待識別語音信號的本質(zhì)特征,克服傳統(tǒng)多層人工神經(jīng)網(wǎng)絡(luò)模型在訓練時存在易陷入局部極小值且需要大量標簽數(shù)據(jù)的問題;經(jīng)過規(guī)整網(wǎng)絡(luò),將任意長度幀的語音特征參數(shù)規(guī)整到某一特定幀,輸入到分類器中進行語音識別。對反向傳播神經(jīng)網(wǎng)絡(luò)和自編碼神經(jīng)網(wǎng)絡(luò)分別進行了仿真實驗,結(jié)果表明深度學習神經(jīng)網(wǎng)絡(luò)識別準確率較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)有20.0%的提升,是一種優(yōu)良的語音識別模型。
【作者單位】: 桂林電子科技大學信息與通信學院;
【關(guān)鍵詞】: 語音識別 人工神經(jīng)網(wǎng)絡(luò) 深度學習 自編碼器 規(guī)整網(wǎng)絡(luò)
【基金】:廣西自然科學基金項目(2012GXNSFAA053221) 廣西千億元產(chǎn)業(yè)產(chǎn)學研用合作項目(信科院0168)
【分類號】:TN912.34;TP18
【正文快照】: 0引言語音識別是為了讓計算機理解人類語言的命令,達到人機交互智能化的目的。隨著計算機技術(shù)的不斷發(fā)展和廣泛應(yīng)用,語音識別技術(shù)得到了迅速發(fā)展,語音識別的研究越來越受到人們的關(guān)注。目前常用的識別方法主要有動態(tài)時間規(guī)整(dynamic timewarping,DTW)方法、矢量量化(vector q
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 史笑興,顧明亮,王太君,何振亞;一種時間規(guī)整算法在神經(jīng)網(wǎng)絡(luò)語音識別中的應(yīng)用[J];東南大學學報;1999年05期
2 陳國良,,韓文廷;人工神經(jīng)網(wǎng)絡(luò)理論研究進展[J];電子學報;1996年02期
3 孫寧;孫勁光;孫宇;;基于神經(jīng)網(wǎng)絡(luò)的語音識別技術(shù)研究[J];計算機與數(shù)字工程;2006年03期
4 孫志軍;薛磊;許陽明;王正;;深度學習研究綜述[J];計算機應(yīng)用研究;2012年08期
5 余凱;賈磊;陳雨強;徐偉;;深度學習的昨天、今天和明天[J];計算機研究與發(fā)展;2013年09期
6 張開旭;周昌樂;;基于自動編碼器的中文詞匯特征無監(jiān)督學習[J];中文信息學報;2013年05期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉孝榮,馬列;氣瓶鋼性能預(yù)測的研究[J];寶鋼技術(shù);2003年03期
2 孫光民,董笑盈;基于神經(jīng)網(wǎng)絡(luò)的漢語孤立詞語音識別[J];北京工業(yè)大學學報;2002年03期
3 孫雷劍,牛濟泰,孟慶昌;基于神經(jīng)網(wǎng)絡(luò)的微合金鋼熱軋奧氏體晶粒尺寸及流變應(yīng)力模型的研究[J];材料科學與工藝;2000年04期
4 周輝;神經(jīng)網(wǎng)絡(luò)在系統(tǒng)建模中的應(yīng)用研究[J];長沙電力學院學報(自然科學版);2003年01期
5 羅玉雄;;3型FIR帶通濾波器優(yōu)化設(shè)計[J];長沙電力學院學報(自然科學版);2006年02期
6 趙鋒;;遺傳神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用研究[J];電腦知識與技術(shù);2008年22期
7 陳越,張小兵;FIR帶通濾波器優(yōu)化設(shè)計研究[J];電氣電子教學學報;2003年01期
8 劉維亭,朱志宇;基于小波網(wǎng)絡(luò)和HMM的語音識別方法[J];電聲技術(shù);2004年11期
9 田傳俊,韋崗;前向神經(jīng)網(wǎng)絡(luò)的一種快速分層線性優(yōu)化算法[J];電子學報;2001年11期
10 陳越,張小兵;3型FIR帶通濾波器優(yōu)化設(shè)計研究[J];湖南工程學院學報(自然科學版);2004年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 萬杰;胡清華;劉金福;蘇鵬宇;于達仁;;基于深度學習理論的短期風速多步預(yù)測方法研究[A];智能化電站技術(shù)發(fā)展研討暨電站自動化2013年會論文集[C];2013年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 劉紀平;多重演化神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用[D];武漢大學;2011年
2 胡勁松;面向旋轉(zhuǎn)機械故障診斷的經(jīng)驗?zāi)B(tài)分解時頻分析方法及實驗研究[D];浙江大學;2003年
3 姚建;岷江上游生態(tài)脆弱性分析及評價[D];四川大學;2004年
4 任春輝;通信電臺個體特征分析[D];電子科技大學;2006年
5 聞驥駿;工程結(jié)構(gòu)損傷識別的反問題研究[D];武漢理工大學;2006年
6 劉蓉;人體運動信息獲取及物理活動識別研究[D];華中科技大學;2009年
7 何俊;服務(wù)機器人語音唇讀人機交互技術(shù)研究[D];南昌大學;2009年
8 朱曉軍;HHT變換及其在腦電信號處理中的應(yīng)用研究[D];太原理工大學;2012年
9 胡曉娟;中醫(yī)脈診信號感知與計算機輔助識別研究[D];華東師范大學;2013年
10 徐望明;面向圖像檢索和分類任務(wù)的稀疏特征學習[D];武漢科技大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 高翔;超球支持向量機在語音識別中的應(yīng)用研究[D];太原理工大學;2011年
2 付志清;基于模糊混沌神經(jīng)網(wǎng)絡(luò)的語音識別方法研究[D];長春理工大學;2011年
3 陳俊圻;基于圖像處理與人工神經(jīng)網(wǎng)絡(luò)的煙葉檢測系統(tǒng)的研究與應(yīng)用[D];北京工商大學;2010年
4 屈衍靜;基于DSP的滾動軸承狀態(tài)監(jiān)測和故障診斷裝置研制[D];哈爾濱工業(yè)大學;2011年
5 杜新忠;流域水文模型的不確定性分析[D];長沙理工大學;2011年
6 蔡志峰;基于粗集與聚類的神經(jīng)模糊建模[D];廈門大學;2002年
7 孫炎s
本文編號:1110675
本文鏈接:http://sikaile.net/kejilunwen/wltx/1110675.html