用于孤立數(shù)字語音識別的一種組合降維方法
本文關(guān)鍵詞:用于孤立數(shù)字語音識別的一種組合降維方法
更多相關(guān)文章: 語音識別 主成分分析 受限玻爾茲曼機
【摘要】:針對孤立數(shù)字語音識別的噪聲魯棒性問題,提出了一個組合降維方法。該方法由梅爾頻率倒譜系數(shù)(MFCC)特征提取、線性降維、受限玻爾茲曼機(RBM)、Softmax分類器4個功能模塊依次組成;基于主成分分析(PCA)基本原理對MFCC特征向量實現(xiàn)了降維并且統(tǒng)一維度的目的;通過RBM對降維后的特征向量進行學(xué)習(xí),改善了后端Softmax分類器的分類性能,RBM的預(yù)訓(xùn)練由對比散度算法完成,微調(diào)過程使用共軛梯度算法。采用TI-46孤立數(shù)字語音庫和NOISEX-92典型噪聲數(shù)據(jù)庫對方法進行了測試,實驗結(jié)果表明,該方法可以獲得96.09%的正確識別率,相對于常規(guī)神經(jīng)網(wǎng)絡(luò)識別方法,噪聲魯棒性得到了提高。
【作者單位】: 長安大學(xué)信息工程學(xué)院;
【關(guān)鍵詞】: 語音識別 主成分分析 受限玻爾茲曼機
【基金】:國家自然科學(xué)基金資助項目(61201406) 中國博士后科學(xué)基金資助項目(2013M531998) 中央高;究蒲袠I(yè)務(wù)費專項資金資助項目(310824162022,310824162021)
【分類號】:TN912.34
【正文快照】: 孤立數(shù)字語音識別有著廣闊的研究和應(yīng)用價值,諸如動態(tài)時間規(guī)整(dynamic time warping,DTW)、隱馬爾科夫(hidden markov model,HMM)、矢量量化(vector quantization,VQ)、主成分分析(principal component analysis,PCA)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)等方法用
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭遠(yuǎn)瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期
2 邢文;語音識別[J];個人電腦;2000年02期
3 ;語音識別的真相[J];個人電腦;2001年12期
4 ;語音識別漸入佳境[J];個人電腦;2002年03期
5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
6 ;語音識別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機科學(xué);2005年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年
2 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年
3 劉喜喜;語音識別將把鼠標(biāo)鍵盤打入冷宮?[N];中國計算機報;2008年
4 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年
5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年
6 雨夏;語音識別重在應(yīng)用[N];計算機世界;2001年
7 ;語音識別企業(yè)應(yīng)用前景光明[N];計算機世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年
10 張彤;語音識別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
3 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
4 孫f,
本文編號:524429
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/524429.html