MFSC系數(shù)特征局部有限權(quán)重共享CNN語音識別
本文選題:卷積神經(jīng)網(wǎng)絡(luò) + 局部權(quán)重共享 ; 參考:《控制工程》2017年07期
【摘要】:針對傳統(tǒng)語音識別應(yīng)用中識別效果不理想的問題,提出一種基于美爾譜系數(shù)(MFSC)特征的有限局部權(quán)重共享卷積神經(jīng)網(wǎng)絡(luò)(CNN)語音識別。首先,借鑒圖像處理中對輸入圖像信息的處理方式,構(gòu)建語音信號的二維陣列特征映射輸入形式,每個映射表示為含靜態(tài)數(shù)據(jù)、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)的MFSC系數(shù)特征,便于應(yīng)用圖像處理方式進行識別;其次,引入圖像處理的卷積神經(jīng)網(wǎng)絡(luò),并且針對語音信號特征的局部特性,構(gòu)建有限局部權(quán)重共享卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,提高語音信號辨識度并降低算法復(fù)雜度;最后,通過實驗對所提算法進行驗證,并且給出算法參數(shù)變化影響實驗,為具體應(yīng)用提供依據(jù)。
[Abstract]:Aiming at the problem that the recognition effect is not satisfactory in traditional speech recognition applications, a limited local weight shared convolution neural network (CNN) speech recognition based on the Mell-spectrum coefficient (MFSC) feature is proposed. First of all, the input form of two-dimensional array feature map of speech signal is constructed by referring to the processing method of input image information in image processing. Each map is expressed as MFSC coefficient feature with static data, first derivative and second derivative. Secondly, we introduce the convolution neural network of image processing, and construct a learning algorithm of shared convolution neural network with finite local weight according to the local characteristics of speech signal. Finally, the proposed algorithm is verified by experiments, and the experimental results are given to provide the basis for practical application.
【作者單位】: 西安培華學(xué)院中興電信學(xué)院;西安科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院;西安電子科技大學(xué)電子工程學(xué)院;
【基金】:陜西省教育科學(xué)十三五規(guī)劃2016年度規(guī)劃課題(SGH16H258)
【分類號】:TN912.34
【相似文獻】
相關(guān)期刊論文 前10條
1 郭遠瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期
2 邢文;語音識別[J];個人電腦;2000年02期
3 ;語音識別的真相[J];個人電腦;2001年12期
4 ;語音識別漸入佳境[J];個人電腦;2002年03期
5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
6 ;語音識別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機科學(xué);2005年01期
相關(guān)會議論文 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
相關(guān)重要報紙文章 前10條
1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年
2 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年
3 劉喜喜;語音識別將把鼠標(biāo)鍵盤打入冷宮?[N];中國計算機報;2008年
4 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年
5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年
6 雨夏;語音識別重在應(yīng)用[N];計算機世界;2001年
7 ;語音識別企業(yè)應(yīng)用前景光明[N];計算機世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年
10 張彤;語音識別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
相關(guān)博士學(xué)位論文 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語的語音識別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號:1843982
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1843982.html