基于MCE準(zhǔn)則的語(yǔ)音識(shí)別特征線(xiàn)性判別分析
本文選題:線(xiàn)性判別分析 + 語(yǔ)音識(shí)別; 參考:《自動(dòng)化學(xué)報(bào)》2014年06期
【摘要】:提出了一種基于最小分類(lèi)錯(cuò)誤(Minimum classification error,MCE)準(zhǔn)則的線(xiàn)性判別分析方法(Linear discriminant analysis,LDA),并將其應(yīng)用到連續(xù)語(yǔ)音識(shí)別中的特征變換.該方法采用非參數(shù)核密度估計(jì)方法進(jìn)行數(shù)據(jù)概率分布估計(jì);根據(jù)得到的概率分布,在最小分類(lèi)錯(cuò)誤準(zhǔn)則下,采用基于梯度下降的線(xiàn)性搜索算法求解判別分析變換矩陣.利用判別分析變換矩陣對(duì)相鄰幀梅爾濾波器組輸出拼接的超矢量變換降維,得到時(shí)頻特征.實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的MFCC特征相比,經(jīng)過(guò)本文判別分析提取的時(shí)頻特征其識(shí)別準(zhǔn)確率提高了1.41%,相比于HLDA(Heteroscedastic LDA)和近似成對(duì)經(jīng)驗(yàn)正確率準(zhǔn)則(Approximate pairwise empirical accuracy criterion,aPEAC)判別分析方法,識(shí)別準(zhǔn)確率分別提高了1.14%和0.83%.
[Abstract]:In this paper, a linear discriminant analysis method based on minimum classification error minimum classification error classification criterion is proposed and applied to feature transformation in continuous speech recognition. The nonparametric kernel density estimation method is used to estimate the probability distribution of the data and the linear search algorithm based on gradient descent is used to solve the discriminant analysis transformation matrix under the minimum classification error criterion according to the obtained probability distribution. Using the discriminant analysis transform matrix to reduce the dimension of the output splicing of adjacent frame Mel filter banks, the time-frequency features are obtained. The experimental results show that, compared with the traditional MFCC features, the recognition accuracy of the time-frequency features extracted by the discriminant analysis in this paper is improved by 1.41th, compared with the HLDA(Heteroscedastic LDAs and the approximate empirical accuracy criterion, the approximate pairwise empirical accuracy criteria of the discriminant analysis. The recognition accuracy increased by 1.14% and 0.83% respectively.
【作者單位】: 解放軍信息工程大學(xué)信息系統(tǒng)工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61175017)資助~~
【分類(lèi)號(hào)】:TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王駿;王士同;鄧趙紅;應(yīng)文豪;;面向小目標(biāo)圖像的快速核密度估計(jì)圖像閾值分割算法[J];自動(dòng)化學(xué)報(bào);2012年10期
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 趙曉;侯晴宇;梁冰冰;張偉;;基于多屬性融合的高分辨率遙感圖像云檢測(cè)方法[J];光學(xué)技術(shù);2014年02期
2 柯登峰;徐波;;互聯(lián)網(wǎng)時(shí)代語(yǔ)音識(shí)別基本問(wèn)題[J];中國(guó)科學(xué):信息科學(xué);2013年12期
相關(guān)博士學(xué)位論文 前1條
1 應(yīng)文豪;基于Parzen Window估計(jì)的分類(lèi)與聚類(lèi)方法及應(yīng)用研究[D];江南大學(xué);2013年
相關(guān)碩士學(xué)位論文 前2條
1 辛晚霞;基于KFCM聚類(lèi)與GMP追蹤算法的圖像分割與修復(fù)技術(shù)研究[D];中北大學(xué);2014年
2 陳志剛;基于度量學(xué)習(xí)和聚類(lèi)的一致性預(yù)測(cè)器算法研究[D];廈門(mén)大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 陶文兵;金海;;一種新的基于圖譜理論的圖像閾值分割方法[J];計(jì)算機(jī)學(xué)報(bào);2007年01期
相關(guān)博士學(xué)位論文 前1條
1 李佐勇;基于統(tǒng)計(jì)和譜圖的圖像閾值分割方法研究[D];南京理工大學(xué);2010年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 余華;徐開(kāi)軍;;基于模糊集理論的語(yǔ)音情感識(shí)別[J];信息化研究;2011年02期
2 芮瑞;鮑長(zhǎng)春;;噪聲環(huán)境下的窄帶音頻信號(hào)快速分類(lèi)方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期
3 趙海濱;劉沖;李春勝;王宏;;采用頻帶能量進(jìn)行ECoG信號(hào)的特征提取[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年10期
4 謝達(dá)東,吳及,王作英;線(xiàn)性判別分析在漢語(yǔ)語(yǔ)音識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2002年23期
5 劉傳武;畢篤彥;張智軍;;基于AdaBoost的雷達(dá)目標(biāo)HRRP識(shí)別[J];數(shù)據(jù)采集與處理;2008年05期
6 姚斯強(qiáng);胡劍凌;;線(xiàn)性判別分析和支持向量機(jī)的音樂(lè)分類(lèi)方法[J];電聲技術(shù);2006年12期
7 毛鵬;楊鼎才;;一種對(duì)混合說(shuō)話(huà)人特征提取的新方法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年05期
8 張志華,王炳錫,彭煊;一種基于線(xiàn)性判別分析的穩(wěn)健話(huà)音檢測(cè)方法[J];電聲技術(shù);2005年05期
9 徐潔;楊鼎才;;基于線(xiàn)性判別分析的語(yǔ)音特征提取新方法[J];無(wú)線(xiàn)電工程;2005年12期
10 王宏;趙海濱;劉沖;;采用小波熵和頻帶能量提取腦電信號(hào)特征[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2011年03期
相關(guān)博士學(xué)位論文 前5條
1 張宇;基于視覺(jué)誘發(fā)電位的腦—機(jī)接口分析算法優(yōu)化及實(shí)時(shí)控制系統(tǒng)構(gòu)建[D];華東理工大學(xué);2013年
2 柴晶;雷達(dá)高分辨距離像目標(biāo)識(shí)別的拒判算法和特征提取技術(shù)研究[D];西安電子科技大學(xué);2010年
3 鄧志安;基于學(xué)習(xí)算法的WLAN室內(nèi)定位技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
4 吳杰;基于高分辨距離像的雷達(dá)自動(dòng)目標(biāo)識(shí)別技術(shù)研究[D];南京航空航天大學(xué);2012年
5 高翔;淺埋地層探地雷達(dá)信號(hào)處理與目標(biāo)識(shí)別研究[D];中國(guó)海洋大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 胡備;腦電特征提取與在線(xiàn)腦機(jī)接口研究[D];燕山大學(xué);2012年
2 王佳毅;噪音環(huán)境下說(shuō)話(huà)人識(shí)別方法[D];上海交通大學(xué);2009年
3 張仲明;基于高分辨一維距離像的雷達(dá)目標(biāo)識(shí)別方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2004年
4 盧英;基于表面肌電信號(hào)的下肢動(dòng)作識(shí)別研究[D];武漢理工大學(xué);2013年
5 薛紹龍;運(yùn)動(dòng)想象腦電信號(hào)處理技術(shù)研究[D];哈爾濱工程大學(xué);2013年
6 馬靜;空間目標(biāo)特征提取及識(shí)別技術(shù)[D];西安電子科技大學(xué);2010年
7 鄭芳;基于腦電信號(hào)的KNN及Na(?)ve Bayes分類(lèi)器在OPTIMI系統(tǒng)中的研究[D];蘭州大學(xué);2012年
8 蘇振江;基于高分辨一維距離像的雷達(dá)目標(biāo)識(shí)別研究[D];電子科技大學(xué);2010年
9 周麗娜;基于腦磁圖的腦機(jī)接口方法研究[D];燕山大學(xué);2011年
10 黃山奇;魯棒語(yǔ)言辨識(shí)關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2011年
,本文編號(hào):1813561
本文鏈接:http://sikaile.net/kejilunwen/wltx/1813561.html