一種新的基于瓶頸深度信念網(wǎng)絡(luò)的特征提取方法及其在語種識別中的應(yīng)用
本文關(guān)鍵詞:一種新的基于瓶頸深度信念網(wǎng)絡(luò)的特征提取方法及其在語種識別中的應(yīng)用 出處:《計(jì)算機(jī)科學(xué)》2014年03期 論文類型:期刊論文
更多相關(guān)文章: 語種識別 瓶頸特征 深度信念網(wǎng)絡(luò)
【摘要】:在語種識別中,傳統(tǒng)的MFCC特征由于每幀信號上的信息量不足,很容易受到噪聲污染,且抗噪能力較弱。同時,目前普遍使用的SDC特征提取方法在參數(shù)選擇上需要人為設(shè)定,這增加了識別結(jié)果的不確定性。針對上述不足,將深度學(xué)習(xí)方法引入特征提取之中,提出了基于瓶頸深度信念網(wǎng)絡(luò)的特征提取方法。最后在NIST2007數(shù)據(jù)庫上對瓶頸層的大小、隱層數(shù)目以及瓶頸層位置進(jìn)行了相關(guān)的對比實(shí)驗(yàn),結(jié)果表明,提出的方法相對于傳統(tǒng)的特征提取方法能夠取得更高的識別率。
[Abstract]:In language recognition, traditional MFCC features because of the amount of information of each frame signal is insufficient, it is susceptible to noise pollution, and anti noise ability. At the same time, the current widespread use of SDC feature extraction method should be set artificially in parameter selection, which increases the uncertainty of the recognition results. According to the above problems, the depth of learning method into feature extraction, feature extraction was proposed based on belief network bottleneck depth method. Finally, in the NIST2007 database on the bottleneck layer size, hidden layer number and bottleneck layer position were related to the comparative experiment, the results show that the proposed method is compared with the traditional feature extraction method can achieve higher recognition rate.
【作者單位】: 電子工程學(xué)院;電子制約技術(shù)安徽省重點(diǎn)實(shí)驗(yàn)室;
【基金】:國家自然科學(xué)基金項(xiàng)目(61272333)資助
【分類號】:TN912.34
【正文快照】: 1引言語種識別(Language Identification,LID)是語音識別的一個重要分支,其目的是通過對給定的語音段進(jìn)行分析處理,識別出所屬語言種類。近年來,隨著全球一體化進(jìn)程的不斷加快,不同語言間的信息交互日趨頻繁,LID在自動轉(zhuǎn)換服務(wù)、多語種信息補(bǔ)償?shù)刃畔z索領(lǐng)域有著重要的應(yīng)用
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 李思一;戴蓓劏;王海祥;;基于子帶GMM-UBM的廣播語音多語種識別[J];數(shù)據(jù)采集與處理;2007年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 賀前華;王志鋒;Alexander I Rudnicky;朱錚宇;李新超;;基于改進(jìn)PNCC特征和兩步區(qū)分性訓(xùn)練的錄音設(shè)備識別方法[J];電子學(xué)報;2014年01期
2 楊煥崢;;漢語方言自動辨識系統(tǒng)中的語言建模[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報;2007年05期
3 李晉;郭武;戴禮榮;;聯(lián)合因子分析算法中基于信號子空間的空間變換方法[J];模式識別與人工智能;2013年08期
4 楊棟;周秀玲;郭平;;基于貝葉斯通用背景模型的圖像標(biāo)注[J];自動化學(xué)報;2013年10期
5 祝太鋒;;基于動態(tài)反饋負(fù)載均衡算法的改進(jìn)[J];湖南農(nóng)機(jī);2013年11期
6 駱啟帆;章堅(jiān)武;吳震東;;一種基于MFCC與韻律特征的說話人確認(rèn)方法[J];杭州電子科技大學(xué)學(xué)報;2013年05期
7 陳麗萍;王爾玉;戴禮榮;宋彥;;基于深層置信網(wǎng)絡(luò)的說話人信息提取方法[J];模式識別與人工智能;2013年12期
8 廖曉鋒;范修斌;姜青山;;基于協(xié)方差的高斯混合模型參數(shù)學(xué)習(xí)算法[J];計(jì)算機(jī)科學(xué);2013年S2期
9 郭心語;何曉豐;宮學(xué)慶;張蓉;周傲英;;一種基于曝光量和點(diǎn)擊率的用戶組優(yōu)化策略[J];計(jì)算機(jī)研究與發(fā)展;2013年S1期
10 童強(qiáng);李輝;方昕;;基于韻律特征的說話人確認(rèn)系統(tǒng)融合研究[J];通信技術(shù);2013年11期
相關(guān)會議論文 前7條
1 宋彥;徐兵;付強(qiáng);戴禮榮;;一種基于GMM模型的自動語種識別方法[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年
2 駱啟帆;章堅(jiān)武;吳震東;;一種基于MFCC與韻律特征的說話人確認(rèn)方法[A];浙江省電子學(xué)會2013學(xué)術(shù)年會論文集[C];2013年
3 尹聰;白靜;龔[,
本文編號:1410482
本文鏈接:http://sikaile.net/kejilunwen/wltx/1410482.html