聲學(xué)模型區(qū)分性訓(xùn)練中的動態(tài)加權(quán)數(shù)據(jù)選取方法
本文選題:區(qū)分性訓(xùn)練 切入點:語音識別 出處:《自動化學(xué)報》2014年12期
【摘要】:提出了一種基于動態(tài)加權(quán)的數(shù)據(jù)選取方法,并應(yīng)用到連續(xù)語音識別的聲學(xué)模型區(qū)分性訓(xùn)練中.該方法聯(lián)合后驗概率和音素準確率選取數(shù)據(jù),首先,采用后驗概率的Beam算法裁剪詞圖,在此基礎(chǔ)上依據(jù)候選詞所在候選路徑的錯誤率,基于后驗概率動態(tài)的賦予候選詞不同的權(quán)值;其次,通過統(tǒng)計音素對之間的混淆程度,給易混淆音素對動態(tài)地加以不同的懲罰權(quán)重,計算音素準確率;最后,在估計得到弧段期望準確率分布的基礎(chǔ)上,采用高斯函數(shù)形式對所有競爭弧段的期望音素準確率軟加權(quán).實驗結(jié)果表明,與最小音素錯誤準則相比,該動態(tài)加權(quán)方法識別準確率提高了0.61%,可有效減少訓(xùn)練時間.
[Abstract]:A method of data selection based on dynamic weighting is proposed and applied to the discriminative training of acoustic model for continuous speech recognition.The method combines posteriori probability with phoneme accuracy data. Firstly, the Beam algorithm of posteriori probability is used to cut the word graph, and the error rate of candidate path is based on the error rate of candidate path.Based on the posteriori probability, the candidate words are given different weights dynamically. Secondly, the confusable phoneme pairs are given different punishment weights dynamically through the statistics of the confusion degree between phoneme pairs. Finally, the phoneme accuracy is calculated.On the basis of estimating the expected accuracy distribution of arc segment, the expected phoneme accuracy of all competing arcs is weighted by Gao Si function.The experimental results show that compared with the minimum phoneme error criterion, the recognition accuracy of this dynamic weighting method is improved by 0.61and the training time can be reduced effectively.
【作者單位】: 解放軍信息工程大學(xué)信息系統(tǒng)工程學(xué)院;
【基金】:國家自然科學(xué)基金(61175017)資助~~
【分類號】:TN912.34
【參考文獻】
相關(guān)期刊論文 前2條
1 吳婭輝;劉剛;郭軍;;基于模型混淆度的模型組合算法研究[J];自動化學(xué)報;2009年05期
2 黃浩;李兵虎;吾守爾·斯拉木;;區(qū)分性模型組合中基于決策樹的聲學(xué)上下文建模方法[J];自動化學(xué)報;2012年09期
【共引文獻】
相關(guān)期刊論文 前10條
1 郭洪禹;趙曉群;黃冬梅;;基于特定位置后驗概率網(wǎng)格的開集語音文檔檢索[J];燕山大學(xué)學(xué)報;2013年04期
2 郭宇弘;黎塔;肖業(yè)鳴;潘接林;顏永紅;;基于加權(quán)有限狀態(tài)機的動態(tài)匹配詞圖生成算法[J];電子與信息學(xué)報;2014年01期
3 黃浩;李兵虎;吾守爾·斯拉木;;區(qū)分性模型組合中基于決策樹的聲學(xué)上下文建模方法[J];自動化學(xué)報;2012年09期
4 飛龍;高光來;閆學(xué)亮;王煒華;;基于分割識別的蒙古語語音關(guān)鍵詞檢測方法的研究[J];計算機科學(xué);2013年09期
5 張力文;努爾麥麥提·尤魯瓦斯;吾守爾·斯拉木;;維吾爾語語音檢索技術(shù)研究[J];中文信息學(xué)報;2014年05期
6 飛龍;高光來;鮑玉來;;基于音素混淆網(wǎng)絡(luò)的蒙古語語音關(guān)鍵詞檢測方法的研究[J];中文信息學(xué)報;2015年01期
7 萬龍靜;劉剛;;語音識別中最小音素錯誤特征訓(xùn)練的研究[J];軟件;2013年12期
8 陸梨花;張連海;陳琦;;基于加權(quán)有限狀態(tài)轉(zhuǎn)換器的語音查詢項檢索技術(shù)[J];數(shù)據(jù)采集與處理;2015年02期
9 陳斌;張連海;屈丹;李弼程;;一種廣義邊距區(qū)分性訓(xùn)練準則[J];聲學(xué)學(xué)報;2014年01期
10 王旭陽;張鵬遠;潘接林;顏永紅;;漢語語言集外詞檢索算法的改進研究[J];網(wǎng)絡(luò)新媒體技術(shù);2014年04期
相關(guān)博士學(xué)位論文 前7條
1 吳婭輝;語音識別中區(qū)分性訓(xùn)練算法研究[D];北京郵電大學(xué);2009年
2 飛龍;蒙古語語音關(guān)鍵詞檢測技術(shù)的研究[D];內(nèi)蒙古大學(xué);2013年
3 李寶祥;語音關(guān)鍵詞檢索若干問題的研究[D];北京郵電大學(xué);2013年
4 王琳琳;說話人識別中的時變魯棒性問題研究[D];清華大學(xué);2013年
5 包葉波;基于深層神經(jīng)網(wǎng)絡(luò)的聲學(xué)特征提取及其在LVCSR系統(tǒng)中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2014年
6 鐘岑岑;基于上下文的音視頻標注研究[D];北京交通大學(xué);2014年
7 齊耀輝;自然口語語音識別中的聲學(xué)建模研究[D];北京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前5條
1 徐雙印;連續(xù)語音識別中的區(qū)分性訓(xùn)練技術(shù)[D];解放軍信息工程大學(xué);2013年
2 張羽;基于無關(guān)變量標準化的大詞匯量語音識別技術(shù)研究[D];上海交通大學(xué);2012年
3 張治濤;面向廣播新聞的語音自動檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
4 邵志明;語音檢索中識別錯誤處理研究[D];北京郵電大學(xué);2014年
5 萬龍靜;語音識別中區(qū)分性訓(xùn)練的研究[D];北京郵電大學(xué);2014年
【二級參考文獻】
相關(guān)期刊論文 前2條
1 吳婭輝;劉剛;郭軍;;基于模型混淆度的模型組合算法研究[J];自動化學(xué)報;2009年05期
2 黃浩;哈力旦;;大間隔高斯混合模型的快速參數(shù)更新算法[J];計算機工程;2010年03期
【相似文獻】
相關(guān)期刊論文 前10條
1 宋寅;梁維謙;;區(qū)分性模型在英語自動發(fā)音評測中的應(yīng)用[J];清華大學(xué)學(xué)報(自然科學(xué)版);2010年04期
2 王雨軒;倪訓(xùn)博;姜峰;;手語識別中基于HMM的區(qū)分性訓(xùn)練方法[J];智能系統(tǒng)學(xué)報;2007年01期
3 祁均;梁維謙;;區(qū)分性訓(xùn)練算法在英語語音評測中的應(yīng)用[J];電聲技術(shù);2011年08期
4 黃浩;李兵虎;吾守爾·斯拉木;;區(qū)分性模型組合中基于決策樹的聲學(xué)上下文建模方法[J];自動化學(xué)報;2012年09期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會議論文 前1條
1 賈媛;熊子瑜;李愛軍;;甘孜藏漢中介語聲調(diào)系統(tǒng)研究[A];第九屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2007年
相關(guān)碩士學(xué)位論文 前3條
1 李巖;區(qū)分性學(xué)生評價策略研究[D];東北師范大學(xué);2008年
2 熱米拉·艾山江;發(fā)音錯誤檢測中的區(qū)分性訓(xùn)練的研究[D];新疆大學(xué);2014年
3 祖麗湖瑪爾·馬木提江;維吾爾語區(qū)分性關(guān)鍵詞提取算法研究及其性能分析[D];新疆大學(xué);2013年
,本文編號:1704385
本文鏈接:http://sikaile.net/kejilunwen/wltx/1704385.html