基于JSM和MLP改進發(fā)音錯誤檢測的方法
本文選題:發(fā)音錯誤檢測 + 聯(lián)合序列多階模型。 參考:《自動化學(xué)報》2014年12期
【摘要】:針對發(fā)音錯誤檢測的發(fā)音字典生成提出基于聯(lián)合序列多階模型(Joint-sequence multi-gram,JSM)和多層神經(jīng)感知(Multi-layer perception,MLP)的方法.首先使用JSM模型對發(fā)音錯誤進行建模,將標準發(fā)音和錯誤發(fā)音組合為發(fā)音對,表示它們之間的對應(yīng)關(guān)系,再使用N元文法來統(tǒng)計各發(fā)音對之間的關(guān)系,描述錯誤發(fā)音對上下文關(guān)系的依賴.最后使用MLP對發(fā)音對之間的關(guān)系進行重新建模,以學(xué)習(xí)到在相似的上下文條件下發(fā)生的相似的錯誤.實驗證明使用MLP對高階模型進行概率重估能有效的平滑概率空間,提高了發(fā)音錯誤檢測的性能.
[Abstract]:Based on the joint sequence multi-order model Joint-sequence multi-gramma JSM( JSM) and the multi-layer perception layer (MLP), a new method for the generation of pronunciation dictionary for pronunciation error detection is proposed. First, the JSM model is used to model the pronunciation errors, and the standard pronunciation and the wrong pronunciation are combined into pronunciation pairs to represent the corresponding relationship between them. Then, the N-element grammar is used to calculate the relationship between each pronunciation pair. Describes the dependency of incorrect pronunciation on context. Finally, MLP is used to remodel the relationship between pronunciation pairs to learn similar errors in similar contexts. Experimental results show that using MLP to estimate the probability of higher order models can effectively smooth the probability space and improve the performance of pronunciation error detection.
【作者單位】: 清華大學(xué)電子工程系
【基金】:國家自然科學(xué)基金(61370034,61005019,61273268,61105017)資助~~
【分類號】:TN912.3
【共引文獻】
相關(guān)期刊論文 前8條
1 楊林國;;詞類擴充方法在語音識別中的應(yīng)用[J];電子技術(shù)應(yīng)用;2014年06期
2 SI Yujing;LI Ta;PAN Jielin;YAN Yonghong;;A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model[J];Chinese Journal of Electronics;2014年01期
3 袁樺;蔡猛;趙軍紅;張衛(wèi)強;劉加;;發(fā)音錯誤檢測中基于多數(shù)據(jù)流的Tandem特征方法[J];計算機應(yīng)用;2014年06期
4 胡君;景新幸;楊海燕;;基于計算機輔助漢語教學(xué)系統(tǒng)的發(fā)音評分[J];計算機工程與應(yīng)用;2014年12期
5 飛龍;高光來;閆學(xué)亮;魏宏喜;;傳統(tǒng)蒙古文與西里爾蒙古文相互轉(zhuǎn)換方法的研究[J];計算機工程與應(yīng)用;2014年23期
6 ZHANG Long;LI Haifeng;MA Lin;WANG Jianhua;;Automatic detection and evaluation of Erhua in the Putonghua proficiency test[J];Chinese Journal of Acoustics;2014年01期
7 鄭永軍;張連海;;融合查詢擴展和動態(tài)匹配的集外詞檢測[J];數(shù)據(jù)采集與處理;2014年02期
8 陸梨花;張連海;陳琦;;基于加權(quán)有限狀態(tài)轉(zhuǎn)換器的語音查詢項檢索技術(shù)[J];數(shù)據(jù)采集與處理;2015年02期
相關(guān)會議論文 前3條
1 李先剛;張晨煒;龐在虎;吳璽宏;;大詞匯量連續(xù)語音識別解碼器優(yōu)化研究與實現(xiàn)[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
2 段日成;張勁松;曹文;解焱陸;;日本學(xué)生漢語發(fā)音方式偏誤的自動評測初探[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
3 Xiaoyun WANG;Jinsong ZHANG;Masafumi NISHIDA;Seiichi YAMAMOTO;;A Dialogue-Based English CALL System for Japanese[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前6條
1 飛龍;蒙古語語音關(guān)鍵詞檢測技術(shù)的研究[D];內(nèi)蒙古大學(xué);2013年
2 王智國;嵌入式人機語音交互系統(tǒng)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年
3 包葉波;基于深層神經(jīng)網(wǎng)絡(luò)的聲學(xué)特征提取及其在LVCSR系統(tǒng)中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2014年
4 司博宇;基于語音識別的構(gòu)音及語音障礙自動評估系統(tǒng)研制[D];華東師范大學(xué);2014年
5 張瓏;漢語普通話發(fā)音質(zhì)量自動評測方法研究[D];哈爾濱工業(yè)大學(xué);2014年
6 李鑫鑫;自然語言處理中序列標注問題的聯(lián)合學(xué)習(xí)方法研究[D];哈爾濱工業(yè)大學(xué);2014年
相關(guān)碩士學(xué)位論文 前4條
1 邵俊堯;海量孤立詞識別算法研究[D];北京郵電大學(xué);2013年
2 肖云鵬;子空間高斯混合模型在中文語音識別系統(tǒng)中的實現(xiàn)[D];北京交通大學(xué);2013年
3 洪旭東;基于電話語音的特定業(yè)務(wù)自然語言自動咨詢系統(tǒng)研究[D];昆明理工大學(xué);2013年
4 熊世富;集外詞的語音檢索方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
【相似文獻】
相關(guān)期刊論文 前7條
1 王玉林;郭帆;余敏;;英語口語自動評分系統(tǒng)中發(fā)音錯誤的研究[J];計算機應(yīng)用與軟件;2013年06期
2 張峰;黃超;戴禮榮;;普通話發(fā)音錯誤自動檢測技術(shù)[J];中文信息學(xué)報;2010年02期
3 袁樺;錢彥e,
本文編號:1976310
本文鏈接:http://sikaile.net/kejilunwen/wltx/1976310.html