基于JSM和MLP改進(jìn)發(fā)音錯(cuò)誤檢測(cè)的方法
本文選題:發(fā)音錯(cuò)誤檢測(cè) + 聯(lián)合序列多階模型; 參考:《自動(dòng)化學(xué)報(bào)》2014年12期
【摘要】:針對(duì)發(fā)音錯(cuò)誤檢測(cè)的發(fā)音字典生成提出基于聯(lián)合序列多階模型(Joint-sequence multi-gram,JSM)和多層神經(jīng)感知(Multi-layer perception,MLP)的方法.首先使用JSM模型對(duì)發(fā)音錯(cuò)誤進(jìn)行建模,將標(biāo)準(zhǔn)發(fā)音和錯(cuò)誤發(fā)音組合為發(fā)音對(duì),表示它們之間的對(duì)應(yīng)關(guān)系,再使用N元文法來統(tǒng)計(jì)各發(fā)音對(duì)之間的關(guān)系,描述錯(cuò)誤發(fā)音對(duì)上下文關(guān)系的依賴.最后使用MLP對(duì)發(fā)音對(duì)之間的關(guān)系進(jìn)行重新建模,以學(xué)習(xí)到在相似的上下文條件下發(fā)生的相似的錯(cuò)誤.實(shí)驗(yàn)證明使用MLP對(duì)高階模型進(jìn)行概率重估能有效的平滑概率空間,提高了發(fā)音錯(cuò)誤檢測(cè)的性能.
[Abstract]:Based on the joint sequence multi-order model Joint-sequence multi-gramma JSM( JSM) and the multi-layer perception layer (MLP), a new method for the generation of pronunciation dictionary for pronunciation error detection is proposed. First, the JSM model is used to model the pronunciation errors, and the standard pronunciation and the wrong pronunciation are combined into pronunciation pairs to represent the corresponding relationship between them. Then, the N-element grammar is used to calculate the relationship between each pronunciation pair. Describes the dependency of incorrect pronunciation on context. Finally, MLP is used to remodel the relationship between pronunciation pairs to learn similar errors in similar contexts. Experimental results show that using MLP to estimate the probability of higher order models can effectively smooth the probability space and improve the performance of pronunciation error detection.
【作者單位】: 清華大學(xué)電子工程系
【基金】:國(guó)家自然科學(xué)基金(61370034,61005019,61273268,61105017)資助~~
【分類號(hào)】:TN912.3
【共引文獻(xiàn)】
相關(guān)期刊論文 前8條
1 楊林國(guó);;詞類擴(kuò)充方法在語(yǔ)音識(shí)別中的應(yīng)用[J];電子技術(shù)應(yīng)用;2014年06期
2 SI Yujing;LI Ta;PAN Jielin;YAN Yonghong;;A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model[J];Chinese Journal of Electronics;2014年01期
3 袁樺;蔡猛;趙軍紅;張衛(wèi)強(qiáng);劉加;;發(fā)音錯(cuò)誤檢測(cè)中基于多數(shù)據(jù)流的Tandem特征方法[J];計(jì)算機(jī)應(yīng)用;2014年06期
4 胡君;景新幸;楊海燕;;基于計(jì)算機(jī)輔助漢語(yǔ)教學(xué)系統(tǒng)的發(fā)音評(píng)分[J];計(jì)算機(jī)工程與應(yīng)用;2014年12期
5 飛龍;高光來;閆學(xué)亮;魏宏喜;;傳統(tǒng)蒙古文與西里爾蒙古文相互轉(zhuǎn)換方法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2014年23期
6 ZHANG Long;LI Haifeng;MA Lin;WANG Jianhua;;Automatic detection and evaluation of Erhua in the Putonghua proficiency test[J];Chinese Journal of Acoustics;2014年01期
7 鄭永軍;張連海;;融合查詢擴(kuò)展和動(dòng)態(tài)匹配的集外詞檢測(cè)[J];數(shù)據(jù)采集與處理;2014年02期
8 陸梨花;張連海;陳琦;;基于加權(quán)有限狀態(tài)轉(zhuǎn)換器的語(yǔ)音查詢項(xiàng)檢索技術(shù)[J];數(shù)據(jù)采集與處理;2015年02期
相關(guān)會(huì)議論文 前3條
1 李先剛;張晨煒;龐在虎;吳璽宏;;大詞匯量連續(xù)語(yǔ)音識(shí)別解碼器優(yōu)化研究與實(shí)現(xiàn)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
2 段日成;張勁松;曹文;解焱陸;;日本學(xué)生漢語(yǔ)發(fā)音方式偏誤的自動(dòng)評(píng)測(cè)初探[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
3 Xiaoyun WANG;Jinsong ZHANG;Masafumi NISHIDA;Seiichi YAMAMOTO;;A Dialogue-Based English CALL System for Japanese[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前6條
1 飛龍;蒙古語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)技術(shù)的研究[D];內(nèi)蒙古大學(xué);2013年
2 王智國(guó);嵌入式人機(jī)語(yǔ)音交互系統(tǒng)關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
3 包葉波;基于深層神經(jīng)網(wǎng)絡(luò)的聲學(xué)特征提取及其在LVCSR系統(tǒng)中的應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
4 司博宇;基于語(yǔ)音識(shí)別的構(gòu)音及語(yǔ)音障礙自動(dòng)評(píng)估系統(tǒng)研制[D];華東師范大學(xué);2014年
5 張瓏;漢語(yǔ)普通話發(fā)音質(zhì)量自動(dòng)評(píng)測(cè)方法研究[D];哈爾濱工業(yè)大學(xué);2014年
6 李鑫鑫;自然語(yǔ)言處理中序列標(biāo)注問題的聯(lián)合學(xué)習(xí)方法研究[D];哈爾濱工業(yè)大學(xué);2014年
相關(guān)碩士學(xué)位論文 前4條
1 邵俊堯;海量孤立詞識(shí)別算法研究[D];北京郵電大學(xué);2013年
2 肖云鵬;子空間高斯混合模型在中文語(yǔ)音識(shí)別系統(tǒng)中的實(shí)現(xiàn)[D];北京交通大學(xué);2013年
3 洪旭東;基于電話語(yǔ)音的特定業(yè)務(wù)自然語(yǔ)言自動(dòng)咨詢系統(tǒng)研究[D];昆明理工大學(xué);2013年
4 熊世富;集外詞的語(yǔ)音檢索方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
【相似文獻(xiàn)】
相關(guān)期刊論文 前7條
1 王玉林;郭帆;余敏;;英語(yǔ)口語(yǔ)自動(dòng)評(píng)分系統(tǒng)中發(fā)音錯(cuò)誤的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年06期
2 張峰;黃超;戴禮榮;;普通話發(fā)音錯(cuò)誤自動(dòng)檢測(cè)技術(shù)[J];中文信息學(xué)報(bào);2010年02期
3 袁樺;錢彥e,
本文編號(hào):1976310
本文鏈接:http://sikaile.net/kejilunwen/wltx/1976310.html