基于DNN的發(fā)音偏誤趨勢檢測
發(fā)布時間:2017-07-31 06:05
本文關(guān)鍵詞:基于DNN的發(fā)音偏誤趨勢檢測
更多相關(guān)文章: 計算機輔助發(fā)音訓(xùn)練 發(fā)音偏誤檢測 深度神經(jīng)網(wǎng)絡(luò)
【摘要】:正音反饋的計算機輔助對外漢語發(fā)音訓(xùn)練系統(tǒng)已有發(fā)音偏誤趨勢的標(biāo)注體系和基于HMM的偏誤趨勢檢測系統(tǒng)。為了進一步提高系統(tǒng)的性能,該文應(yīng)用深度神經(jīng)網(wǎng)絡(luò)進行聲學(xué)建模,比較Mel頻率倒譜系數(shù)(Mel-frequency cepstral coefficient,MFCC)、感知線性預(yù)測分析系數(shù)(perceptual linear predictive analysis,PLP)和Mel濾波器組系數(shù)(Mel filter bank,FBank)3種聲學(xué)特征參數(shù),并利用網(wǎng)格聯(lián)合技術(shù)整合3種聲學(xué)特征所得的候選網(wǎng)格。實驗結(jié)果表明:DNN-HMM模型比GMM-HMM實現(xiàn)了更高檢測正確率。針對不同發(fā)音偏誤趨勢,3種聲學(xué)特征有不同表現(xiàn),聯(lián)合系統(tǒng)取得最高性能,最終性能為:錯誤拒絕率5.5%,錯誤接受率35.6%,檢測正確率88.6%。
【作者單位】: 北京語言大學(xué)信息科學(xué)學(xué)院;北京語言大學(xué)對外漢語研究中心;
【關(guān)鍵詞】: 計算機輔助發(fā)音訓(xùn)練 發(fā)音偏誤檢測 深度神經(jīng)網(wǎng)絡(luò)
【基金】:國家自然科學(xué)基金資助項目(61175019) 北京語言大學(xué)梧桐創(chuàng)新平臺項目(16PT05)
【分類號】:H01;TN912.34
【正文快照】: 以語音技術(shù)為支撐的計算機輔助語言學(xué)習(xí)系統(tǒng)(computer-assisted language learning,CALL),特別是基于自動語音識別技術(shù)的計算機輔助發(fā)音訓(xùn)練系統(tǒng)(computer aided pronunciation training,CAPT),在近幾年受到大量關(guān)注[1-11]。從反饋形式角度看,CAPT系統(tǒng)可大致分為發(fā)音質(zhì)量打分,
本文編號:597727
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/597727.html