自由表述口語語音評測后驗(yàn)概率估計(jì)改進(jìn)方法
本文關(guān)鍵詞:自由表述口語語音評測后驗(yàn)概率估計(jì)改進(jìn)方法 出處:《中文信息學(xué)報(bào)》2017年02期 論文類型:期刊論文
更多相關(guān)文章: 自由表述口語 語音評測 后驗(yàn)概率 深度神經(jīng)網(wǎng)絡(luò) RNN語言模型
【摘要】:該文研究了兩種用于改善深度神經(jīng)網(wǎng)絡(luò)聲學(xué)建?蚣芟伦杂杀硎隹谡Z語音評測任務(wù)后驗(yàn)概率估計(jì)的方法:1)使用RNN語言模型對一遍解碼N-best候選做語言模型得分重估計(jì)來獲得更準(zhǔn)確的識別結(jié)果以重新估計(jì)后驗(yàn)概率;2)借鑒多語種神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架,提出將方言數(shù)據(jù)聚類狀態(tài)加入解碼神經(jīng)網(wǎng)絡(luò)輸出節(jié)點(diǎn),在后驗(yàn)概率估計(jì)中引入方言似然度得分以評估方言程度的新方法。實(shí)驗(yàn)表明,這兩種方法估計(jì)出的后驗(yàn)概率與人工分相關(guān)度分別絕對提升了3.5%和1.0%,兩種方法融合后相關(guān)度絕對提升4.9%;對于一個真實(shí)的評測任務(wù),結(jié)合該文改進(jìn)的后驗(yàn)概率評分特征,總體評分相關(guān)度絕對提升2.2%。
[Abstract]:In this paper , two methods to estimate the posterior probability of free expression of spoken speech under the framework of deep neural network acoustic modeling are studied : 1 ) Using RNN language model to re - estimate the score of N - best candidate language model to obtain more accurate recognition results to re - estimate the posterior probability ; 2 ) To use the multi - language neural network training framework to propose a new method to evaluate the degree of dialect .
【作者單位】: 中國科學(xué)技術(shù)大學(xué)語音及語言信息處理國家工程實(shí)驗(yàn)室;科大訊飛信息股份有限公司;
【基金】:國家自然科學(xué)基金(61273264)
【分類號】:TN912.3;TP183
【正文快照】: 1引言傳統(tǒng)的口語評測情境主要是朗讀給定的參考文本,在此背景下,參考文本相對于發(fā)音矢量的后驗(yàn)概率是公認(rèn)的最能反映發(fā)音質(zhì)量好壞的測度[1-3]。在前端搭建好識別器后,以參考文本對應(yīng)的HMM序列為標(biāo)注對測試語音進(jìn)行強(qiáng)制對齊(Force Align-ment),再通過簡化的GOP(Goodness of Pro
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李瑩瑩,王成友,蔡宣平;一種基于后驗(yàn)概率差值的拒識算法[J];應(yīng)用聲學(xué);2004年05期
2 唐峗;劉文舉;徐波;;基于后驗(yàn)概率解碼段模型的漢語語音數(shù)字串識別[J];計(jì)算機(jī)學(xué)報(bào);2006年04期
3 齊耀輝;潘復(fù)平;葛鳳培;顏永紅;;鑒別性最大后驗(yàn)概率聲學(xué)模型自適應(yīng)[J];計(jì)算機(jī)應(yīng)用;2014年01期
4 李海生;賀新毅;;基于最大后驗(yàn)概率的SAR圖像目標(biāo)分割算法[J];信息技術(shù);2012年06期
5 陳賢卿;吳樂南;;LDPC編碼的隨機(jī)極性CP-EBPSK系統(tǒng)[J];信號處理;2012年12期
6 謝一寧,宋文濤,羅漢文;關(guān)于前向最大后驗(yàn)概率(MAP)算法的研究[J];上海交通大學(xué)學(xué)報(bào);2001年06期
7 尤明厚;陶小峰;崔琪楣;張平;;Turbo-MIMO系統(tǒng)中一種基于部分后驗(yàn)概率的軟檢測算法[J];電子與信息學(xué)報(bào);2010年07期
8 許友亮;張連海;張文林;李永彬;;基于語速調(diào)整和音位屬性后驗(yàn)概率的音素識別[J];信號處理;2012年02期
9 史媛媛,劉加,劉潤生;基于二次多項(xiàng)式后驗(yàn)概率估計(jì)的漢語數(shù)碼語音識別[J];電路與系統(tǒng)學(xué)報(bào);1999年04期
10 方利泉,朱世華,閻鴻森;CDMA系統(tǒng)中序列捕捉的后驗(yàn)概率法快速搜索[J];無線電工程;1998年01期
相關(guān)會議論文 前2條
1 姚舒恬;陸佶人;方世良;;一種基于最大后驗(yàn)概率判決的線譜檢測方法[A];2004年全國水聲學(xué)學(xué)術(shù)會議論文集[C];2004年
2 魏思;劉慶升;胡郁;王仁華;;帶方言口音普通話自動水平測試[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
相關(guān)碩士學(xué)位論文 前1條
1 許蘇魁;普通話自由表述口語評測關(guān)鍵技術(shù)的研究[D];中國科學(xué)技術(shù)大學(xué);2016年
,本文編號:1382108
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1382108.html