基于模型自適應(yīng)的聲效魯棒性語音識別算法
本文關(guān)鍵詞:基于模型自適應(yīng)的聲效魯棒性語音識別算法
更多相關(guān)文章: 語音識別 聲音效果 自適應(yīng) 最大似然線性回歸
【摘要】:針對聲音效果變化引起的語音聲學特性的改變,提出基于聲學模型自適應(yīng)的方法。分析了正常模式下訓(xùn)練的聲學模型在識別其他聲效模式下語音的表現(xiàn);根據(jù)隨機段模型的模型特性,將最大似然線性回歸方法引入到隨機段模型系統(tǒng)中,并利用自適應(yīng)后的聲學模型來識別對應(yīng)的聲效模式下的語音。在"863-test"測試集上進行的漢語連續(xù)語音識別實驗顯示,正常模式下訓(xùn)練的聲學模型識別其他四種聲效模式下的語音時,識別精度均有較大程度的下降;而自適應(yīng)后的系統(tǒng)在識別對應(yīng)的聲效模式的語音時,識別精度有了明顯的改觀。表明了基于聲學模型自適應(yīng)的方法在解決語音識別中聲音效果變化問題上的有效性。
【作者單位】: 河南理工大學計算機科學與技術(shù)學院;
【關(guān)鍵詞】: 語音識別 聲音效果 自適應(yīng) 最大似然線性回歸
【基金】:國家自然科學基金(No.61175066,No.61300124) 河南省基礎(chǔ)與前沿技術(shù)研究計劃資助項目(No.132300410332)
【分類號】:TN912.34
【正文快照】: 1引言盡管語音識別技術(shù)已經(jīng)初步進入了實用的階段,但是魯棒性問題還是制約語音識別技術(shù)進一步發(fā)展的主要障礙。由于應(yīng)用環(huán)境的復(fù)雜性,各種干擾因素往往導(dǎo)致系統(tǒng)性能急劇地下降。語音識別過程中,引起訓(xùn)練環(huán)境和識別環(huán)境的不匹配的音素有很多,其中一個就是聲音效果(Vocal Effect
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭遠瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期
2 邢文;語音識別[J];個人電腦;2000年02期
3 ;語音識別的真相[J];個人電腦;2001年12期
4 ;語音識別漸入佳境[J];個人電腦;2002年03期
5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
6 ;語音識別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報學刊;2004年03期
8 韓紀慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學習技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期
10 韓紀慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機科學;2005年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學術(shù)年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學術(shù)年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學會電氣信息與自動化專業(yè)委員會、中國電機工程學會農(nóng)村電氣化分會科技與教育專委會2010年學術(shù)年會論文摘要[C];2010年
4 張冰;龍長才;羅海風;;熟悉掩蔽音背景下的目標語音識別[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術(shù)會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學術(shù)會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學術(shù)會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學術(shù)會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學術(shù)會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學術(shù)會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機語音通訊學術(shù)會議論文集[C];1996年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年
2 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年
3 劉喜喜;語音識別將把鼠標鍵盤打入冷宮?[N];中國計算機報;2008年
4 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年
5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年
6 雨夏;語音識別重在應(yīng)用[N];計算機世界;2001年
7 ;語音識別企業(yè)應(yīng)用前景光明[N];計算機世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年
10 張彤;語音識別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學院;2015年
2 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學;2008年
3 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學;2010年
4 孫f,
本文編號:1005160
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1005160.html