一種機(jī)器人智能語(yǔ)音識(shí)別算法研究
本文關(guān)鍵詞: 端點(diǎn)檢測(cè) 特征提取 HMM算法 語(yǔ)音識(shí)別 出處:《計(jì)算機(jī)測(cè)量與控制》2014年10期 論文類型:期刊論文
【摘要】:針對(duì)智能機(jī)器人在非特定人語(yǔ)音識(shí)別中識(shí)別率偏低的問題,提出了一種雙門限的端點(diǎn)檢測(cè)算法,精確地檢測(cè)出了語(yǔ)音端點(diǎn),對(duì)分形維數(shù)和Mel頻率倒譜系數(shù)(MFCC)進(jìn)行結(jié)合,同時(shí)基于隱馬爾可夫(HMM)模型,提出了智能機(jī)器人命令識(shí)別系統(tǒng);在實(shí)驗(yàn)室環(huán)境下,利用Cool Edit軟件錄制了5男5女的語(yǔ)音,采樣率為8kHz,精度為16位,內(nèi)容為5個(gè)命令詞,每個(gè)詞均被采集6次,將每人的前3次發(fā)音作為模板語(yǔ)音,后3次發(fā)音作為測(cè)試語(yǔ)音,實(shí)驗(yàn)結(jié)果表明,系統(tǒng)識(shí)別率可以達(dá)到85%以上,MFCC與分形維數(shù)混合的語(yǔ)音特征參數(shù)的算法提高了系統(tǒng)識(shí)別率,優(yōu)化了系統(tǒng)性能;該方法用于非特定人語(yǔ)音智能識(shí)別是可行的、有效的。
[Abstract]:In order to solve the problem of low recognition rate of intelligent robot in independent speech recognition, a two-threshold endpoint detection algorithm is proposed to detect the speech endpoint accurately. The fractal dimension is combined with the Mel frequency cepstrum coefficient (MFCC). At the same time, based on the hidden Markov model, an intelligent robot command recognition system is proposed. In the laboratory environment, the speech of 5 men and 5 women are recorded by Cool Edit software. The sampling rate is 8 kHz, the precision is 16 bits, and the content is 5 command words. Each word was collected for 6 times. The first three pronounciations of each person were used as template pronunciation and the latter three times as test pronunciation. The experimental results showed that, The algorithm of speech feature parameters mixed with fractal dimension and system recognition rate can reach more than 85%. The algorithm improves the recognition rate and optimizes the system performance, and it is feasible and effective to apply this method to the intelligent recognition of non-specific speech.
【作者單位】: 重慶電子工程職業(yè)學(xué)院計(jì)算機(jī)學(xué)院;黃淮學(xué)院動(dòng)畫學(xué)院;
【基金】:重慶市教委“科學(xué)技術(shù)研究項(xiàng)目”(KJ132207) 重慶市教育科學(xué)院2013年度“十二五”規(guī)劃課題(2013-ZJ-079)
【分類號(hào)】:TP242;TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 王作英,肖熙;基于段長(zhǎng)分布的HMM語(yǔ)音識(shí)別模型[J];電子學(xué)報(bào);2004年01期
2 張麗;王福忠;張濤;;混合抗噪語(yǔ)音識(shí)別模型的設(shè)計(jì)與仿真[J];河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年06期
3 常青;裴科;張剛;;構(gòu)建基于SIP與嵌入式多核架構(gòu)的流媒體服務(wù)器[J];計(jì)算機(jī)工程與應(yīng)用;2010年24期
4 俸云;景新幸;葉懋;;MFCC特征改進(jìn)算法在語(yǔ)音識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);2009年12期
5 呂霄云;王宏霞;;基于MFCC和短時(shí)能量混合的異常聲音識(shí)別算法[J];計(jì)算機(jī)應(yīng)用;2010年03期
6 彭輝;魏瑋;陸建華;;特定人孤立詞的語(yǔ)音識(shí)別系統(tǒng)研究[J];控制工程;2011年03期
7 馬斌;郭莉莉;韓中華;戴敬;;基于DSP的語(yǔ)音識(shí)別系統(tǒng)的研究與設(shè)計(jì)[J];微計(jì)算機(jī)信息;2008年23期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王宏;郭艷麗;賈新民;;基于HMM的孤立字識(shí)別[J];昌吉學(xué)院學(xué)報(bào);2006年01期
2 董國(guó)超;寇凈磊;;多Agent在語(yǔ)音識(shí)別技術(shù)中的應(yīng)用[J];電腦知識(shí)與技術(shù);2009年13期
3 全剛;肖熙;;基于DDBHMM的數(shù)字語(yǔ)音識(shí)別[J];電聲技術(shù);2010年06期
4 金瑋;孫甲松;;漢語(yǔ)語(yǔ)音識(shí)別中語(yǔ)言模型的并行優(yōu)化[J];電聲技術(shù);2010年08期
5 李戰(zhàn)明;遲洋;;基于DSP的說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)[J];電子測(cè)量技術(shù);2009年05期
6 范斐斐;李振波;陳佳品;;基于K均值分段的語(yǔ)音識(shí)別在微機(jī)器人控制系統(tǒng)中的應(yīng)用[J];電子技術(shù)應(yīng)用;2006年05期
7 劉震;王厚軍;龍兵;張治國(guó);;一種基于加權(quán)隱馬爾可夫的自回歸狀態(tài)預(yù)測(cè)模型[J];電子學(xué)報(bào);2009年10期
8 王作英;孫健;;一般拓?fù)浣Y(jié)構(gòu)的非齊次隱含馬爾科夫模型及其在中、英文語(yǔ)種辨識(shí)中的應(yīng)用[J];電子與信息學(xué)報(bào);2007年04期
9 蘇騰榮;吳及;王作英;;基于空間相關(guān)性變換的聲學(xué)模型訓(xùn)練[J];電子與信息學(xué)報(bào);2010年04期
10 王維強(qiáng);;ADSP-BF531在嵌入式語(yǔ)音識(shí)別系統(tǒng)中的應(yīng)用[J];電子設(shè)計(jì)工程;2012年12期
相關(guān)會(huì)議論文 前3條
1 曹劍芬;李愛軍;胡方;張利剛;;從“2”與“8”的語(yǔ)音辨識(shí)看語(yǔ)音學(xué)知識(shí)在識(shí)別中的應(yīng)用前景[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
2 魏峰;徐成;曾祺;;基于HMM的語(yǔ)音識(shí)別技術(shù)研究[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
3 周躍海;李芳蘭;童峰;洪青陽(yáng);;噪聲環(huán)境下麥克風(fēng)陣列語(yǔ)音增強(qiáng)與HMM識(shí)別聯(lián)合處理[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)碩士學(xué)位論文 前10條
1 丁大偉;電子交易中軟件運(yùn)行時(shí)行為分析與預(yù)測(cè)[D];湖南工業(yè)大學(xué);2010年
2 朝木日樂格;基于支持向量機(jī)的蒙古語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];內(nèi)蒙古大學(xué);2011年
3 周慧芳;基于HMM的嵌入式語(yǔ)音識(shí)別系統(tǒng)的研究[D];廣東工業(yè)大學(xué);2011年
4 丁玉忠;基于電話語(yǔ)音的維吾爾語(yǔ)關(guān)鍵詞識(shí)別系統(tǒng)研究[D];新疆大學(xué);2011年
5 文林;基于改進(jìn)MFCC的語(yǔ)音識(shí)別系統(tǒng)研究及設(shè)計(jì)[D];中南大學(xué);2011年
6 張林林;漢語(yǔ)語(yǔ)文轉(zhuǎn)換中NHMM算法和音庫(kù)詞庫(kù)設(shè)計(jì)的研究[D];西南交通大學(xué);2011年
7 饒耀全;基于HTK的漢語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];安徽大學(xué);2011年
8 李鵬;大型呼叫系統(tǒng)中數(shù)據(jù)管理分析平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2009年
9 王博;基于高斯混合模型的咳嗽音檢測(cè)研究[D];重慶大學(xué);2011年
10 孫志鵬;人臉分形特征提取與識(shí)別算法研究[D];遼寧工程技術(shù)大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊占軍;楊英杰;王強(qiáng);;基于DSP的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];東北電力大學(xué)學(xué)報(bào);2006年02期
2 陳紫強(qiáng);劉慶華;;一種語(yǔ)音信號(hào)處理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J];電聲技術(shù);2006年04期
3 韓存環(huán);陳利學(xué);宋吉慧;;幾種SIP穿越NAT解決方案的比較[J];電信快報(bào);2008年05期
4 謝學(xué)軍;葉以正;邱善勤;喻明艷;;基于馬爾可夫模型的數(shù)據(jù)值預(yù)取方案[J];電子學(xué)報(bào);2007年02期
5 張杰,黃志同,王曉蘭;語(yǔ)音識(shí)別中隱馬爾可夫模型狀態(tài)數(shù)的選取原則及研究[J];計(jì)算機(jī)工程與應(yīng)用;2000年01期
6 王朋,陳樹中;基于混合模型HMM/RBF的數(shù)字語(yǔ)音識(shí)別[J];計(jì)算機(jī)工程;2002年12期
7 鄺航宇;張軍;季飛;韋崗;;一種基于聯(lián)合得分的孤立詞語(yǔ)音識(shí)別系統(tǒng)[J];計(jì)算機(jī)工程;2006年10期
8 鄭方 ,張國(guó)亮 ,宋戰(zhàn)江;Comparison of Different Implementations of MFCC[J];Journal of Computer Science and Technology;2001年06期
9 萬(wàn)春,黃杰圣,曹煦暉;基于DTW的孤立詞語(yǔ)音識(shí)別研究和算法改進(jìn)[J];計(jì)算機(jī)與現(xiàn)代化;2003年11期
10 顏龍;劉剛;郭軍;;基于小波分析的大詞匯漢語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)魯棒性的研究[J];中文信息學(xué)報(bào);2006年02期
相關(guān)碩士學(xué)位論文 前1條
1 胡益平;基于GMM的說(shuō)話人識(shí)別技術(shù)研究與實(shí)現(xiàn)[D];廈門大學(xué);2007年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;語(yǔ)音識(shí)別[J];中國(guó)會(huì)計(jì)電算化;2000年02期
2 雅文;語(yǔ)音識(shí)別新天地[J];中國(guó)計(jì)算機(jī)用戶;2000年05期
3 姚文冰,姚天任,韓濤;穩(wěn)健語(yǔ)音識(shí)別技術(shù)發(fā)展現(xiàn)狀及展望[J];信號(hào)處理;2001年06期
4 雙中;語(yǔ)音識(shí)別芯片及應(yīng)用[J];貴州科學(xué);2002年04期
5 何湘智;語(yǔ)音識(shí)別的研究與發(fā)展[J];計(jì)算機(jī)與現(xiàn)代化;2002年03期
6 唐昌文;一種孤立字語(yǔ)音識(shí)別的新方法[J];通信技術(shù);2002年08期
7 王玉偉,張磊,韓紀(jì)慶;一種基于非線性特征的應(yīng)力影響下變異語(yǔ)音識(shí)別方法[J];信號(hào)處理;2002年05期
8 余鵬,王作英;語(yǔ)音識(shí)別中空間相關(guān)性信息的利用[J];電子學(xué)報(bào);2002年07期
9 韓紀(jì)慶;一種語(yǔ)音識(shí)別中的環(huán)境自適應(yīng)方法[J];計(jì)算機(jī)工程與應(yīng)用;2002年01期
10 王作英,趙蕤;高斯樣本模式混淆度分析及其在語(yǔ)音識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2002年18期
相關(guān)會(huì)議論文 前10條
1 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
2 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
3 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
4 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
5 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語(yǔ)音識(shí)別算法研究[A];第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1998年
7 杜利民;;語(yǔ)音識(shí)別中的魯棒性問題[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
8 葛余博;謝新艷;葛菱南;楊楠;胡波;;計(jì)算機(jī)語(yǔ)音識(shí)別的新參數(shù)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
9 張化云;韓兆兵;徐波;;電話語(yǔ)音翻譯中的語(yǔ)音識(shí)別研究[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
10 張晴晴;潘接林;;模糊發(fā)音字典在方言口音語(yǔ)音識(shí)別中的應(yīng)用[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年
2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年
4 樂天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年
10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
相關(guān)博士學(xué)位論文 前10條
1 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
2 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
3 孫f,
本文編號(hào):1548507
本文鏈接:http://sikaile.net/kejilunwen/wltx/1548507.html