一種面向NAO機(jī)器人的語(yǔ)音識(shí)別系統(tǒng)研究
發(fā)布時(shí)間:2021-01-15 09:34
研究和實(shí)現(xiàn)機(jī)器人的智能化,對(duì)提高人類(lèi)生活品質(zhì)有十分重要的意義。而研究機(jī)器人語(yǔ)音識(shí)別系統(tǒng),實(shí)現(xiàn)人機(jī)自由交互是智能機(jī)器人提供智能服務(wù)的前提。NAO機(jī)器人作為全球科研應(yīng)用最廣泛的機(jī)器人之一,對(duì)NAO機(jī)器人進(jìn)行相關(guān)的語(yǔ)音識(shí)別系統(tǒng)的研究具有重要的意義和價(jià)值。本文為實(shí)現(xiàn)人與NAO機(jī)器人之間的智能交互,設(shè)計(jì)了一種面向NAO機(jī)器人的語(yǔ)音識(shí)別系統(tǒng)的聯(lián)合實(shí)驗(yàn)平臺(tái)。首先,對(duì)語(yǔ)音識(shí)別的發(fā)展歷程和研究現(xiàn)狀進(jìn)行了分析,研究了語(yǔ)音識(shí)別技術(shù)的基本原理和信號(hào)處理技術(shù),研究了短時(shí)能量、短時(shí)過(guò)零率、雙門(mén)限法三種端點(diǎn)檢測(cè)方法,并對(duì)雙門(mén)限法原理進(jìn)行了深入分析;對(duì)語(yǔ)音信號(hào)的三種特征提取技術(shù)包括線(xiàn)性預(yù)測(cè)系數(shù)(LPC)、線(xiàn)性預(yù)測(cè)倒譜系數(shù)(LPCC)和Mel頻譜倒譜系數(shù)(MFCC)進(jìn)行了深入的分析和研究,并對(duì)線(xiàn)性預(yù)測(cè)倒譜系數(shù)和Mel頻譜倒譜系數(shù)兩種特征提取方法進(jìn)行了特征參數(shù)對(duì)比實(shí)驗(yàn),通過(guò)對(duì)比表明基于Mel頻譜倒譜系數(shù)的特征提取方法具有更高的匹配度。其次,在對(duì)語(yǔ)音識(shí)別的模型和算法進(jìn)行了總結(jié)歸納的基礎(chǔ)上,研究了動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法和隱馬爾可夫(HMM)模型兩種語(yǔ)音識(shí)別模型算法;分析了DTW算法的基本原理,研究了基于整體路徑約束和搜索...
【文章來(lái)源】:重慶交通大學(xué)重慶市
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別系統(tǒng)原理圖
語(yǔ)音識(shí)別系統(tǒng)按照不同的分類(lèi)標(biāo)準(zhǔn)可以分為以下幾類(lèi):1) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的大小分:小詞匯量、中等詞匯量、大詞匯量;2) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的發(fā)音方式分:孤立詞、連接詞、連續(xù)詞;3) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的說(shuō)話(huà)人分:特定人、非特定人;4) 按照語(yǔ)音識(shí)別系統(tǒng)中識(shí)別原理分:模板匹配模型、隨機(jī)模型、概率語(yǔ)法分析。2.3 語(yǔ)音信號(hào)預(yù)處理由于本文所有使用的語(yǔ)音訓(xùn)練和識(shí)別樣本均是在實(shí)驗(yàn)室環(huán)境下錄制的,錄制環(huán)境存在一定的噪聲干擾,因此在對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行訓(xùn)練和識(shí)別前需要對(duì)原始訓(xùn)練語(yǔ)音樣本和待識(shí)別語(yǔ)音樣本進(jìn)行預(yù)處理,即加入高通濾波器和預(yù)加重,這樣做的目的不僅可以消除原始語(yǔ)音信號(hào)中的噪音,而且還能對(duì)一些衰弱的信號(hào)進(jìn)行適當(dāng)?shù)脑鰪?qiáng),最大限度上保留了語(yǔ)音信號(hào)的內(nèi)容不被破壞。語(yǔ)音信號(hào)預(yù)處理流程圖如 2-2 圖所示
重慶交通大學(xué)碩士學(xué)位論文加窗號(hào)是隨時(shí)間而變化,體現(xiàn)出語(yǔ)音信號(hào)的時(shí)變性;根據(jù)發(fā)極短的時(shí)間內(nèi)(10ms-30ms)又可以認(rèn)為近似不變,體現(xiàn)性。根據(jù)以上知識(shí),我們可以把連續(xù)的語(yǔ)音信號(hào),分成極理,然后加上固定的窗長(zhǎng)函數(shù),只處理窗內(nèi)的信號(hào),這一形式為:n) s(m) (n m)m 是通過(guò)對(duì)信號(hào)加上有限長(zhǎng)度的平移窗口來(lái)實(shí)現(xiàn)的,為了保幀的連續(xù)性,信號(hào)中兩幀之間采用交疊分段的方法平滑過(guò)延續(xù)性。如圖 2-4 所示,第 k 幀和第 k+1 幀的交疊部分稱(chēng)長(zhǎng)的一半。
【參考文獻(xiàn)】:
期刊論文
[1]基于多窗頻譜估計(jì)和平滑幅度譜包絡(luò)的Mel頻率倒譜系數(shù)(MFCC)改進(jìn)算法[J]. 張怡然,白靜,王力. 科學(xué)技術(shù)與工程. 2014(19)
[2]基于DTW的語(yǔ)音識(shí)別應(yīng)用系統(tǒng)研究與實(shí)現(xiàn)[J]. 萬(wàn)春. 集美大學(xué)學(xué)報(bào)(自然科學(xué)版). 2002(02)
[3]語(yǔ)音信號(hào)互信息估計(jì)的非線(xiàn)性搜索算法及識(shí)別應(yīng)用[J]. 俞一彪,趙鶴鳴,周旭東. 信號(hào)處理. 2002(02)
碩士論文
[1]基于HMM和DNN的語(yǔ)音識(shí)別算法研究與實(shí)現(xiàn)[D]. 袁翔.江西理工大學(xué) 2017
[2]感冒病人嗓音的特征提取與識(shí)別研究[D]. 杜朦旭.浙江大學(xué) 2016
[3]面向機(jī)器人應(yīng)用的可視化開(kāi)發(fā)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張梅.哈爾濱工業(yè)大學(xué) 2015
[4]稀疏算法在汽車(chē)駕駛語(yǔ)言語(yǔ)音識(shí)別中的應(yīng)用[D]. 張峰.東北師范大學(xué) 2015
[5]中文微博觀(guān)點(diǎn)句識(shí)別及評(píng)價(jià)對(duì)象抽取[D]. 胡默之.上海交通大學(xué) 2015
[6]基于語(yǔ)音識(shí)別的機(jī)器人控制技術(shù)研究[D]. 白琳.西南石油大學(xué) 2014
[7]基于神經(jīng)網(wǎng)絡(luò)非特定人語(yǔ)音識(shí)別與機(jī)器人控制研究[D]. 謝世強(qiáng).沈陽(yáng)工業(yè)大學(xué) 2013
[8]GD-1型擬人機(jī)器人語(yǔ)音識(shí)別研究與設(shè)計(jì)[D]. 伊磊.北方工業(yè)大學(xué) 2012
[9]小詞匯量非特定人語(yǔ)音識(shí)別系統(tǒng)的研究[D]. 周卓然.重慶大學(xué) 2012
[10]基于HMM的機(jī)器人語(yǔ)音識(shí)別系統(tǒng)的研究[D]. 付維.武漢科技大學(xué) 2011
本文編號(hào):2978671
【文章來(lái)源】:重慶交通大學(xué)重慶市
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別系統(tǒng)原理圖
語(yǔ)音識(shí)別系統(tǒng)按照不同的分類(lèi)標(biāo)準(zhǔn)可以分為以下幾類(lèi):1) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的大小分:小詞匯量、中等詞匯量、大詞匯量;2) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的發(fā)音方式分:孤立詞、連接詞、連續(xù)詞;3) 按照語(yǔ)音識(shí)別系統(tǒng)參考模板庫(kù)中訓(xùn)練樣本的說(shuō)話(huà)人分:特定人、非特定人;4) 按照語(yǔ)音識(shí)別系統(tǒng)中識(shí)別原理分:模板匹配模型、隨機(jī)模型、概率語(yǔ)法分析。2.3 語(yǔ)音信號(hào)預(yù)處理由于本文所有使用的語(yǔ)音訓(xùn)練和識(shí)別樣本均是在實(shí)驗(yàn)室環(huán)境下錄制的,錄制環(huán)境存在一定的噪聲干擾,因此在對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行訓(xùn)練和識(shí)別前需要對(duì)原始訓(xùn)練語(yǔ)音樣本和待識(shí)別語(yǔ)音樣本進(jìn)行預(yù)處理,即加入高通濾波器和預(yù)加重,這樣做的目的不僅可以消除原始語(yǔ)音信號(hào)中的噪音,而且還能對(duì)一些衰弱的信號(hào)進(jìn)行適當(dāng)?shù)脑鰪?qiáng),最大限度上保留了語(yǔ)音信號(hào)的內(nèi)容不被破壞。語(yǔ)音信號(hào)預(yù)處理流程圖如 2-2 圖所示
重慶交通大學(xué)碩士學(xué)位論文加窗號(hào)是隨時(shí)間而變化,體現(xiàn)出語(yǔ)音信號(hào)的時(shí)變性;根據(jù)發(fā)極短的時(shí)間內(nèi)(10ms-30ms)又可以認(rèn)為近似不變,體現(xiàn)性。根據(jù)以上知識(shí),我們可以把連續(xù)的語(yǔ)音信號(hào),分成極理,然后加上固定的窗長(zhǎng)函數(shù),只處理窗內(nèi)的信號(hào),這一形式為:n) s(m) (n m)m 是通過(guò)對(duì)信號(hào)加上有限長(zhǎng)度的平移窗口來(lái)實(shí)現(xiàn)的,為了保幀的連續(xù)性,信號(hào)中兩幀之間采用交疊分段的方法平滑過(guò)延續(xù)性。如圖 2-4 所示,第 k 幀和第 k+1 幀的交疊部分稱(chēng)長(zhǎng)的一半。
【參考文獻(xiàn)】:
期刊論文
[1]基于多窗頻譜估計(jì)和平滑幅度譜包絡(luò)的Mel頻率倒譜系數(shù)(MFCC)改進(jìn)算法[J]. 張怡然,白靜,王力. 科學(xué)技術(shù)與工程. 2014(19)
[2]基于DTW的語(yǔ)音識(shí)別應(yīng)用系統(tǒng)研究與實(shí)現(xiàn)[J]. 萬(wàn)春. 集美大學(xué)學(xué)報(bào)(自然科學(xué)版). 2002(02)
[3]語(yǔ)音信號(hào)互信息估計(jì)的非線(xiàn)性搜索算法及識(shí)別應(yīng)用[J]. 俞一彪,趙鶴鳴,周旭東. 信號(hào)處理. 2002(02)
碩士論文
[1]基于HMM和DNN的語(yǔ)音識(shí)別算法研究與實(shí)現(xiàn)[D]. 袁翔.江西理工大學(xué) 2017
[2]感冒病人嗓音的特征提取與識(shí)別研究[D]. 杜朦旭.浙江大學(xué) 2016
[3]面向機(jī)器人應(yīng)用的可視化開(kāi)發(fā)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張梅.哈爾濱工業(yè)大學(xué) 2015
[4]稀疏算法在汽車(chē)駕駛語(yǔ)言語(yǔ)音識(shí)別中的應(yīng)用[D]. 張峰.東北師范大學(xué) 2015
[5]中文微博觀(guān)點(diǎn)句識(shí)別及評(píng)價(jià)對(duì)象抽取[D]. 胡默之.上海交通大學(xué) 2015
[6]基于語(yǔ)音識(shí)別的機(jī)器人控制技術(shù)研究[D]. 白琳.西南石油大學(xué) 2014
[7]基于神經(jīng)網(wǎng)絡(luò)非特定人語(yǔ)音識(shí)別與機(jī)器人控制研究[D]. 謝世強(qiáng).沈陽(yáng)工業(yè)大學(xué) 2013
[8]GD-1型擬人機(jī)器人語(yǔ)音識(shí)別研究與設(shè)計(jì)[D]. 伊磊.北方工業(yè)大學(xué) 2012
[9]小詞匯量非特定人語(yǔ)音識(shí)別系統(tǒng)的研究[D]. 周卓然.重慶大學(xué) 2012
[10]基于HMM的機(jī)器人語(yǔ)音識(shí)別系統(tǒng)的研究[D]. 付維.武漢科技大學(xué) 2011
本文編號(hào):2978671
本文鏈接:http://sikaile.net/kejilunwen/wltx/2978671.html
最近更新
教材專(zhuān)著