基于嵌入式的一種快速孤立詞識(shí)別方法研究與應(yīng)用
本文關(guān)鍵詞:基于嵌入式的一種快速孤立詞識(shí)別方法研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:要讓機(jī)器“聽懂”人的說話,首先必須進(jìn)行語音識(shí)別,所以語音識(shí)別技術(shù)是智能技術(shù)中的一個(gè)重要分支。隨著HMM理論的相對(duì)成熟,語音識(shí)別技術(shù)也逐漸走入人們的生活,然而后續(xù)的理論發(fā)展緩慢,昂貴的語音識(shí)別芯片,影響了語音識(shí)別技術(shù)的推廣,現(xiàn)在我們面臨的問題主要有:第一,語音特征參數(shù)提取的不準(zhǔn)確;第二,語音識(shí)別模型過于復(fù)雜化。本文針對(duì)上述兩個(gè)方面存在的問題,提出新的算法改進(jìn)。為了研究“語音識(shí)別與何種參數(shù)相關(guān)”,做了有關(guān)的特征提取實(shí)驗(yàn),將現(xiàn)有的時(shí)域特征、頻域特征及時(shí)頻域特征進(jìn)行對(duì)比分析,發(fā)現(xiàn)時(shí)頻域特征才是語音識(shí)別的特征關(guān)鍵,通過對(duì)時(shí)頻譜的簡化,得到一個(gè)新的時(shí)頻特征——過零譜,再經(jīng)由大量實(shí)驗(yàn)證明,過零譜是一種可以實(shí)現(xiàn)簡單且識(shí)別效率高的特征函數(shù)。針對(duì)現(xiàn)有的語音識(shí)別模型雖精確度高但是計(jì)算復(fù)雜的特點(diǎn),提出了一種高識(shí)別率,低復(fù)雜度的語音識(shí)別模型——基于超球串的仿生模式識(shí)別算法,通過反復(fù)實(shí)驗(yàn),與動(dòng)態(tài)時(shí)間規(guī)整(DTW)、隱馬爾科夫模型(HMM)對(duì)比分析,可知仿生模式識(shí)別在算法復(fù)雜度上遠(yuǎn)遠(yuǎn)低于其他幾種算法,而識(shí)別的準(zhǔn)確率不低于其他語音識(shí)別算法。對(duì)于現(xiàn)有的語音識(shí)別模型,特征參數(shù)提取過程復(fù)雜,計(jì)算量大,耗時(shí)長致使在低性能的嵌入式系統(tǒng)上難于實(shí)現(xiàn),從而導(dǎo)致語音芯片或語音識(shí)別系統(tǒng)昂貴的問題,本文通過提出了一種新的特征提取方法,并用仿生模式識(shí)別算法進(jìn)行識(shí)別,經(jīng)MATLAB上進(jìn)行仿真結(jié)果表明,該算法運(yùn)行速度快,識(shí)別率高。將該算法移植到STM32上,實(shí)現(xiàn)了孤立詞識(shí)別。本文的研究有廣泛的應(yīng)用價(jià)值,隨著人們對(duì)生活質(zhì)量要求越來越高,也要求語音識(shí)別能夠在準(zhǔn)確率、識(shí)別速度、價(jià)格等方面獲得更大的綜合優(yōu)勢(shì),我們?cè)谶@方面的工作是一種有益的嘗試。
【關(guān)鍵詞】:語音識(shí)別 特征提取 過零譜 STM32 仿生模式識(shí)別
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
- 摘要2-3
- Abstract3-7
- 第一章 緒論7-14
- 1.1 引言7
- 1.2 課題背景、目的和意義7-9
- 1.3 發(fā)展歷史、國內(nèi)外研究現(xiàn)狀及未來發(fā)展趨勢(shì)9-12
- 1.3.1 語音識(shí)別發(fā)展歷史和國內(nèi)外研究現(xiàn)狀9-11
- 1.3.2 語音識(shí)別未來發(fā)展趨勢(shì)11-12
- 1.4 論文主要研究內(nèi)容及創(chuàng)新點(diǎn)12
- 1.5 論文結(jié)構(gòu)安排12-14
- 第二章 語音識(shí)別技術(shù)14-19
- 2.1 語音識(shí)別系統(tǒng)的基本結(jié)構(gòu)14
- 2.2 語音信號(hào)預(yù)處理14-17
- 2.2.1 語音信號(hào)的預(yù)加重14-15
- 2.2.2 語音信號(hào)的加窗分幀15
- 2.2.3 語音信號(hào)的端點(diǎn)檢測(cè)15-17
- 2.3 語音識(shí)別特征參數(shù)提取17-18
- 2.4 語音識(shí)別算法18
- 2.5 本章小結(jié)18-19
- 第三章 基于過零譜的特征提取算法19-29
- 3.1 常用特征參數(shù)提取算法19-22
- 3.1.1 線性預(yù)測(cè)倒譜參數(shù)(LPCC)19-20
- 3.1.2 梅爾頻率倒譜系數(shù)(MFCC)20-22
- 3.2 新的特征提取算法——過零譜22-26
- 3.3 幾種特征提取算法的比較26-29
- 第四章 基于超球串仿生模式識(shí)別的語音識(shí)別算法29-38
- 4.1 常用語音識(shí)別算法29-33
- 4.1.1 動(dòng)態(tài)時(shí)間規(guī)整算法DTW29-30
- 4.1.2 HMM30-33
- 4.2 改進(jìn)的仿生模式識(shí)別算法33-37
- 4.3 語音識(shí)別算法復(fù)雜度分析37-38
- 第五章 系統(tǒng)軟硬件實(shí)現(xiàn)38-50
- 5.1 系統(tǒng)軟件實(shí)現(xiàn)38-43
- 5.1.1 系統(tǒng)軟件設(shè)計(jì)的總體介紹38-39
- 5.1.2 系統(tǒng)軟件功能設(shè)計(jì)39-40
- 5.1.3 端點(diǎn)檢測(cè)算法的軟件實(shí)現(xiàn)40-41
- 5.1.4 提取特征參數(shù)算法的軟件實(shí)現(xiàn)41-42
- 5.1.5 基于超球串的仿生模式識(shí)別算法的軟件實(shí)現(xiàn)42-43
- 5.2 系統(tǒng)硬件構(gòu)成43-50
- 第六章 總結(jié)與展望50-52
- 6.1 總結(jié)50
- 6.2 未來展望50-52
- 參考文獻(xiàn)52-55
- 附錄55-56
- 攻讀學(xué)位期間取得的研究成果56-57
- 攻讀學(xué)位期間參與部分項(xiàng)目57-58
- 致謝58-60
- 附件60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 王守覺;仿生模式識(shí)別(拓?fù)淠J阶R(shí)別)——一種模式識(shí)別新模型的理論與應(yīng)用[J];電子學(xué)報(bào);2002年10期
2 閻福智;;語音信號(hào)處理中特征提取方法研究[J];中國新通信;2013年21期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張延盛;孤立詞語音識(shí)別算法研究及DSP實(shí)現(xiàn)[D];南京信息工程大學(xué);2011年
2 李碩;孤立詞語音識(shí)別算法的研究和實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
3 吳艷艷;孤立詞語音識(shí)別的關(guān)鍵技術(shù)研究[D];青島大學(xué);2012年
4 馬靜霞;帶噪語音端點(diǎn)檢測(cè)方法的研究[D];燕山大學(xué);2007年
5 程曉偉;非特定人孤立詞語音識(shí)別算法研究與實(shí)驗(yàn)分析[D];中國地質(zhì)大學(xué)(北京);2009年
6 郭偉;基于聽覺神經(jīng)原理的語音信號(hào)處理[D];上海交通大學(xué);2009年
7 劉釗;孤立詞語音識(shí)別算法研究及其FPGA實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2008年
8 陳濤;基于DSP的語音信號(hào)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];成都理工大學(xué);2010年
9 熊洋;基于小詞匯量語音識(shí)別算法與TTS系統(tǒng)的車聯(lián)網(wǎng)移動(dòng)終端研究與實(shí)現(xiàn)[D];北京交通大學(xué);2013年
10 陳衛(wèi)強(qiáng);基于DSP的孤立詞語音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];南昌航空大學(xué);2013年
本文關(guān)鍵詞:基于嵌入式的一種快速孤立詞識(shí)別方法研究與應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):274452
本文鏈接:http://sikaile.net/kejilunwen/wltx/274452.html