基于希爾伯特空間的超球覆蓋語音識(shí)別算法研究
本文關(guān)鍵詞:基于希爾伯特空間的超球覆蓋語音識(shí)別算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語音識(shí)別是語音鏈的一環(huán),其最終目的是使計(jì)算機(jī)聽懂任何人、任何內(nèi)容的講話。語音識(shí)別技術(shù)作為一門交叉學(xué)科,在家電產(chǎn)品、智能玩具、商業(yè)系統(tǒng)的數(shù)據(jù)庫語音查詢、工業(yè)生產(chǎn)部門的語聲控制、電話與電信系統(tǒng)的自動(dòng)撥號(hào)等領(lǐng)域得到了非常廣泛的應(yīng)用。雖然語音識(shí)別技術(shù)已經(jīng)取得了一些成就,但是由于語音信號(hào)的多樣性和復(fù)雜性,目前的語音識(shí)別效率還有待提高,因而開發(fā)高效率語音識(shí)別模型和算法成為語音識(shí)別研究中的一個(gè)重要課題。本文分別對(duì)語音識(shí)別技術(shù)中的預(yù)處理、特征提取和模式識(shí)別進(jìn)行了細(xì)致的研究,其主要內(nèi)容有:為了研究語音識(shí)別與何種參數(shù)相關(guān),本文做了相關(guān)的特征提取實(shí)驗(yàn),將現(xiàn)有的時(shí)域特征、頻域特征及時(shí)頻域特征進(jìn)行對(duì)比分析,發(fā)現(xiàn)時(shí)頻域特征才是語音識(shí)別的特征關(guān)鍵,通過對(duì)時(shí)頻譜的簡化,得到了一個(gè)新的語音時(shí)頻特征——過零譜,再經(jīng)由大量實(shí)驗(yàn)證明,過零譜是一種可以實(shí)現(xiàn)簡單且識(shí)別效率高的語音特征函數(shù)。針對(duì)現(xiàn)有的語音識(shí)別模型雖精確度高但是計(jì)算復(fù)雜的特點(diǎn),提出了一種高識(shí)別率,低復(fù)雜度的語音識(shí)別模型——基于希爾伯特空間的超球覆蓋識(shí)別算法,該算法不用做FFT。通過反復(fù)實(shí)驗(yàn),可知該算法在算法復(fù)雜度上低于傳統(tǒng)的語音識(shí)別算法,而在語音識(shí)別的準(zhǔn)確率上不低于傳統(tǒng)的語音識(shí)別算法。本文通過提出了一種新的特征提取方法,并用基于希爾伯特空間的超球覆蓋識(shí)別算法進(jìn)行識(shí)別,經(jīng)在MATLAB上進(jìn)行仿真,得到的結(jié)果表明該算法運(yùn)行速度快,識(shí)別率高。本文的研究主要應(yīng)用于低速率嵌入式系統(tǒng)中,當(dāng)前語音識(shí)別算法相對(duì)較復(fù)雜,導(dǎo)致了語音芯片昂貴,今后將繼續(xù)朝著語音識(shí)別實(shí)時(shí)、準(zhǔn)確和語音識(shí)別系統(tǒng)價(jià)格低廉的方向努力,這樣才能使語音識(shí)別更有應(yīng)用價(jià)值,尤其是在物聯(lián)網(wǎng)和智能家居上。
【關(guān)鍵詞】:語音識(shí)別 特征提取 過零譜 希爾伯特空間 超球覆蓋
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-8
- 第一章 緒論8-13
- 1.1 語音識(shí)別技術(shù)概述8-9
- 1.2 語音識(shí)別的發(fā)展和現(xiàn)狀9-11
- 1.2.1 國外發(fā)展歷史及現(xiàn)狀9-10
- 1.2.2 國內(nèi)發(fā)展歷史及現(xiàn)狀10-11
- 1.3 課題研究背景及意義11-12
- 1.4 本文的創(chuàng)新點(diǎn)12
- 1.5 本文內(nèi)容安排12-13
- 第二章 語音識(shí)別技術(shù)基本原理13-21
- 2.1 語音識(shí)別系統(tǒng)構(gòu)成13-15
- 2.2 語音信號(hào)預(yù)處理15-19
- 2.2.1 語音信號(hào)的預(yù)加重處理15
- 2.2.2 語音信號(hào)的加窗分幀15-17
- 2.2.3 語音信號(hào)的端點(diǎn)檢測17-19
- 2.3 語音識(shí)別特征提取19-20
- 2.4 模式識(shí)別算法20
- 2.5 本章小結(jié)20-21
- 第三章 特征參數(shù)過零譜的提取21-30
- 3.1 常用特征參數(shù)提取21-25
- 3.1.1 線性預(yù)測系數(shù)(LPC)21-22
- 3.1.2 線性預(yù)測倒譜系數(shù)(LPCC)22-23
- 3.1.3 Mel頻率倒譜系數(shù)(MFCC)23-25
- 3.2 新的特征參數(shù)提取25-29
- 3.3 本章小結(jié)29-30
- 第四章 基于希爾伯特空間的超球覆蓋算法30-48
- 4.1 常用識(shí)別算法30-38
- 4.1.1 動(dòng)態(tài)時(shí)間規(guī)整(DTW)30-33
- 4.1.2 隱馬爾可夫模型(HMM)33-38
- 4.2 算法基本思想38-40
- 4.3 算法具體實(shí)現(xiàn)40-46
- 4.3.1 模板訓(xùn)練過程40-45
- 4.3.2 匹配識(shí)別過程45-46
- 4.4 本章小結(jié)46-48
- 第五章 總結(jié)與展望48-50
- 5.1 總結(jié)48
- 5.2 展望48-50
- 參考文獻(xiàn)50-53
- 攻讀學(xué)位期間取得的研究成果53-54
- 致謝54
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭遠(yuǎn)瓊;提高語音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期
2 邢文;語音識(shí)別[J];個(gè)人電腦;2000年02期
3 ;語音識(shí)別的真相[J];個(gè)人電腦;2001年12期
4 ;語音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期
5 ;微軟語音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期
6 ;語音識(shí)別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語音識(shí)別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識(shí)別中的應(yīng)用[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識(shí)別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國聲學(xué)學(xué)會(huì)2010年全國會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識(shí)別部件的研制[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識(shí)別的幾個(gè)問題(一)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對(duì)語音識(shí)別影響的探討[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 黃夢(mèng);方案商積極切入語音識(shí)別市場[N];電腦商報(bào);2006年
2 閆婷;語音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國計(jì)算機(jī)報(bào);2008年
4 樂天;語音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年
10 張彤;語音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識(shí)別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語的語音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號(hào):456153
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/456153.html