基于DTW的孤立詞語音識別系統(tǒng)研究
本文關(guān)鍵詞:基于DTW的孤立詞語音識別系統(tǒng)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語言是人類最重要的交流工具,因為它自然方便、準確高效。隨著科學(xué)技術(shù)的不斷發(fā)展,社會在不斷的向前進步。各式各樣的機器設(shè)備就不可避免的融入到了人類的日常生活當(dāng)中,因此人和設(shè)備的之間的聯(lián)系相比以前發(fā)生了很大的變化,人類對設(shè)備的控制就顯得尤為重要。語言的聲學(xué)表現(xiàn)形式包含著人類的語音,要使機器聽懂人的語言并且能夠使用人類的語言進行表達,就需要做很多工作,這就是研究了幾十年的語音識別和語音合成技術(shù)。隨著移動通信的迅猛發(fā)展,人們可以隨時隨地通過電話進行交流,其中語音編碼技術(shù)發(fā)揮著重要的作用。 本文在目前已經(jīng)實現(xiàn)的研究階梯上,實現(xiàn)了基于DTW識別算法對孤立詞進行識別的系統(tǒng),在研究的過程當(dāng)中由于受到了噪聲環(huán)境的影響,遇到了很多意想不到的困難,研究的工作過程如下: 1.完成了一個比較具體的語音處理程序,包含了語音的錄入、預(yù)處理、訓(xùn)練、識別及結(jié)果輸出等這幾個過程。 2.詳細表述了DTW、HMM、ANN三種算法的基本原理,介紹了這個模型的最為關(guān)鍵的問題和如何克服這些問題的基本算法,描述了將DTW模型引入到現(xiàn)實的語音識別系統(tǒng)當(dāng)中的方法。 3.基于語音信號處理的原理為出發(fā)點,著重在關(guān)鍵的DTW的理論基礎(chǔ)上,具體描述了本文所研究的在孤立詞匯的基礎(chǔ)上語音識別系統(tǒng)的具體結(jié)構(gòu)以及它是由哪幾個部分組成的,包括了聲學(xué)的分析、特征狀態(tài)的提取、詞匯聲學(xué)建模、訓(xùn)練識別和最后的詞匯系統(tǒng)識別結(jié)果。
【關(guān)鍵詞】:DTW 語音識別 特征提取 孤立詞
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-5
- 目錄5-7
- 第一章 緒論7-13
- 1.1 語音識別系統(tǒng)概述7
- 1.2 語音識別研究狀況7-9
- 1.2.1 國外研究情況7-8
- 1.2.2 國內(nèi)研究情況8-9
- 1.3 語音識別技術(shù)的應(yīng)用9
- 1.4 語音識別技術(shù)的發(fā)展趨勢9-10
- 1.5 語音處理面臨的難點10-11
- 1.6 本課題的研究背景11
- 1.7 論文結(jié)構(gòu)安排11-13
- 第二章 語音信號的時頻分析及孤立詞識別關(guān)鍵技術(shù)13-27
- 2.1 語音信號的時域分析13-15
- 2.1.1 語音短時分析技術(shù)13-14
- 2.1.2 短時能量14
- 2.1.3 短時平均過零率14-15
- 2.1.4 短時自相關(guān)函數(shù)15
- 2.1.5 短時平均幅度差函數(shù)15
- 2.2 語音信號的頻域分析15-18
- 2.2.1 短時傅里葉變換15-16
- 2.2.2 語譜圖16-17
- 2.2.3 小波變換17-18
- 2.3 孤立詞識別關(guān)鍵技術(shù)18-26
- 2.3.1 語音端點檢測18
- 2.3.2 預(yù)處理18-21
- 2.3.3 特征提取21-26
- 2.4 本章總結(jié)26-27
- 第三章 語音識別的算法研究27-36
- 3.1 概述27
- 3.2 動態(tài)時間規(guī)劃(DTW)27-29
- 3.2.1 動態(tài)規(guī)劃技術(shù)(DP)27-28
- 3.2.2 DTW語音識別算法28-29
- 3.3 隱馬爾可夫模型(HMM)29-33
- 3.3.1 HMM定義29-30
- 3.3.2 HMM基本算法30-33
- 3.4 人工神經(jīng)網(wǎng)絡(luò)(ANN)33-35
- 3.4.1 人工神經(jīng)網(wǎng)絡(luò)介紹33
- 3.4.2 神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用33-35
- 3.5 幾種算法的對比分析35
- 3.6 本章總結(jié)35-36
- 第四章 系統(tǒng)的設(shè)計與實現(xiàn)36-45
- 4.1 語音識別系統(tǒng)基本流程圖36-37
- 4.2 系統(tǒng)目標37
- 4.3 運行環(huán)境37-38
- 4.3.1 硬件環(huán)境37-38
- 4.3.2 軟件環(huán)境38
- 4.4 系統(tǒng)實現(xiàn)的功能38
- 4.5 系統(tǒng)實現(xiàn)的過程38-44
- 4.6 本章總結(jié)44-45
- 第五章 結(jié)束語45-47
- 5.1 論文總結(jié)45
- 5.2 進一步的工作45-47
- 參考文獻47-50
- 致謝50
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱全勝;劉嬈;李衛(wèi)東;;語音識別技術(shù)應(yīng)用于EMS人機交互初探[J];電力系統(tǒng)自動化;2008年13期
2 顧良,劉潤生;漢語數(shù)碼語音識別:發(fā)展現(xiàn)狀、難點分析與方法比較[J];電路與系統(tǒng)學(xué)報;1997年04期
3 高靜懷,汪文秉,朱光明;小波變換與信號瞬時特征分析[J];地球物理學(xué)報;1997年06期
4 韓紀慶;邵艷秋;;基于語音信號的情感處理研究進展[J];電聲技術(shù);2006年05期
5 袁俊;HMM連續(xù)語音識別中Viterbi算法的優(yōu)化及應(yīng)用[J];電子技術(shù);2001年02期
6 柳春;;語音識別技術(shù)研究進展[J];甘肅科技;2008年09期
7 劉靜萍;姜占財;德熙嘉措;;語音信號的預(yù)處理技術(shù)探討[J];甘肅聯(lián)合大學(xué)學(xué)報(自然科學(xué)版);2006年05期
8 何振亞 ,史玉回 ,厲力華;人工神經(jīng)網(wǎng)絡(luò)[J];電信科學(xué);1991年05期
9 劉長明;任一峰;;語音識別中DTW特征匹配的改進算法研究[J];中北大學(xué)學(xué)報(自然科學(xué)版);2006年01期
10 林波;呂明;;基于DTW改進算法的孤立詞識別系統(tǒng)的仿真與分析[J];信息技術(shù);2006年04期
本文關(guān)鍵詞:基于DTW的孤立詞語音識別系統(tǒng)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:349110
本文鏈接:http://sikaile.net/kejilunwen/wltx/349110.html