彝語孤立詞識別研究
發(fā)布時間:2017-04-03 03:04
本文關鍵詞:彝語孤立詞識別研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語音識別是模式識別與人工智能的研究熱點之一。彝語語音識別是語音識別研究領域的一個新方向。目前,已經(jīng)有英語、漢語等語音識別產(chǎn)品投入商用。國內(nèi)對漢語音識別的研究已發(fā)展到大詞匯量、連續(xù)語音和魯棒性語音識別,相比之下少數(shù)民族語言語音識別研究卻很滯后,尤其是對擁有871萬(2010年統(tǒng)計數(shù)據(jù))使用者的彝語,基本未見有語音識別的研究。因此,彝語語音識別研究具有重要意義,一方面使彝族同胞享受科技帶來的便利,促進各民族的交流與共同發(fā)展;另一方面可以更好地傳承彝族優(yōu)秀文化,提升我國文化底蘊。本文在詳細分析彝語特點、彝語音信號預處理技術后,對彝語音信號的特征參數(shù)做了深入探討,尤其是經(jīng)典的線性預測倒譜系數(shù)和梅爾頻率倒譜系數(shù)。比較了不同階數(shù)的線性預測倒譜系數(shù)和梅爾頻率倒譜系數(shù)及其差分參數(shù)對本文研究的彝語孤立詞識別系統(tǒng)識別率的影響。實驗結(jié)果表明,12階梅爾頻率倒譜系數(shù)具有最高的識別率,最適合作為本文研究系統(tǒng)的特征參數(shù)。支持向量機在小樣本的現(xiàn)實條件下相比于隱馬爾科夫模型、人工神經(jīng)網(wǎng)絡等常用的語音識別算法具有更好的泛化能力和分類正確率,且其通過引入核函數(shù)可以較好地解決線性不可分問題。最小二乘支持向量機與標準支持向量機相比,將凸二次規(guī)劃的求解轉(zhuǎn)化為解線性方程,具有更快地收斂速度從而減少了求解時的資源占用,并且通過采用最小二乘支持向量機對漢語語音進行識別,驗證了其在語音識別系統(tǒng)中的有效性,因此本文嘗試使用最小二乘支持向量機作為識別算法。此外本文采用識別率、識別時間和模型訓練時間三個指標對比了幾種核函數(shù)在本文所研究系統(tǒng)中的性能,結(jié)果表明高斯核函數(shù)具有較好地表現(xiàn),在此基礎上,引入動態(tài)時間規(guī)整算法對高斯核函數(shù)進行了改進,實驗結(jié)果表明,改進的高斯核函數(shù)在特定的實驗環(huán)境下具有更好的性能。
【關鍵詞】:彝語 孤立詞識別 最小二乘支持向量機 高斯核函數(shù)
【學位授予單位】:昆明理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要5-6
- Abstract6-12
- 第一章 緒論12-18
- 1.1 引言12
- 1.2 國內(nèi)外研究現(xiàn)狀12-15
- 1.3 本文研究目的15-16
- 1.4 本文研究內(nèi)容16-18
- 第二章 彝語音識別系統(tǒng)基本理論18-30
- 2.1 彝語音特點分析18-19
- 2.2 彝語音識別基本原理19-21
- 2.2.1 彝語音識別基本結(jié)構(gòu)19-20
- 2.2.2 彝語音識別系統(tǒng)分類20
- 2.2.3 彝語音識別系統(tǒng)性能評價指標20-21
- 2.3 彝語音識別預處理21-25
- 2.3.1 彝語音信號數(shù)字化21-22
- 2.3.2 彝語音信號預加重22-23
- 2.3.3 彝語音信號加窗、分幀及端點檢測23-25
- 2.4 彝語音信號的特征參數(shù)25-28
- 2.4.1 線性預測倒譜系數(shù)LPCC25-26
- 2.4.2 梅爾頻率倒譜系數(shù)MFCC26-28
- 2.5 本章小結(jié)28-30
- 第三章 彝語孤立詞識別算法研究30-50
- 3.1 引言30
- 3.2 DTW算法原理30-36
- 3.2.1 DTW的搜索路徑31-32
- 3.2.2 DTW的算法實現(xiàn)32-36
- 3.3 統(tǒng)計學習理論36-39
- 3.3.1 機器學習問題簡述36-37
- 3.3.2 經(jīng)驗風險最小化37
- 3.3.3 VC維和泛化能力的界37-38
- 3.3.4 結(jié)構(gòu)風險最小化38-39
- 3.4 最小二乘支持向量機和核函數(shù)39-49
- 3.4.1 支持向量機39-43
- 3.4.2 最小二乘支持向量機43-44
- 3.4.3 核函數(shù)44-46
- 3.4.4 改進高斯核函數(shù)46-49
- 3.5 本章小結(jié)49-50
- 第四章 基于LSSVM的彝語孤立詞識別50-58
- 4.1 引言50
- 4.2 數(shù)據(jù)采集與預處理50-51
- 4.3 不同彝語語音特征參數(shù)識別率比較51-56
- 4.4 基于不同核函數(shù)的LSSVM識別結(jié)果及分析56-57
- 4.5 本章小結(jié)57-58
- 第五章 總結(jié)與展望58-60
- 5.1 論文主要工作58-59
- 5.2 研究展望59-60
- 致謝60-62
- 參考文獻62-68
- 附錄68
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 張小云,劉允才;高斯核支撐向量機的性能分析[J];計算機工程;2003年08期
2 李冠宇;于洪志;李永宏;馬寧;;基于決策樹的藏語拉薩話三音子模型[J];計算機工程與科學;2013年09期
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 陳其松;智能優(yōu)化支持向量機預測算法及應用研究[D];貴州大學;2009年
2 寧愛平;人工蜂群算法及其在語音識別中的應用研究[D];太原理工大學;2013年
本文關鍵詞:彝語孤立詞識別研究,,由筆耕文化傳播整理發(fā)布。
本文編號:283594
本文鏈接:http://sikaile.net/kejilunwen/wltx/283594.html
最近更新
教材專著