基于GRU-HMM聲學(xué)模型的湖南方言辨識(shí)
發(fā)布時(shí)間:2023-06-19 19:46
20世紀(jì)90年代,方言辨識(shí)開始逐漸被越來(lái)越多的人們重視,各國(guó)的研究人員對(duì)不同種類方言的特征和分類模型進(jìn)行了大量研究,同時(shí)方言辨識(shí)在刑事案件中犯罪嫌疑人的歸屬地判定方面有重大貢獻(xiàn)。中國(guó)是一個(gè)多民族的人口大國(guó),各民族各地區(qū)的語(yǔ)言都有些許不同,因此,為了能夠更好的推廣語(yǔ)音識(shí)別技術(shù)的應(yīng)用,著眼于方言辨識(shí)的研究是非常有意義的。早年較為常用的聲學(xué)模型主要有隱馬爾科夫模型(HMM)和人工神經(jīng)網(wǎng)絡(luò)(ANN),像BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)等,并且至今都在沿用以及不斷優(yōu)化中。而近年來(lái),隨著深度學(xué)習(xí)在語(yǔ)音識(shí)別領(lǐng)域中大量成功實(shí)踐,對(duì)多層神經(jīng)網(wǎng)絡(luò)采用深度學(xué)習(xí)算法,可以得到更好的初始化權(quán)值,使得網(wǎng)絡(luò)在最佳的極值點(diǎn)處能夠更快完成收斂,從而改善了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的不足。本文通過(guò)對(duì)湖南長(zhǎng)沙、株洲、衡陽(yáng)、湘潭四地方言進(jìn)行研究,以MATLAB為實(shí)驗(yàn)平臺(tái),提出了一種基于門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)和HMM結(jié)合的聲學(xué)模型,取得了較好的識(shí)別效果,主要研究?jī)?nèi)容包括:本文對(duì)語(yǔ)音特征參數(shù)提取進(jìn)行了研究,針對(duì)傳統(tǒng)的MFCC特征參數(shù)的不足,研究了基于人耳聽覺模型的特征參數(shù)CFCC的提取。詳細(xì)介紹了CFCC特征參數(shù)的原理和提取方法,分析了耳...
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 相關(guān)領(lǐng)域的發(fā)展與現(xiàn)狀
1.2.1 方言辨識(shí)的發(fā)展與現(xiàn)狀
1.2.2 神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展與現(xiàn)狀
1.3 方言辨識(shí)的主要方法
1.4 神經(jīng)網(wǎng)絡(luò)對(duì)方言辨識(shí)的意義
1.5 論文結(jié)構(gòu)安排
第二章 語(yǔ)音識(shí)別基礎(chǔ)理論
2.1 方言辨識(shí)系統(tǒng)結(jié)構(gòu)
2.2 語(yǔ)音信號(hào)的預(yù)處理
2.3 語(yǔ)音信號(hào)的特征提取
2.4 聲學(xué)模型
2.4.1 隱馬爾科夫(HMM)模型
2.4.2 基于GMM-HMM聲學(xué)模型
2.4.3 基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型
2.5 本章小結(jié)
第三章 基于聽覺變換的耳蝸倒譜系數(shù)(CFCC)的提取
3.1 聽覺變換的原理
3.2 耳蝸倒譜系數(shù)(CFCC)的提取過(guò)程
3.3 耳蝸濾波器
3.4 毛細(xì)胞窗口
3.5 非線性響度變換和離散余弦變換
3.6 不同特征參數(shù)對(duì)識(shí)別率的影響實(shí)驗(yàn)
3.7 本章小結(jié)
第四章 基于GRU-HMM聲學(xué)模型的方言辨識(shí)
4.1 門控循環(huán)單元GRU的基本理論
4.2 GRU模型的訓(xùn)練
4.3 GRU-HMM模型
4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
附錄 中英文縮寫名詞對(duì)照表
發(fā)表論文和科研情況說(shuō)明
致謝
本文編號(hào):3835011
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 相關(guān)領(lǐng)域的發(fā)展與現(xiàn)狀
1.2.1 方言辨識(shí)的發(fā)展與現(xiàn)狀
1.2.2 神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展與現(xiàn)狀
1.3 方言辨識(shí)的主要方法
1.4 神經(jīng)網(wǎng)絡(luò)對(duì)方言辨識(shí)的意義
1.5 論文結(jié)構(gòu)安排
第二章 語(yǔ)音識(shí)別基礎(chǔ)理論
2.1 方言辨識(shí)系統(tǒng)結(jié)構(gòu)
2.2 語(yǔ)音信號(hào)的預(yù)處理
2.3 語(yǔ)音信號(hào)的特征提取
2.4 聲學(xué)模型
2.4.1 隱馬爾科夫(HMM)模型
2.4.2 基于GMM-HMM聲學(xué)模型
2.4.3 基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型
2.5 本章小結(jié)
第三章 基于聽覺變換的耳蝸倒譜系數(shù)(CFCC)的提取
3.1 聽覺變換的原理
3.2 耳蝸倒譜系數(shù)(CFCC)的提取過(guò)程
3.3 耳蝸濾波器
3.4 毛細(xì)胞窗口
3.5 非線性響度變換和離散余弦變換
3.6 不同特征參數(shù)對(duì)識(shí)別率的影響實(shí)驗(yàn)
3.7 本章小結(jié)
第四章 基于GRU-HMM聲學(xué)模型的方言辨識(shí)
4.1 門控循環(huán)單元GRU的基本理論
4.2 GRU模型的訓(xùn)練
4.3 GRU-HMM模型
4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
附錄 中英文縮寫名詞對(duì)照表
發(fā)表論文和科研情況說(shuō)明
致謝
本文編號(hào):3835011
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3835011.html
最近更新
教材專著