基于深度學(xué)習(xí)的漢語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)方法研究
發(fā)布時(shí)間:2017-05-22 16:03
本文關(guān)鍵詞:基于深度學(xué)習(xí)的漢語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:語(yǔ)音關(guān)鍵詞檢測(cè)是一種從連續(xù)的語(yǔ)音流中檢測(cè)預(yù)定義的一組關(guān)鍵詞的技術(shù),它的一種主流方法是基于大詞匯量連續(xù)語(yǔ)音識(shí)別器(Large Vocabulary Continuous Speech Recognition,LVCSR)的;谡Z(yǔ)音識(shí)別器的關(guān)鍵詞檢測(cè)系統(tǒng)主要有兩個(gè)階段——解碼階段和檢測(cè)階段,語(yǔ)音識(shí)別器的性能對(duì)關(guān)鍵詞檢測(cè)的性能有很大影響。傳統(tǒng)的關(guān)鍵詞檢測(cè)是用GMM(Gaussian Mixture Model)和HMM(Hidden Markov Model)結(jié)合的GMM-HMM模型作為L(zhǎng)VCSR的聲學(xué)模型,其識(shí)別率不高。近年來(lái)深度學(xué)習(xí)技術(shù)對(duì)語(yǔ)音識(shí)別產(chǎn)生了巨大影響,人們對(duì)DNN(Deep Neural Network)替代GMM組成DNN-HMM聲學(xué)模型進(jìn)行了深入研究。本文研究在關(guān)鍵詞檢測(cè)中用DNN-HMM聲學(xué)模型替代GMM-HMM聲學(xué)模型,并在DNN-HMM聲學(xué)模型的基礎(chǔ)上建立關(guān)鍵詞檢測(cè)系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,基于DNN-HMM模型的語(yǔ)音識(shí)別器相比基于GMM-HMM模型的語(yǔ)音識(shí)別器識(shí)別率更高,關(guān)鍵詞檢測(cè)系統(tǒng)的性能也更好。針對(duì)基于LVCSR的關(guān)鍵詞檢測(cè)兩階段間缺乏緊密聯(lián)系的問(wèn)題,本文在DNN-HMM聲學(xué)模型的基礎(chǔ)上,研究了在聲學(xué)模型的訓(xùn)練階段,對(duì)關(guān)鍵詞賦予較大的權(quán)重以提高模型對(duì)關(guān)鍵詞的建模能力。因此,本文考慮在區(qū)分性訓(xùn)練中,利用側(cè)重關(guān)鍵詞的非均勻準(zhǔn)則進(jìn)行訓(xùn)練。本文首先研究了對(duì)關(guān)鍵詞進(jìn)行側(cè)重的非均勻MCE(Minimum Classification Erro)準(zhǔn)則,然后用非均勻MCE準(zhǔn)則對(duì)聲學(xué)模型參數(shù)進(jìn)行優(yōu)化。非均勻MCE準(zhǔn)則中關(guān)鍵詞的權(quán)重系數(shù)對(duì)識(shí)別結(jié)果有一定影響,固定權(quán)重系數(shù)的缺點(diǎn)是較大的權(quán)重系數(shù)可能導(dǎo)致過(guò)訓(xùn)練。因此本文研究利用Ada Boost(Adaptive Boosting)算法來(lái)動(dòng)態(tài)調(diào)整非均勻MCE訓(xùn)練過(guò)程中的權(quán)重系數(shù),Ada Boost算法可以避免非均勻MCE準(zhǔn)則中的過(guò)訓(xùn)練問(wèn)題,提高模型的泛化能力。實(shí)驗(yàn)結(jié)果表明,基于Ada Boost算法的非均勻MCE準(zhǔn)則的關(guān)鍵詞檢測(cè)性能更好。此外,本文還研究了非均勻s MBR(statelevel Minimum Bayes Risk)準(zhǔn)則,實(shí)驗(yàn)結(jié)果表明,基于非均勻s MBR方法的系統(tǒng)性能要好于基線系統(tǒng),本文最后對(duì)這兩種非均勻準(zhǔn)則進(jìn)行了總結(jié)和對(duì)比。
【關(guān)鍵詞】:檢測(cè) 深度學(xué)習(xí) 區(qū)分性訓(xùn)練 最小分類錯(cuò)誤
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-19
- 1.1 課題背景及研究的目的和意義9-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀與分析11-17
- 1.2.1 基于模板匹配的關(guān)鍵詞檢測(cè)12-13
- 1.2.2 基于Keyword/Filler模型的關(guān)鍵詞檢測(cè)13
- 1.2.3 基于LVCSR的關(guān)鍵詞檢測(cè)13-16
- 1.2.4 低資源環(huán)境下的關(guān)鍵詞檢測(cè)16
- 1.2.5 總結(jié)與分析16-17
- 1.3 主要研究?jī)?nèi)容17-19
- 第2章 關(guān)鍵詞檢測(cè)系統(tǒng)的基本組成19-31
- 2.1 引言19-20
- 2.2 關(guān)鍵詞檢測(cè)中的語(yǔ)音識(shí)別器20-27
- 2.2.1 前端處理20-21
- 2.2.2 聲學(xué)模型21-24
- 2.2.3 語(yǔ)言模型24-26
- 2.2.4 基于WFST的語(yǔ)音識(shí)別26-27
- 2.3 建立索引和搜索27-29
- 2.4 關(guān)鍵詞檢測(cè)系統(tǒng)的評(píng)價(jià)指標(biāo)29-30
- 2.5 基線系統(tǒng)的實(shí)驗(yàn)結(jié)果30
- 2.6 本章小結(jié)30-31
- 第3章 基于DNN-HMM聲學(xué)模型構(gòu)建的關(guān)鍵詞檢測(cè)31-45
- 3.1 引言31-32
- 3.2 DNN-HMM聲學(xué)模型32-35
- 3.2.1 DNN-HMM聲學(xué)模型的結(jié)構(gòu)32-34
- 3.2.2 用DNN-HMM聲學(xué)模型解碼34-35
- 3.3 DNN-HMM模型的主要訓(xùn)練過(guò)程35-40
- 3.3.1 DNN-HMM模型的預(yù)訓(xùn)練36-39
- 3.3.2 DNN-HMM模型的參數(shù)調(diào)優(yōu)39-40
- 3.4 DNN-HMM聲學(xué)模型中的非線性單元40-42
- 3.4.1 sigmoid激活單元40-41
- 3.4.2 Re LU單元41-42
- 3.4.3 p-norm單元42
- 3.5 實(shí)驗(yàn)結(jié)果與分析42-43
- 3.6 本章小結(jié)43-45
- 第4章 關(guān)鍵詞聲學(xué)模型的區(qū)分性訓(xùn)練45-60
- 4.1 引言45-46
- 4.2 基于非均勻MCE準(zhǔn)則的關(guān)鍵詞聲學(xué)模型46-51
- 4.2.1 基于MCE準(zhǔn)則的區(qū)分性訓(xùn)練46-47
- 4.2.2 關(guān)鍵詞檢測(cè)的非均勻MCE準(zhǔn)則47-49
- 4.2.3 基于Ada Boost算法的非均勻MCE準(zhǔn)則49-51
- 4.3 基于非均勻s MBR準(zhǔn)則的關(guān)鍵詞聲學(xué)模型51-53
- 4.4 模型訓(xùn)練需考慮的實(shí)際因素53-55
- 4.4.1 Lattice生成53-55
- 4.4.2 學(xué)習(xí)率的調(diào)整55
- 4.5 實(shí)驗(yàn)結(jié)果與分析55-58
- 4.5.1 非均勻MCE準(zhǔn)則的實(shí)驗(yàn)結(jié)果與分析55-57
- 4.5.2 非均勻s MBR準(zhǔn)則的實(shí)驗(yàn)結(jié)果與分析57-58
- 4.6 本章小結(jié)58-60
- 結(jié)論60-62
- 參考文獻(xiàn)62-67
- 攻讀碩士學(xué)位期間發(fā)表的論文67-69
- 致謝69
【參考文獻(xiàn)】
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 李海洋;漢語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)中置信測(cè)度研究[D];哈爾濱工業(yè)大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 王勇;基于點(diǎn)過(guò)程模型的連續(xù)語(yǔ)音關(guān)鍵詞檢測(cè)技術(shù)研究[D];解放軍信息工程大學(xué);2013年
本文關(guān)鍵詞:基于深度學(xué)習(xí)的漢語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):386162
本文鏈接:http://sikaile.net/kejilunwen/wltx/386162.html
最近更新
教材專著