天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究

發(fā)布時間:2021-04-09 17:58

  當(dāng)前語音識別的研究已取得了較為豐碩的成果,在安靜環(huán)境下性能令人滿意,逐漸被應(yīng)用在諸多人機(jī)交互的場合。然而,由于噪聲的存在,語音識別系統(tǒng)在實際環(huán)境下性能急劇下降,如何提高語音識別的噪聲魯棒性,逐漸成為近年來語音識別的研究熱點。本文主要研究農(nóng)產(chǎn)品市場信息采集作業(yè)環(huán)境中的語音識別噪聲魯棒性問題,針對當(dāng)前缺乏面向農(nóng)產(chǎn)品市場信息采集領(lǐng)域的語音識別引擎,而通用領(lǐng)域的識別算法又不適合解決上述問題,分析環(huán)境的噪聲特點,面向非特定人和中小規(guī)模詞匯量的連續(xù)漢語普通話識別,訓(xùn)練聲學(xué)模型,研究適用于該環(huán)境下的語音識別魯棒性方法。本文主要研究的內(nèi)容包括:(1)基于隱馬爾科夫模型(HMM)框架建立了聲學(xué)模型,利用自建的農(nóng)產(chǎn)品市場信息語料庫進(jìn)行訓(xùn)練和測試HHM模型,基于HTK工具包建立了農(nóng)產(chǎn)品價格語音識別基線系統(tǒng)。(2)在分析農(nóng)產(chǎn)品市場信息采集環(huán)境的噪聲特點的基礎(chǔ)上,從模型空間和特征空間對系統(tǒng)采取了多種魯棒性方法,包括:在聲學(xué)模型的識別基元選取上,采用了一種擴(kuò)展的三音素聲韻母模型,有效的解決了音節(jié)內(nèi)部和音節(jié)間的協(xié)同發(fā)音問題,大大提高了識別率;針對建模后三音子模型數(shù)量急劇增加問題,采用了決策樹狀態(tài)聚類方法,建立了一套二值問題規(guī)則集,并將語音學(xué)的專業(yè)知識融合進(jìn)決策樹,通過聚類減少了三音子模型的數(shù)量,有效地解決了訓(xùn)練數(shù)據(jù)不充分問題;鑒于倒譜均值歸一化(CMN)方法在消除信道卷積噪聲以及加性噪聲方面的良好表現(xiàn),在農(nóng)產(chǎn)品市場信息語音識別系統(tǒng)中采用,有效緩解了信道噪聲影響。(3)在信號空間,為了提高輸入語音信號的信噪比,采用了譜減類算法進(jìn)行語音增強(qiáng),但譜減算法容易帶來信道失真和“音樂”噪聲。為了減少這種失真,提出了一種聯(lián)合語音增強(qiáng)與特征補(bǔ)償?shù)聂敯粜苑椒?把倒譜均值方差歸一化方法(CMVN)與譜減類算法進(jìn)行了結(jié)合,二者互為補(bǔ)充。實驗結(jié)果表明,聯(lián)合后的算法能有效提高系統(tǒng)的識別率,特別是在低信噪比時效果更為明顯。(4)在統(tǒng)計估計理論的框架下,研究了估計幅度與實際幅度的最小均方誤差(MMSE)估計器以及對數(shù)最小均方誤差(log MMSE)幅度估計器。在此基礎(chǔ)上提出了一種聯(lián)合MMSE以及l(fā)og MMSE幅度估計與CMVN失真補(bǔ)償?shù)聂敯粜苑椒。不同農(nóng)產(chǎn)品市場信息采集環(huán)境下的實驗證明,該方法具有一定的噪聲魯棒性,多種空間算法的有機(jī)結(jié)合可以提供系統(tǒng)的魯棒性,特別是在低信噪比時更為明顯。本文的研究為語音識別在農(nóng)產(chǎn)品市場信息采集環(huán)境中的應(yīng)用建立了一套魯棒性方法,為今后語音識別在農(nóng)業(yè)信息采集領(lǐng)域的應(yīng)用提供了借鑒。

【學(xué)位授予單位】:中國農(nóng)業(yè)科學(xué)院

【學(xué)位級別】:博士

【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:

文章目錄
摘要
Abstract
英文縮略表
第一章 引言
    1.1 問題的提出及研究意義
    1.2 語音識別概述
        1.2.1 語音識別的發(fā)展
        1.2.2 語音識別的分類
        1.2.3 基于統(tǒng)計模型的語音識別
    1.3 影響語音識別魯棒性的因素
    1.4 語音識別及聲學(xué)技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用
        1.4.1 國外研究情況
        1.4.2 國內(nèi)研究情況
    1.5 研究內(nèi)容
    1.6 章節(jié)安排
    1.7 小結(jié)
第二章 噪聲魯棒性語音識別的研究現(xiàn)狀
    2.1 噪聲分類
        2.1.1 加性噪聲與乘性噪聲
        2.1.2 噪聲特性分析
    2.2 噪聲魯棒性方法研究現(xiàn)狀
        2.2.1 語音增強(qiáng)
        2.2.2 魯棒性特征提取
        2.2.3 模型補(bǔ)償
    2.3 小結(jié)
第三章 基于HMM框架的農(nóng)產(chǎn)品價格語音識別
    3.1 HMM模型
        3.1.1 HMM的概述
        3.1.2 HMM的數(shù)學(xué)定義
        3.1.3 HMM的三個基本問題
    3.2 基于HTK的實驗平臺構(gòu)建
        3.2.1 語音數(shù)據(jù)庫
        3.2.2 MFCC特征提取
        3.2.3 聲學(xué)模型的設(shè)置
        3.2.4 識別性能的評價標(biāo)準(zhǔn)
    3.3 小結(jié)
第四章 系統(tǒng)的三音子模型優(yōu)化及特征規(guī)整
    4.1 擴(kuò)展的聲韻母建;
        4.1.1 漢語語音學(xué)特點
        4.1.2 漢語聲母結(jié)構(gòu)
        4.1.3 漢語韻母結(jié)構(gòu)
        4.1.4 擴(kuò)展的聲韻母識別基元定義
    4.2 基于決策樹的狀態(tài)共享
        4.2.1 決策樹的構(gòu)造
        4.2.2 二值問題集的設(shè)計
        4.2.3 結(jié)點分裂準(zhǔn)則
        4.2.4 結(jié)點停止分裂
        4.2.5 結(jié)點合并
    4.3 增加高斯混合分量
    4.4 倒譜特征歸一化
    4.5 實驗及分析
        4.5.1 實驗一:三音子模型識別實驗
        4.5.2 實驗二:決策樹狀態(tài)聚類
        4.5.3 實驗三:高斯混合分量增加
        4.5.4 實驗四:倒譜均值方差(CMVN)歸一化
    4.6 小結(jié)
第五章 聯(lián)合譜減增強(qiáng)和失真補(bǔ)償?shù)聂敯粜苑椒?/div>
    5.1 譜減法
        5.1.1 譜減的基本原理
        5.1.2 使用過減(over subtraction)技術(shù)的譜減算法
    5.2 多帶(multi band)譜減法
    5.3 MMSE譜減算法
    5.4 實驗
        5.4.1 實驗一:MMSE譜減法參數(shù)優(yōu)化實驗
        5.4.2 實驗二:不同環(huán)境下聯(lián)合算法實驗
    5.5 小結(jié)
第六章 基于統(tǒng)計模型的前端增強(qiáng)與失真補(bǔ)償?shù)慕Y(jié)合
    6.1 MMSE幅度譜估計
        6.1.1 MMSE幅度估計器
        6.1.2 先驗SNR的估計
    6.2 對數(shù)MMSE估計器
    6.3 MMSE估計的實現(xiàn)
    6.4 實驗
        6.4.1 實驗一:采用MMSE估計器與logMMSE方法增強(qiáng)
        6.4.2 實驗二:MMSE、logMMSE與CMVN聯(lián)合實驗
        6.4.3 實驗三:實際環(huán)境語音測試
    6.5 算法綜合比較
    6.6 小結(jié)
第七章 結(jié)論及展望
    7.1 研究總結(jié)
    7.2 展望
參考文獻(xiàn)
致謝
作者簡介

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 王易川;李智忠;;基于Mel倒譜和BP神經(jīng)網(wǎng)絡(luò)的船舶目標(biāo)分類研究[J];傳感器與微系統(tǒng);2011年06期

2 郭海燕;楊震;朱衛(wèi)平;;一種新的基于稀疏分解的單通道混合語音分離方法[J];電子學(xué)報;2012年04期

3 白立舜;楊伯鋼;王晴;;森林資源調(diào)查的便攜式野外聲控記錄技術(shù)研究[J];測繪通報;2013年09期

4 張雪英;賈海蓉;靳晨升;;子空間與維納濾波相結(jié)合的語音增強(qiáng)方法[J];計算機(jī)工程與應(yīng)用;2011年14期

5 劉放軍;王仁華;;語音識別前端魯棒性問題綜述[J];計算機(jī)科學(xué);2006年04期

6 王讓定,柴佩琪;語音倒譜特征的研究[J];計算機(jī)工程;2003年13期

7 舒挺,張國煊;基于Voice XML技術(shù)的信息服務(wù)集成[J];計算機(jī)應(yīng)用;2003年06期

8 王曉蘭,周獻(xiàn)中;格式正確的有限命令識別[J];計算機(jī)應(yīng)用;2005年10期

9 雷建軍;楊震;劉剛;郭軍;;噪聲魯棒語音識別研究綜述[J];計算機(jī)應(yīng)用研究;2009年04期

10 張翠麗;張申生;李磊;;基于統(tǒng)一受理的農(nóng)業(yè)呼叫中心解決方案[J];計算機(jī)應(yīng)用與軟件;2006年10期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 胡郁;語音識別中基于模型補(bǔ)償?shù)脑肼曯敯粜詥栴}研究[D];中國科學(xué)技術(shù)大學(xué);2009年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 李金娟;基于HMM模型的語音情感識別的研究[D];天津大學(xué);2007年

2 周阿轉(zhuǎn);汽車駕駛環(huán)境中的魯棒性語音識別[D];蘇州大學(xué);2012年



本文編號:168820


本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/168820.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶586f6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com