天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法研究

發(fā)布時(shí)間:2021-05-19 21:10
  在語(yǔ)音信號(hào)處理系統(tǒng)中,感興趣的語(yǔ)音通常會(huì)被背景噪聲干擾,嚴(yán)重?fù)p害了語(yǔ)音的質(zhì)量和可懂度,作為前端處理模塊,語(yǔ)音增強(qiáng)算法成為眾多學(xué)者的研究焦點(diǎn),多種語(yǔ)音增強(qiáng)算法已被提出用于噪聲抑制,主要包括基于信號(hào)處理的方法、基于統(tǒng)計(jì)模型的方法和基于模型訓(xùn)練的方法等。在這些方法中,基于信號(hào)處理的方法,譜減法和維納濾波法是兩種最具有代表性的算法,當(dāng)正確估計(jì)背景噪聲時(shí),該類方法能取得較好的語(yǔ)音增強(qiáng)性能,然而,在現(xiàn)實(shí)環(huán)境中,尤其是在低信噪比的條件下,由于噪聲的隨機(jī)性和突變性,使得噪聲很難被準(zhǔn)確估計(jì),導(dǎo)致增強(qiáng)性能大大下降,同時(shí)易引入“音樂噪聲”;基于統(tǒng)計(jì)模型的方法,雖然在低信噪比的條件下也可以取得比較好的增強(qiáng)性能,但是考慮到噪聲與語(yǔ)音間的相互關(guān)系非常復(fù)雜,需要一些信號(hào)間的獨(dú)立性假設(shè)以及對(duì)特征分布的高斯性假設(shè),然而這些假設(shè)通常是理想的,在未知的不匹配噪聲條件下,其性能惡化;基于模型訓(xùn)練的語(yǔ)音增強(qiáng)方法在低信噪比、復(fù)雜背景噪聲條件下表現(xiàn)出了更好的效果;谏顚由窠(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)就是近年來(lái)興起的一種基于模型訓(xùn)練的方法,深層神經(jīng)網(wǎng)絡(luò)依靠對(duì)復(fù)雜特征優(yōu)秀的抽象和建模能力,在語(yǔ)音信號(hào)處理領(lǐng)域引起了廣泛的研究,基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)... 

【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀
    1.3 研究?jī)?nèi)容和章節(jié)安排
第2章 基于自編碼器的深度學(xué)習(xí)語(yǔ)音增強(qiáng)
    2.1 引言
    2.2 基于DNN的語(yǔ)音增強(qiáng)方法
        2.2.1 DNN的網(wǎng)絡(luò)結(jié)構(gòu)
        2.2.2 DNN的網(wǎng)絡(luò)訓(xùn)練
    2.3 自編碼器
        2.3.1 AE的結(jié)構(gòu)
        2.3.2 AE的訓(xùn)練
    2.4 基于AE的 DNN語(yǔ)音增強(qiáng)方法
        2.4.1 AE中 RBM輸出層神經(jīng)元數(shù)量對(duì)重構(gòu)誤差的影響
        2.4.2 黃金分割法確定AE中 RBM輸出層神經(jīng)元數(shù)量
        2.4.3 網(wǎng)絡(luò)結(jié)構(gòu)及語(yǔ)音增強(qiáng)流程
    2.5 AEF-DNN語(yǔ)音增強(qiáng)方法性能評(píng)估
        2.5.1 實(shí)驗(yàn)數(shù)據(jù)及設(shè)置
        2.5.2 對(duì)比方法及評(píng)價(jià)指標(biāo)
        2.5.3 實(shí)驗(yàn)結(jié)果及分析
    2.6 本章小結(jié)
第3章 基于自編碼特征的綜合特征語(yǔ)音增強(qiáng)聲學(xué)特征提取
    3.1 引言
    3.2 組合特征及多分辨率特征
    3.3 AEF特征及Group Lasso算法
        3.3.1 AE訓(xùn)練的公式推導(dǎo)
        3.3.2 特征組合:Group Lasso算法
        3.3.3 基于AEF特征的綜合特征語(yǔ)音增強(qiáng)流程
    3.4 方法性能估計(jì)
        3.4.1 實(shí)驗(yàn)數(shù)據(jù)
        3.4.2 對(duì)比方法及評(píng)價(jià)指標(biāo)
        3.4.3 實(shí)驗(yàn)結(jié)果及分析
    3.5 本章小結(jié)
第4章 多目標(biāo)準(zhǔn)則學(xué)習(xí)
    4.1 引言
    4.2 多目標(biāo)準(zhǔn)則學(xué)習(xí)
        4.2.1 與頻譜包絡(luò)的聯(lián)合優(yōu)化
        4.2.2 與二值掩蔽的聯(lián)合優(yōu)化
        4.2.3 與聽覺特征的聯(lián)合優(yōu)化
    4.3 方法性能評(píng)估
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)
        4.3.2 實(shí)驗(yàn)分析與結(jié)論
    4.4 本章小結(jié)
第5章 系統(tǒng)介紹與算法實(shí)測(cè)
    5.1 語(yǔ)音監(jiān)聽設(shè)備
        5.1.1 語(yǔ)音監(jiān)聽設(shè)備架構(gòu)
        5.1.2 語(yǔ)音監(jiān)聽設(shè)備硬件平臺(tái)
    5.2 算法實(shí)測(cè)
    5.3 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文的工作
    6.2 下一步工作的方向
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的短時(shí)強(qiáng)降水天氣識(shí)別[J]. 路志英,任一墨,孫曉磊,賈惠珍.  天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版). 2018(02)
[2]基于感知掩蔽深度神經(jīng)網(wǎng)絡(luò)的單通道語(yǔ)音增強(qiáng)方法[J]. 韓偉,張雄偉,閔剛,張啟業(yè).  自動(dòng)化學(xué)報(bào). 2017(02)
[3]面向基因數(shù)據(jù)分類的核主成分分析旋轉(zhuǎn)森林算法[J]. 陸慧娟,劉亞卿,孟亞瓊,關(guān)偉,劉硯秋.  計(jì)算機(jī)科學(xué)與探索. 2017(10)
[4]基于深度學(xué)習(xí)語(yǔ)音分離技術(shù)的研究現(xiàn)狀與進(jìn)展[J]. 劉文舉,聶帥,梁山,張學(xué)良.  自動(dòng)化學(xué)報(bào). 2016(06)
[5]基于伽馬通濾波器組的聽覺特征提取算法研究[J]. 王玥,錢志鴻,王雪,程光明.  電子學(xué)報(bào). 2010(03)

博士論文
[1]基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D]. 徐勇.中國(guó)科學(xué)技術(shù)大學(xué) 2015



本文編號(hào):3196447

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3196447.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5c01f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com