天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度神經(jīng)網(wǎng)絡(luò)的單通道語音分離技術(shù)及研究

發(fā)布時間:2020-10-27 20:45
   語言作為人類交流最重要的手段,在現(xiàn)實生活中有著廣泛的應(yīng)用,但是語音在傳達(dá)過程中易受周圍環(huán)境所影響,導(dǎo)致語音的質(zhì)量受損。因而,出現(xiàn)了語音分離技術(shù)。語音分離有人聲與噪聲的分離、人聲與人聲的分離,且生活中絕大多數(shù)應(yīng)用場景中只有一個麥克風(fēng)設(shè)備,本文主要研究的工作是單通道情況下人聲與噪聲的分離。近年來,深度學(xué)習(xí)被廣泛地應(yīng)用于語音信號處理領(lǐng)域中,其中,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)在語音分離領(lǐng)域表現(xiàn)出了強(qiáng)大的優(yōu)勢。層次化的非線性處理使得DNN具有強(qiáng)大的表示學(xué)習(xí)的能力,但是由于語音信號是一個非穩(wěn)態(tài)的、時變的信號,用DNN分離后的語音仍然存在著噪聲的干擾以及噪聲估計不準(zhǔn)確的問題,影響了語音信號的質(zhì)量,針對傳統(tǒng)DNN語音分離中噪聲干擾的問題,提出以下兩種改進(jìn)方法:(1)在DNN預(yù)訓(xùn)練階段,用受限玻爾茲曼機(jī)進(jìn)行網(wǎng)絡(luò)預(yù)訓(xùn)練,最小化網(wǎng)絡(luò)輸出的語音特征與純凈語音特征之間的誤差,將該誤差用反向傳播算法來更新網(wǎng)絡(luò)的權(quán)值,經(jīng)過一系列的更新迭代后得到訓(xùn)練好的DNN語音分離模型。(2)將DNN與譜減法進(jìn)行結(jié)合,利用語音信號的相鄰時頻單元能量具有連續(xù)性的原理,用譜減法對相應(yīng)時頻塊中每個時頻單元分別進(jìn)行噪聲能量估計,用混合語音信號能量功率譜減去估計噪聲能量功率譜,達(dá)到語音與噪聲分離的目的。語音分離訓(xùn)練目標(biāo)的好壞關(guān)系到合成目標(biāo)語音的質(zhì)量,用理想二值掩蔽和理想比例掩蔽分別作為訓(xùn)練目標(biāo),在同等實驗參數(shù)設(shè)置以及相同數(shù)據(jù)集上進(jìn)行實驗。本文完成了兩個實驗,其中每個實驗都是在標(biāo)準(zhǔn)語音庫TIMIT中選擇相同數(shù)據(jù)集使用DNN來完成的,經(jīng)實驗結(jié)果表明,方法一明顯降低了輸出語音與純凈語音之間的誤差,使得分離語音的可懂度和相似系數(shù)都得到了顯著提高。方法二使得分離語音的可懂度和信噪比得到了顯著提高,并且分離語音的信號更接近于純凈語音的信號。
【學(xué)位單位】:閩南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.3;TP183
【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文主要內(nèi)容
    1.4 本文組織結(jié)構(gòu)
第2章 語音分離的相關(guān)知識
    2.1 語音的產(chǎn)生和感知
        2.1.1 語音信號的產(chǎn)生
        2.1.2 人耳的聽覺感受性
        2.1.3 掩蔽效應(yīng)
    2.2 常見單通道語音分離技術(shù)
        2.2.1 基于計算聽覺場景分析的語音分離算法
        2.2.2 基于信號處理語音分離算法
        2.2.3 基于模型的語音分離算法
    2.3 本章小結(jié)
第3章 基于受限玻爾茲曼機(jī)的DNN語音分離
    3.1 DNN網(wǎng)絡(luò)結(jié)構(gòu)
    3.2 時頻分解
    3.3 特征提取
    3.4 分離目標(biāo)
    3.5 改進(jìn)模型訓(xùn)練
    3.6 波形合成
    3.7 實驗與結(jié)果分析
        3.7.1 實驗數(shù)據(jù)與實驗設(shè)置
        3.7.2 評價指標(biāo)
        3.7.3 實驗結(jié)果分析
    3.8 本章小結(jié)
第4章 基于DNN和譜減法相結(jié)合的語音分離方法
    4.1 問題描述
    4.2 模型提出
    4.3 譜減去噪
    4.4 模型步驟
    4.5 實驗與結(jié)果分析
        4.5.1 實驗數(shù)據(jù)與實驗設(shè)置
        4.5.2 評價指標(biāo)
        4.5.3 IRM實驗結(jié)果分析
        4.5.4 IBM實驗結(jié)果分析
        4.5.5 IBM與 IRM對比實驗結(jié)果分析
    4.6 本章小結(jié)
第5章 總結(jié)與展望
    5.1 工作總結(jié)
    5.2 工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間取得的科研成果清單

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識與技術(shù);2012年03期

2 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機(jī)應(yīng)用研究;2010年11期

3 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機(jī)應(yīng)用;2008年05期

4 王光艷;張艷;李玥玲;馬肖蓉;;稀疏分量分析在水下盲語音分離中的應(yīng)用研究[J];電子世界;2019年03期

5 范存航;劉斌;陶建華;溫正棋;易江燕;;一種基于卷積神經(jīng)網(wǎng)絡(luò)的端到端語音分離方法[J];信號處理;2019年04期

6 張磊;劉繼芳;項學(xué)智;;基于計算聽覺場景分析的混合語音分離[J];計算機(jī)工程;2010年14期

7 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期

8 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年01期

9 丁慧,徐柏齡;自適應(yīng)降噪系統(tǒng)的語音分離研究[J];聲學(xué)學(xué)報;2004年01期

10 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報;2006年03期


相關(guān)博士學(xué)位論文 前8條

1 李曾璽;基于自回歸深度神經(jīng)網(wǎng)絡(luò)的單通道語音分離方法研究[D];中國科學(xué)技術(shù)大學(xué);2019年

2 張暉;基于深度學(xué)習(xí)的語音分離研究[D];內(nèi)蒙古大學(xué);2017年

3 王燕南;基于深度學(xué)習(xí)的說話人無關(guān)單通道語音分離[D];中國科學(xué)技術(shù)大學(xué);2017年

4 胡琦;基于計算聽覺場景分析的單信道語言分離[D];北京交通大學(xué);2014年

5 鮑光照;基于稀疏表示和字典學(xué)習(xí)的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2015年

6 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學(xué);2013年

7 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學(xué)技術(shù)大學(xué);2012年

8 郭海燕;基于稀疏分解的單通道混合語音分離算法研究[D];南京郵電大學(xué);2011年


相關(guān)碩士學(xué)位論文 前10條

1 馮利琪;基于深度神經(jīng)網(wǎng)絡(luò)的單通道語音分離技術(shù)及研究[D];閩南師范大學(xué);2019年

2 閔長偉;基于深度神經(jīng)網(wǎng)絡(luò)的單通道語音分離方法研究[D];閩南師范大學(xué);2019年

3 徐丹丹;基于生成對抗網(wǎng)絡(luò)的端到端多語音分離技術(shù)研究[D];哈爾濱工程大學(xué);2018年

4 王凱龍;基于計算聽覺場景分析的多人語音分離方法[D];南京理工大學(xué);2018年

5 毛振蘇;基于時延神經(jīng)網(wǎng)絡(luò)的語音分離的研究[D];內(nèi)蒙古大學(xué);2018年

6 李光鵬;基于神經(jīng)網(wǎng)絡(luò)的語音分離及其DSP實現(xiàn)[D];內(nèi)蒙古大學(xué);2018年

7 王賀;面向語音分離的算法研究與實現(xiàn)技術(shù)[D];國防科學(xué)技術(shù)大學(xué);2016年

8 姚森;基于深度學(xué)習(xí)的語音分離和識別技術(shù)研究[D];哈爾濱工程大學(xué);2018年

9 朱竑諭;基于人耳聽覺特性的語音分離研究[D];東南大學(xué);2018年

10 張婷;基于深度學(xué)習(xí)的有監(jiān)督語音分離方法研究[D];山東大學(xué);2018年



本文編號:2859041

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2859041.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9bfbf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com