天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于生成對抗網(wǎng)絡的單通道語音增強方法研究

發(fā)布時間:2023-04-24 22:09
  隨著社會的快速發(fā)展,人們對于通信系統(tǒng)和智能語音設備的要求也越來越高。語音增強作為一種可以提高語音聽覺質(zhì)量和可懂性的技術,對于推動通信技術和人工智能行業(yè)的發(fā)展有著重要意義。但是實際的聲學場景下,存在大量的平穩(wěn)噪聲和非平穩(wěn)噪聲,并且純凈語音和噪聲之間是典型的非線性關系。傳統(tǒng)的無監(jiān)督語音增強方法依賴信號的一階統(tǒng)計特性,僅適用于符合高斯先驗的平穩(wěn)噪聲環(huán)境。而大多數(shù)的有監(jiān)督語音增強方法利用神經(jīng)網(wǎng)絡的非線性結(jié)構學習噪聲語音和純凈語音之間的非線性關系,在噪聲類型已知的情況下能夠取得較好的結(jié)果,但是在未知的噪聲環(huán)境下模型性能急劇下降,增強語音的質(zhì)量和可懂性也較差。生成對抗網(wǎng)絡(Generative Adversarial Network,GAN)是當前最新穎的一種基于深度學習的生成式模型,已經(jīng)成功應用到語音增強領域。研究發(fā)現(xiàn),基于GAN的語音增強在非平穩(wěn)噪聲和未知噪聲環(huán)境下,可以更好提高語音的聽覺質(zhì)量和可懂性。該方法已經(jīng)成為語音增強中最具潛力的研究方向。本文將主要研究基于GAN的語音增強方法,致力提高生成語音的質(zhì)量和可懂性,主要工作如下:(1)提出基于混合懲罰項的相對平均生成對抗網(wǎng)絡語音增強方法。標準...

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景及研究意義
    1.2 單通道語音增強
    1.3 國內(nèi)外研究現(xiàn)狀
        1.3.1 傳統(tǒng)單通道語音增強算法的研究現(xiàn)狀
        1.3.2 有監(jiān)督語音增強算法的研究現(xiàn)狀
        1.3.3 基于生成對抗網(wǎng)絡的語音增強算法研究現(xiàn)狀
    1.4 本文主要工作及結(jié)構安排
        1.4.1 本文主要工作
        1.4.2 本文結(jié)構安排
    1.5 本章小結(jié)
第2章 基于生成對抗網(wǎng)絡的語音增強
    2.1 生成對抗網(wǎng)絡
        2.1.1 標準生成對抗網(wǎng)絡
        2.1.2 深度卷積生成對抗網(wǎng)絡
        2.1.3 條件生成對抗網(wǎng)絡
        2.1.4 最小二乘生成對抗網(wǎng)絡
    2.2 語音增強生成對抗網(wǎng)絡
        2.2.1 網(wǎng)絡結(jié)構
        2.2.2 損失函數(shù)
        2.2.3 訓練過程
    2.3 語音增強的評價指標
        2.3.1 客觀評價指標
        2.3.2 主觀評價指標
    2.4 本章小結(jié)
第3章 基于混合懲罰項的RaGAN語音增強方法
    3.1 引言
    3.2 提出的RaGAN-MP語音增強方法
        3.2.1 基于RaGAN的語音增強
        3.2.2 混合懲罰項
        3.2.3 網(wǎng)絡結(jié)構
    3.3 實驗設置
        3.3.1 數(shù)據(jù)集及預處理
        3.3.2 對比方法
    3.4 實驗結(jié)果分析
        3.4.1 語音質(zhì)量客觀評價結(jié)果
        3.4.2 不同語音增強方法的語譜圖比較
        3.4.3 不同SNR條件下的語音質(zhì)量評價結(jié)果
        3.4.4 語音質(zhì)量主觀評價結(jié)果
    3.5 本章小結(jié)
第4章 基于SI-SDR優(yōu)化的生成對抗網(wǎng)絡語音增強方法
    4.1 引言
    4.2 提出的結(jié)合SI-SDR優(yōu)化生成對抗網(wǎng)絡的語音增強方法
        4.2.1 尺度不變信號失真比(SI-SDR)
        4.2.2 引入SI-SDR的損失函數(shù)
        4.2.3 提出方法的總體框架
    4.3 實驗設置
        4.3.1 數(shù)據(jù)集及預處理
        4.3.2 對比方法
    4.4 實驗結(jié)果分析
        4.4.1 語音質(zhì)量客觀評價結(jié)果
        4.4.2 不同語音增強方法的語譜圖比較
        4.4.3 不同SNR條件下的語音質(zhì)量評價結(jié)果
        4.4.4 不同噪聲類型條件下PESQ和 STOI的評價結(jié)果
        4.4.5 語音質(zhì)量主觀評價結(jié)果
    4.5 本章小結(jié)
總結(jié)與展望
參考文獻
致謝
附錄A 攻讀碩士學位期間參與項目和發(fā)表學術論文



本文編號:3800113

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3800113.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶4b5d3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com