天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

噪聲環(huán)境下的說(shuō)話人識(shí)別技術(shù)

發(fā)布時(shí)間:2017-05-25 18:21

  本文關(guān)鍵詞:噪聲環(huán)境下的說(shuō)話人識(shí)別技術(shù),由筆耕文化傳播整理發(fā)布。


【摘要】:語(yǔ)音是人與人之間交流最直接且最有效的途徑之一。語(yǔ)音在承載信息的同時(shí),還包含了說(shuō)話人的個(gè)性特征。說(shuō)話人識(shí)別技術(shù)就是依據(jù)語(yǔ)音信號(hào)中能夠代表說(shuō)話人個(gè)性特征的參數(shù)來(lái)識(shí)別話者身份的技術(shù)。在過(guò)去的幾十年里,說(shuō)話人識(shí)別技術(shù)取得了很大的發(fā)展和進(jìn)步。而阻礙說(shuō)話人識(shí)別技術(shù)進(jìn)一步走向?qū)嵱玫闹饕系K,則是各種實(shí)際應(yīng)用場(chǎng)景中的噪聲。這些噪聲極大地降低了系統(tǒng)的識(shí)別性能,影響了說(shuō)話人識(shí)別技術(shù)的應(yīng)用和推廣。本文主要研究了在噪聲環(huán)境下的說(shuō)話人識(shí)別問(wèn)題。論文主要對(duì)端點(diǎn)檢測(cè)、信號(hào)空間的抗噪技術(shù)、特征空間的抗噪技術(shù)等方面進(jìn)行了研究。本文主要研究工作包括以下幾個(gè)方面:(1)低信噪比下的端點(diǎn)檢測(cè)技術(shù)研究,首先介紹了在噪聲環(huán)境下表現(xiàn)效果較好的兩種端點(diǎn)檢測(cè)方法:基于C0復(fù)雜度的端點(diǎn)檢測(cè)算法、基于MFCC相似度的端點(diǎn)檢測(cè)算法;然后在二者的基礎(chǔ)上研究了一種新的端點(diǎn)檢測(cè)算法:基于改進(jìn)C0復(fù)雜度和MFCC相似度相結(jié)合的端點(diǎn)檢測(cè)算法;最后對(duì)三種端點(diǎn)檢測(cè)算法進(jìn)行實(shí)驗(yàn)分析,證明了改進(jìn)算法性能優(yōu)良、穩(wěn)定性更高。(2)信號(hào)空間的抗噪技術(shù)研究,首先介紹了常規(guī)的信號(hào)空間抗噪方法:譜減法、維納濾波法、基于先驗(yàn)信噪比的維納濾波法;然后在先驗(yàn)信噪比的維納濾波法基礎(chǔ)上增加端點(diǎn)檢測(cè)環(huán)節(jié):將基于MFCC相似度的端點(diǎn)檢測(cè)融入到維納濾波法中;最后對(duì)幾種算法在不同信噪比環(huán)境下進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了改進(jìn)算法的識(shí)別性能。(3)特征空間的抗噪技術(shù)研究,首先介紹了幾種常用的魯棒性特征:梅爾頻率倒譜系數(shù)及感知線性預(yù)測(cè)系數(shù),并對(duì)上述兩種特征分別進(jìn)行改進(jìn);然后,對(duì)改進(jìn)后的兩個(gè)特征進(jìn)行融合;最后,對(duì)改進(jìn)前后的幾種特征參數(shù)做對(duì)比實(shí)驗(yàn),驗(yàn)證了新的特征參數(shù)具有更高的識(shí)別性能。
【關(guān)鍵詞】:說(shuō)話人識(shí)別 端點(diǎn)檢測(cè) 去噪技術(shù) 感知線性預(yù)測(cè) 梅爾頻率倒譜系數(shù)
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 1 緒論9-19
  • 1.1 引言9
  • 1.2 研究背景與意義9-11
  • 1.3 說(shuō)話人識(shí)別的發(fā)展11-12
  • 1.4 說(shuō)話人識(shí)別系統(tǒng)概述12-15
  • 1.4.1 說(shuō)話人識(shí)別的分類和基本組成12-13
  • 1.4.2 說(shuō)話人識(shí)別的特征選取13-14
  • 1.4.3 說(shuō)話人識(shí)別的主要方法14-15
  • 1.5 噪聲環(huán)境下的說(shuō)話人識(shí)別研究現(xiàn)狀及難點(diǎn)15-18
  • 1.5.1 噪聲的分類及影響16
  • 1.5.2 噪聲環(huán)境下說(shuō)話人識(shí)別的基本方法16-18
  • 1.5.3 噪聲環(huán)境下的研究難點(diǎn)18
  • 1.6 本文的組織結(jié)構(gòu)安排18-19
  • 2 說(shuō)話人識(shí)別基本原理19-34
  • 2.1 語(yǔ)音信號(hào)預(yù)處理19-24
  • 2.1.1 語(yǔ)音信號(hào)的預(yù)加重19-20
  • 2.1.2 語(yǔ)音信號(hào)的分幀和加窗20-22
  • 2.1.3 語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)22-24
  • 2.2 語(yǔ)音信號(hào)特征參數(shù)的提取24-30
  • 2.2.1 線性預(yù)測(cè)系數(shù)LPC25-26
  • 2.2.2 線性預(yù)測(cè)倒譜系數(shù)LPCC26-27
  • 2.2.3 梅爾頻率倒譜系數(shù)MFCC27-28
  • 2.2.4 感知線性預(yù)測(cè)倒譜系數(shù)PLPC28-30
  • 2.3 高斯混合模型GMM30-33
  • 2.3.1 GMM模型的基本概念30-31
  • 2.3.2 GMM模型的參數(shù)估計(jì)31-32
  • 2.3.3 GMM模型參數(shù)初始化32
  • 2.3.4 GMM模型的識(shí)別問(wèn)題32-33
  • 2.4 本章小結(jié)33-34
  • 3 語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)技術(shù)及其改進(jìn)34-41
  • 3.1 基于CO復(fù)雜度的端點(diǎn)檢測(cè)34-35
  • 3.2 基于MFCC相似度的端點(diǎn)檢測(cè)35-36
  • 3.3 基于改進(jìn)C0復(fù)雜度和MFCC相似度相結(jié)合的端點(diǎn)檢測(cè)36
  • 3.4 三種端點(diǎn)檢測(cè)算法的對(duì)比實(shí)驗(yàn)36-40
  • 3.4.1 實(shí)驗(yàn)準(zhǔn)備36
  • 3.4.2 實(shí)驗(yàn)結(jié)果分析36-40
  • 3.4.3 實(shí)驗(yàn)小結(jié)40
  • 3.5 本章小結(jié)40-41
  • 4 信號(hào)空間抗噪技術(shù)的改進(jìn)及對(duì)識(shí)別性能的影響41-56
  • 4.1 譜減法41-43
  • 4.1.1 基本譜減法41-42
  • 4.1.2 基本譜減法的改進(jìn)42-43
  • 4.2 維納濾波法43-45
  • 4.2.1 傳統(tǒng)的維納濾波法43-44
  • 4.2.2 基于先驗(yàn)信噪比估計(jì)的維納濾波法44-45
  • 4.3 改進(jìn)的維納濾波法45-46
  • 4.4 語(yǔ)音增強(qiáng)方法的性能評(píng)價(jià)標(biāo)準(zhǔn)46-47
  • 4.4.1 信噪比46-47
  • 4.4.2 失真測(cè)度47
  • 4.5 語(yǔ)音增強(qiáng)算法的抗噪性能對(duì)比試驗(yàn)47-52
  • 4.5.1 實(shí)驗(yàn)準(zhǔn)備47
  • 4.5.2 實(shí)驗(yàn)分析47-52
  • 4.5.3 實(shí)驗(yàn)小結(jié)52
  • 4.6 語(yǔ)音增強(qiáng)算法的識(shí)別性能對(duì)比實(shí)驗(yàn)52-55
  • 4.6.1 實(shí)驗(yàn)準(zhǔn)備53
  • 4.6.2 實(shí)驗(yàn)分析53-54
  • 4.6.3 實(shí)驗(yàn)小結(jié)54-55
  • 4.7 本章小結(jié)55-56
  • 5 特征空間抗噪技術(shù)的改進(jìn)及對(duì)識(shí)別性能的影響56-64
  • 5.1 梅爾頻率倒譜系數(shù)的相關(guān)參數(shù)及改進(jìn)56-58
  • 5.1.1 MFCC參數(shù)56
  • 5.1.2 MFCC參數(shù)的擴(kuò)展及改進(jìn)56-58
  • 5.2 PLPC參數(shù)的擴(kuò)展及改進(jìn)58-60
  • 5.2.1 感知線性預(yù)測(cè)系數(shù)PLPC58
  • 5.2.2 感知對(duì)數(shù)面積比PLAR58-60
  • 5.2.3 改進(jìn)的感知對(duì)數(shù)面積比mPLAR60
  • 5.3 mMFCC_D_D與mPLAR的特征融合60-62
  • 5.3.1 串行特征融合61
  • 5.3.2 主成份分析(PCA)61-62
  • 5.4 特征參數(shù)的識(shí)別性能對(duì)比實(shí)驗(yàn)62-63
  • 5.4.1 實(shí)驗(yàn)準(zhǔn)備62
  • 5.4.2 說(shuō)話人識(shí)別率對(duì)比分析62-63
  • 5.4.3 實(shí)驗(yàn)小結(jié)63
  • 5.5 本章小結(jié)63-64
  • 6 總結(jié)及展望64-65
  • 致謝65-66
  • 參考文獻(xiàn)66-69
  • 附錄69

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 李曄;崔慧娟;唐昆;;基于譜減的語(yǔ)音增強(qiáng)算法的改進(jìn)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年10期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 陳凌輝;說(shuō)話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 唐娜娜;基于穩(wěn)健性PLPC的抗噪語(yǔ)音識(shí)別方法的研究[D];遼寧大學(xué);2011年

2 劉明娟;基于改進(jìn)的特征參數(shù)的說(shuō)話人識(shí)別研究[D];東北大學(xué);2010年


  本文關(guān)鍵詞:噪聲環(huán)境下的說(shuō)話人識(shí)別技術(shù),由筆耕文化傳播整理發(fā)布。



本文編號(hào):394631

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/394631.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶98801***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com