基于深度置信網(wǎng)絡(luò)的說話人識(shí)別研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2017-10-27 19:21
本文關(guān)鍵詞:基于深度置信網(wǎng)絡(luò)的說話人識(shí)別研究與實(shí)現(xiàn)
更多相關(guān)文章: 深度學(xué)習(xí) 說話人識(shí)別 語(yǔ)音濾波 深度置信網(wǎng)絡(luò) 特征提取 梅爾倒譜系數(shù)
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,在越來越多的領(lǐng)域內(nèi)都應(yīng)用了語(yǔ)音信號(hào)處理技術(shù),其中一個(gè)重要分支為說話人識(shí)別技術(shù),它是目前語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域中的一個(gè)研究熱點(diǎn)。說話人識(shí)別是對(duì)說話人身份進(jìn)行認(rèn)證的一種技術(shù),包括語(yǔ)音錄入、預(yù)處理、特征提取、模型訓(xùn)練以及模式匹配,它是通過從經(jīng)過預(yù)處理后的語(yǔ)音中獲取語(yǔ)音特征進(jìn)行模型訓(xùn)練與模式匹配從而確定說話人身份。從該過程可知特征提取是其他步驟的基礎(chǔ),它是說話人識(shí)別中最重要的一個(gè)環(huán)節(jié),因此本文分析了特征提取方法的優(yōu)缺點(diǎn)并提出了一種基于改進(jìn)參數(shù)設(shè)置的深度置信網(wǎng)絡(luò)的特征提取算法。影響特征提取的因素有很多,其中噪聲是最為直接的因素,從而必須在特征提取前對(duì)語(yǔ)音進(jìn)行濾波操作,因此本文也分析語(yǔ)音濾波方法的優(yōu)缺點(diǎn)并提出一種多層自適應(yīng)形態(tài)濾波算法,并且以此為基礎(chǔ)設(shè)計(jì)實(shí)現(xiàn)一個(gè)說話人識(shí)別的原型系統(tǒng)。本文的主要工作為:(1)歸納了語(yǔ)音濾波算法和特征提取算法的特點(diǎn)和難點(diǎn),對(duì)比分析了目前常用的語(yǔ)音濾波算法和特征提取算法的優(yōu)缺點(diǎn)。(2)現(xiàn)有的大多濾波算法在進(jìn)行語(yǔ)音濾波時(shí)損失了較多的純凈語(yǔ)音信號(hào)從而使得語(yǔ)音質(zhì)量下降,利用形態(tài)濾波算法進(jìn)行濾波時(shí)既可以很好的濾除語(yǔ)音中的噪音同時(shí)也可以減少純凈語(yǔ)音信號(hào)的損失,然而現(xiàn)有形態(tài)濾波算法還存在結(jié)構(gòu)固定、預(yù)設(shè)結(jié)構(gòu)元素和偏倚校正系數(shù)等問題,針對(duì)該問題,提出一種多層自適應(yīng)形態(tài)濾波算法。該算法面對(duì)復(fù)雜變化的噪聲時(shí),可以靈活選擇不同的結(jié)構(gòu)元素、優(yōu)化設(shè)置偏倚校正系數(shù)向量來減弱形態(tài)開運(yùn)算和形態(tài)閉運(yùn)算所帶來的偏倚現(xiàn)象。仿真結(jié)果表明該算法改善了形態(tài)濾波的性能,具有設(shè)計(jì)簡(jiǎn)單、實(shí)用性強(qiáng)的特點(diǎn)。(3)現(xiàn)有的特征提取方法中對(duì)初始特征的處理大多是進(jìn)行簡(jiǎn)單的組合、微分、篩選或加權(quán)等,所提取特征表征能力較弱,用其進(jìn)行說話人識(shí)別時(shí)正確率較低。針對(duì)此問題,將深度置信網(wǎng)絡(luò)用于特征提取并對(duì)其參數(shù)的設(shè)置進(jìn)行改進(jìn)使得所提取特征具有更強(qiáng)表征能力。仿真結(jié)果表明該算法所提取的特征能有效的降低說話人識(shí)別的誤識(shí)率。(4)對(duì)說話人識(shí)別原型系統(tǒng)的需求進(jìn)行了分析,根據(jù)說話人識(shí)別的處理流程進(jìn)行了功能劃分,并給出了說話人識(shí)別的系統(tǒng)結(jié)構(gòu),對(duì)其中的核心模塊進(jìn)行了詳細(xì)設(shè)計(jì)并予以實(shí)現(xiàn),最后對(duì)系統(tǒng)的功能和性能進(jìn)行了測(cè)試并對(duì)測(cè)試結(jié)果進(jìn)行了相應(yīng)的分析。
【關(guān)鍵詞】:深度學(xué)習(xí) 說話人識(shí)別 語(yǔ)音濾波 深度置信網(wǎng)絡(luò) 特征提取 梅爾倒譜系數(shù)
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要4-5
- abstract5-9
- 第一章 緒論9-20
- 1.1 課題背景及意義9-10
- 1.2 說話人識(shí)別10-12
- 1.2.1 說話人識(shí)別的基本概念10-11
- 1.2.2 說話人識(shí)別的優(yōu)勢(shì)與應(yīng)用前景11-12
- 1.3 說話人識(shí)別的研究現(xiàn)狀12-18
- 1.4 論文主要工作18-19
- 1.5 論文的組織結(jié)構(gòu)19-20
- 第二章 說話人識(shí)別中的關(guān)鍵技術(shù)20-36
- 2.1 說話人識(shí)別的處理流程20-21
- 2.2 語(yǔ)音濾波21-25
- 2.2.1 經(jīng)典語(yǔ)音濾波方法22-23
- 2.2.2 語(yǔ)音濾波效果的評(píng)價(jià)體系23-25
- 2.3 特征提取25-31
- 2.3.1 經(jīng)典的特征提取方法25-29
- 2.3.2 特征優(yōu)劣的評(píng)價(jià)體系29-31
- 2.4 模式匹配31-34
- 2.4.1 經(jīng)典模式匹配方法31-32
- 2.4.2 模式匹配方法優(yōu)劣的評(píng)價(jià)體系32-34
- 2.5 實(shí)驗(yàn)語(yǔ)料庫(kù)34-35
- 2.6 本章小結(jié)35-36
- 第三章 一種多層自適應(yīng)形態(tài)濾波算法36-56
- 3.1 語(yǔ)音濾波方法36-39
- 3.2 形態(tài)濾波的原理39-43
- 3.2.1 膨脹運(yùn)算及腐蝕運(yùn)算39-40
- 3.2.2 開運(yùn)算及閉運(yùn)算40-42
- 3.2.3 經(jīng)典數(shù)學(xué)形態(tài)濾波器42-43
- 3.3 形態(tài)學(xué)濾波的相關(guān)算法43-45
- 3.4 多層自適應(yīng)形態(tài)濾波算法45-49
- 3.4.1 多層結(jié)構(gòu)45-46
- 3.4.2 自適應(yīng)設(shè)置一維偏倚校正系數(shù)向量46-47
- 3.4.3 多層自適應(yīng)形態(tài)濾波算法47-49
- 3.5 實(shí)驗(yàn)及結(jié)果分析49-54
- 3.5.1 Ⅰ型高斯白噪聲的濾波49-50
- 3.5.2 Ⅱ型高斯白噪聲的濾波50-52
- 3.5.3 高斯白噪聲和sin函數(shù)噪聲混合噪聲的濾波52-53
- 3.5.4 高斯白噪聲、sin函數(shù)噪聲和cos函數(shù)噪聲混合噪聲的濾波53-54
- 3.6 本章小結(jié)54-56
- 第四章 基于深度置信網(wǎng)絡(luò)的特征提取算法56-72
- 4.1 特征提取方法56-57
- 4.2 深度置信網(wǎng)絡(luò)57-61
- 4.2.1 受限玻爾茲曼機(jī)58-59
- 4.2.2 DBNs訓(xùn)練59-61
- 4.3 基于誤差判斷的改進(jìn)DBNs61-67
- 4.3.1 初始參數(shù)的設(shè)置61-64
- 4.3.2 DBNs深度的設(shè)置64-65
- 4.3.3 基于改進(jìn)DBNs的特征提取算法65-67
- 4.4 實(shí)驗(yàn)及結(jié)果分析67-71
- 4.4.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理67-68
- 4.4.2 確定終止RBM迭代訓(xùn)練的閾值68-69
- 4.4.3 確定終止RBM疊加的閾值69-70
- 4.4.4 基于改進(jìn)DBNs所提取特征優(yōu)劣的比較70-71
- 4.5 本章小結(jié)71-72
- 第五章 基于DBNs說話人識(shí)別的原型系統(tǒng)設(shè)計(jì)72-90
- 5.1 需求分析72-74
- 5.2 系統(tǒng)設(shè)計(jì)74-78
- 5.2.1 概要設(shè)計(jì)74-75
- 5.2.2 詳細(xì)設(shè)計(jì)75-78
- 5.3 功能實(shí)現(xiàn)78-82
- 5.4 系統(tǒng)測(cè)試和結(jié)果分析82-89
- 5.5 本章小結(jié)89-90
- 第六章 總結(jié)與展望90-92
- 6.1 論文工作總結(jié)90-91
- 6.2 研究展望91-92
- 參考文獻(xiàn)92-96
- 附錄1 攻讀碩士學(xué)位期間撰寫的論文96-97
- 附錄2 攻讀碩士學(xué)位期間申請(qǐng)的專利97-98
- 致謝98
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 栗志意;張衛(wèi)強(qiáng);何亮;劉加;;基于核函數(shù)的IVEC-SVM說話人識(shí)別系統(tǒng)研究[J];自動(dòng)化學(xué)報(bào);2014年04期
2 ;Single-channel speech enhancement method based on masking properties and minimum statistics[J];Journal of Systems Engineering and Electronics;2004年02期
,本文編號(hào):1104859
本文鏈接:http://sikaile.net/kejilunwen/wltx/1104859.html
最近更新
教材專著