天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于支持向量機(jī)的MFCC特征參量研究和核函數(shù)選擇分析

發(fā)布時(shí)間:2017-09-29 10:44

  本文關(guān)鍵詞:基于支持向量機(jī)的MFCC特征參量研究和核函數(shù)選擇分析


  更多相關(guān)文章: 說(shuō)話人識(shí)別 語(yǔ)音預(yù)處理 Mel頻率倒譜系數(shù) 支持向量機(jī) 平均影響值


【摘要】:說(shuō)話人識(shí)別是人與生俱來(lái)的一種生理或行為特征,與其它生物識(shí)別,如:指紋、人臉、虹膜等相比,更加簡(jiǎn)單、經(jīng)濟(jì)、方便快捷。說(shuō)話人識(shí)別從信號(hào)檢測(cè)與處理、模式識(shí)別、人工智能、機(jī)器學(xué)習(xí)等理論與技術(shù)的發(fā)展中形成,是一個(gè)涉及生理學(xué)、心理學(xué)、聲學(xué)、語(yǔ)音學(xué)等多領(lǐng)域的綜合課程。說(shuō)話人識(shí)別受到下面因素的影響:一是特征參數(shù),能夠表征說(shuō)話人個(gè)性的特征參數(shù)有很多種,其中,當(dāng)輸入一個(gè)信號(hào)時(shí),Mel頻率倒譜系數(shù)(MFCC)對(duì)其沒(méi)有任何猜想,也不做任何限制,對(duì)信號(hào)的性質(zhì)也沒(méi)有依賴性,又利用了聽(tīng)覺(jué)模型的研究成果,符合實(shí)際的聽(tīng)音效果。在用于替代人耳來(lái)分析語(yǔ)音時(shí),有很好的性能和魯棒性,所以本文選取的特征參數(shù)為MFCC參數(shù)。二是識(shí)別模型,說(shuō)話人識(shí)別模型也有很多種,其中,支持向量機(jī)(SVM)在小樣本、非線性、局部極小值和高維模式識(shí)別中優(yōu)勢(shì)明顯,具有很強(qiáng)的對(duì)新鮮樣本適應(yīng)的能力,所以本文選取的識(shí)別模型為SVM。本文從對(duì)MFCC特征參數(shù)的處理和SVM的核函數(shù)優(yōu)化兩方面進(jìn)行了研究,主要是下面四方面的研究?jī)?nèi)容:(1)本文對(duì)語(yǔ)音預(yù)處理中語(yǔ)音分幀、預(yù)加重系數(shù)、采樣頻率、Mel濾波器個(gè)數(shù),這四個(gè)量的選取對(duì)語(yǔ)音分類率的影響作了分析,依次設(shè)定其中一個(gè)為變量其它全為定量的方法進(jìn)行研究。實(shí)驗(yàn)表明:可以對(duì)語(yǔ)音進(jìn)行幀長(zhǎng)N=512、幀移M=170的分幀;預(yù)加重系數(shù)a=0.91;采樣頻率f=16KHz; Mel濾波器的個(gè)數(shù)m=24的預(yù)處理,經(jīng)過(guò)這樣的預(yù)處理后,得到的MFCC參數(shù)更加穩(wěn)健。(2)很多實(shí)驗(yàn)已經(jīng)證明MFCC參數(shù)最前面的幾維對(duì)語(yǔ)音的分類性能影響較大,但是沒(méi)有考慮過(guò)最前面的幾組對(duì)語(yǔ)音分類率的影響,本文對(duì)MFCC特征參數(shù)的前面幾組(分析了前面兩組)的重要性也作了分析。實(shí)驗(yàn)表明:應(yīng)該保留全部200組MFCC特征參數(shù)。(3)本文對(duì)SVM的核函數(shù)類型以及核參數(shù)選取對(duì)SVM分類能力的影響作了分析。實(shí)驗(yàn)表明:在SVM中采用RBF核這個(gè)核函數(shù),能得到最高的分類準(zhǔn)確率;用網(wǎng)格搜索和K折交叉驗(yàn)證法選擇出的參數(shù)優(yōu)于人為(憑經(jīng)驗(yàn))選定的核參數(shù)。(4)MFCC參數(shù)各維數(shù)之間存在大量冗余信息,引用平均影響值法對(duì)每維MFCC參數(shù)進(jìn)行排序,可以剔除相對(duì)重要性低的MFCC。本文研究與以往不同的是,往常在MFCC參數(shù)原值的基礎(chǔ)上加/減10%,本文新增加浮動(dòng)量到30%、50%、70%、90%。實(shí)驗(yàn)表明:在原始特征的基礎(chǔ)上加/減90%,這樣篩選出的MFCC參數(shù)訓(xùn)練SVM,得到的最高語(yǔ)音分類率優(yōu)于其他浮動(dòng)量下得到的最高語(yǔ)音分類率。而且降維后,在選取最高10維時(shí),得到的語(yǔ)音分類率和運(yùn)行效率優(yōu)于保留全部維數(shù)得到的語(yǔ)音分類率和運(yùn)行效率。通過(guò)本文的研究,對(duì)MFCC參數(shù)進(jìn)行一系列的預(yù)處理和用平均影響值方法對(duì)MFCC參數(shù)進(jìn)行降維后,得到MFCC特征參數(shù)更穩(wěn)健、魯棒性能更強(qiáng)。而且只有核函數(shù)選擇準(zhǔn)確、參數(shù)選擇合適,SVM的分類能力才會(huì)最優(yōu)。
【關(guān)鍵詞】:說(shuō)話人識(shí)別 語(yǔ)音預(yù)處理 Mel頻率倒譜系數(shù) 支持向量機(jī) 平均影響值
【學(xué)位授予單位】:陜西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要3-5
  • Abstract5-9
  • 第1章 緒論9-15
  • 1.1 說(shuō)話人識(shí)別的研究進(jìn)展9-11
  • 1.1.1 國(guó)外研究狀況9-10
  • 1.1.2 國(guó)內(nèi)研究狀況10-11
  • 1.2 說(shuō)話人識(shí)別概述11-12
  • 1.2.1 說(shuō)話人識(shí)別的概念11
  • 1.2.2 說(shuō)話人識(shí)別的分類11-12
  • 1.2.3 說(shuō)話人識(shí)別的系統(tǒng)結(jié)構(gòu)12
  • 1.2.4 說(shuō)話人識(shí)別的優(yōu)勢(shì)與應(yīng)用前景12
  • 1.3 本文的主要工作12-13
  • 1.4 論文的結(jié)構(gòu)安排13-15
  • 第2章 說(shuō)話人識(shí)別系統(tǒng)15-31
  • 2.1 語(yǔ)音信號(hào)預(yù)處理15-18
  • 2.1.1 采樣15-16
  • 2.1.2 量化16
  • 2.1.3 預(yù)加重處理16-17
  • 2.1.4 分幀和加窗17-18
  • 2.2 MFCC特征介紹18-20
  • 2.2.1 MFCC參數(shù)的提取過(guò)程18-20
  • 2.2.2 Mel頻率與線性頻率的關(guān)系20
  • 2.3 統(tǒng)計(jì)學(xué)習(xí)理論初步20-22
  • 2.4 支持向量機(jī)的基本理論22-27
  • 2.4.1 線性可分問(wèn)題22-25
  • 2.4.2 線性不可分問(wèn)題25-26
  • 2.4.3 非線性分類問(wèn)題26-27
  • 2.4.4 多分類問(wèn)題27
  • 2.5 核函數(shù)類型27-28
  • 2.6 參數(shù)尋優(yōu)28-31
  • 2.6.1 網(wǎng)格算法29
  • 2.6.2 交叉驗(yàn)證法29-31
  • 第3章 預(yù)處理分析及SVM模型選擇分析31-43
  • 3.1 實(shí)驗(yàn)環(huán)境與語(yǔ)音數(shù)據(jù)庫(kù)31
  • 3.2 實(shí)驗(yàn)?zāi)康呐c方法31-32
  • 3.3 語(yǔ)音預(yù)處理影響32-37
  • 3.3.1 語(yǔ)音分幀影響32-34
  • 3.3.2 預(yù)加重系數(shù)影響34-35
  • 3.3.3 采樣頻率影響35-36
  • 3.3.4 Mel濾波器的個(gè)數(shù)影響36-37
  • 3.4 歸一化MFCC參數(shù)分析37-39
  • 3.5 前幾組MFCC參數(shù)分析39-40
  • 3.6 SVM模型選擇分析40-42
  • 3.6.1 核函數(shù)類型影響40-41
  • 3.6.2 核參數(shù)影響41-42
  • 3.7 本章小結(jié)42-43
  • 第4章 平均影響值研究43-57
  • 4.1 實(shí)驗(yàn)?zāi)康呐c方法43
  • 4.2 平均影響值介紹43-44
  • 4.3 平均影響值選取分析44-47
  • 4.4 重組MFCC參數(shù)下的語(yǔ)音分類47-53
  • 4.5 采用MIV的優(yōu)勢(shì)53-55
  • 4.6 本章小結(jié)55-57
  • 第5章 總結(jié)與展望57-59
  • 5.1 論文工作總結(jié)57-58
  • 5.2 下一步工作展望58-59
  • 參考文獻(xiàn)59-65
  • 致謝65-67
  • 攻讀學(xué)位期間的研究成果67

【引證文獻(xiàn)】

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 遲惠生;;自動(dòng)發(fā)音人識(shí)別——一個(gè)需要努力探索的領(lǐng)域[A];IEEE北京分會(huì)第一屆學(xué)術(shù)年會(huì)論文集[C];1987年

,

本文編號(hào):941574

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/941574.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶58b9e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com