基于GMM-SVM說(shuō)話人識(shí)別的信道算法研究
本文關(guān)鍵詞:基于GMM-SVM說(shuō)話人識(shí)別的信道算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:人與人之間相互交流溝通的直接方式是語(yǔ)音,語(yǔ)音信號(hào)傳播各種有效信息,是承載信息的媒介有著多層次的研究?jī)r(jià)值。語(yǔ)音作為人類(lèi)的直接交流工具,由于不同人發(fā)音器官等的差異以及后天環(huán)境所引起的特性,使得其成為身份識(shí)別的重要工具。語(yǔ)音信號(hào)攜帶者說(shuō)話人特有的差異特征信息,傳達(dá)了說(shuō)話人的語(yǔ)義內(nèi)容,并且還包含了人物本身特定的生理特性、心情等重要的個(gè)人信息,使得研究并利用其特性進(jìn)行實(shí)際應(yīng)用具有很高的價(jià)值。隨著越來(lái)越多的科研工作者致力于語(yǔ)音識(shí)別相關(guān)領(lǐng)域,其應(yīng)用更加廣泛。 說(shuō)話人識(shí)別屬于生物識(shí)別的一種,通過(guò)音頻信號(hào)提取相應(yīng)的特征信息作為說(shuō)話人的個(gè)性特征,并應(yīng)用數(shù)學(xué)理論對(duì)其進(jìn)行分析,從而達(dá)到身份識(shí)別的目的。說(shuō)話人識(shí)別以人所發(fā)出的語(yǔ)音信號(hào)為出發(fā)點(diǎn),從而決定了其相對(duì)廉價(jià)及易于應(yīng)用的特性。特征信號(hào)的提取只需要簡(jiǎn)單的音頻輸入設(shè)備即可,也使得其更容易被廣泛應(yīng)用和接受。在說(shuō)話人識(shí)別取得較大進(jìn)展的時(shí)下而言,該技術(shù)大規(guī)模地應(yīng)用仍然需要解決相當(dāng)多的問(wèn)題,隨著越來(lái)越多的研究人員參與其中,逐漸成為了當(dāng)前的研究熱點(diǎn)。 隨著說(shuō)話人識(shí)別技術(shù)的不斷發(fā)展,研究人員提出多種語(yǔ)音特征參數(shù),并且將動(dòng)態(tài)時(shí)間規(guī)整算法、矢量量化、隱馬爾可夫鏈等用于說(shuō)話人識(shí)別。論文結(jié)合了高斯混合模型(Gaussian Mixture Model, GMM)及支持向量機(jī)(Support Vector Machine, SVM),建立了GMM-SVM說(shuō)話人識(shí)別的基礎(chǔ)算法,其相對(duì)于以往的算法其具有更好的數(shù)據(jù)表征能力,更優(yōu)秀的分類(lèi)性能,更好的識(shí)別效率。通過(guò)進(jìn)一步研究發(fā)現(xiàn)其識(shí)別率進(jìn)一步提高受到信道因素影響較為嚴(yán)重。為了彌補(bǔ)GMM-SVM說(shuō)話人識(shí)別的這一缺點(diǎn),,本文對(duì)特征級(jí)與模型級(jí)信道補(bǔ)償技術(shù)進(jìn)行了研究: 1、特征級(jí)信道處理中,針對(duì)說(shuō)話人語(yǔ)音信號(hào)特征易受到加性噪聲及線性信道干擾而引起失配這一問(wèn)題,本文提出了采用特征彎折技術(shù)對(duì)語(yǔ)音特征數(shù)據(jù)進(jìn)行處理。特征彎折應(yīng)用累積分布函數(shù)的原理把說(shuō)話人的特征向量變?yōu)闃?biāo)準(zhǔn)分布的特征序列,增強(qiáng)語(yǔ)音特征對(duì)于信道的魯棒性及說(shuō)話人識(shí)別抗噪聲性能,在漸變的噪聲環(huán)境及信道失配情形下都能獲得較好的魯棒性。特征彎折作為特征歸一化方法應(yīng)用于說(shuō)話人識(shí)別中,提高了說(shuō)話人識(shí)別的信道魯棒性,加強(qiáng)其對(duì)于不同應(yīng)用環(huán)境的適應(yīng)性能,從而提高說(shuō)話人識(shí)別的性能與準(zhǔn)確性。 2、說(shuō)話人模型是通過(guò)與信道相關(guān)的說(shuō)話人特征矢量建立的,其模型中不可避免的有著信道信息分量的干擾,影響說(shuō)話人識(shí)別的準(zhǔn)確率。針對(duì)這一問(wèn)題,本文提出了采用因子分析算法從說(shuō)話人模型分離出說(shuō)話人空間,信道空間及各自分別對(duì)應(yīng)的特征向量,消除其倒譜特征中存在的冗余分量。通過(guò)將隱藏在觀測(cè)數(shù)據(jù)表面之下的說(shuō)話人及信道信息分離,得到相應(yīng)的特征空間及特征矢量,最終獲得信道無(wú)關(guān)的說(shuō)話人模型數(shù)據(jù)作為支持向量機(jī)的訓(xùn)練數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,應(yīng)用了因子分析技術(shù)模型級(jí)信道補(bǔ)償算法的GMM-SVM的說(shuō)話人識(shí)別方法在識(shí)別效率上超過(guò)了傳統(tǒng)的GMM-SVM方法,具有更好的信道魯棒性。 實(shí)驗(yàn)結(jié)果證明算法性能得到了一定提升。特征彎折算法有效的降低了信道因素對(duì)于倒譜特征的干擾,減小了信號(hào)畸變對(duì)于說(shuō)話人識(shí)別性能的影響,提高了識(shí)別效果。因子分析技術(shù)對(duì)信道因子進(jìn)行估計(jì)并消除,降低信道因素對(duì)于說(shuō)話人模型的影響,提高了算法的性能。
【關(guān)鍵詞】:高斯混合模型 支持向量機(jī) 因子分析 說(shuō)話人識(shí)別
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.34
【目錄】:
- 摘要4-6
- Abstract6-11
- 第1章 緒論11-15
- 1.1 研究背景及意義11-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-13
- 1.3 研究工作概述13-14
- 1.4 論文組織結(jié)構(gòu)14-15
- 第2章 說(shuō)話人識(shí)別理論15-25
- 2.1 說(shuō)話人識(shí)別概述15-18
- 2.1.1 說(shuō)話人識(shí)別的基本方法16-18
- 2.2 GMM 說(shuō)話人識(shí)別18-21
- 2.2.1 高斯混合模型18-19
- 2.2.2 GMM 參數(shù)估計(jì)19-20
- 2.2.3 GMM 說(shuō)話人識(shí)別20-21
- 2.3 GMM-SVM 說(shuō)話人識(shí)別21-25
- 2.3.1 基于 GMM-SVM 的說(shuō)話人識(shí)別算法23-25
- 第3章 基于特征彎折的特征級(jí)信道魯棒性算法研究25-35
- 3.1 特征級(jí)信道魯棒性算法25-27
- 3.1.1 倒譜均值減25
- 3.1.2 倒譜方差歸一化25-26
- 3.1.3 特征映射26
- 3.1.4 特征彎折26-27
- 3.2 基于特征彎折的信道補(bǔ)償算法27-30
- 3.3 基于特征彎折的 GMM-SVM 說(shuō)話人識(shí)別30-31
- 3.4 實(shí)驗(yàn)結(jié)果與分析31-35
- 3.4.1 實(shí)驗(yàn)結(jié)果對(duì)比32-33
- 3.4.2 分析及結(jié)論33-35
- 第4章 基于因子分析的模型級(jí)信道補(bǔ)償算法研究35-50
- 4.1 模型級(jí)信道補(bǔ)償35-41
- 4.1.1 冗余屬性映射36
- 4.1.2 說(shuō)話人模型合成36-38
- 4.1.3 基于鑒別性向量的信道補(bǔ)償38-39
- 4.1.4 基于因子分析的信道補(bǔ)償39-41
- 4.2 基于因子分析的信道補(bǔ)償算法41-45
- 4.2.1 因子分析模型42-43
- 4.2.2 因子分析算法43-45
- 4.3 基于因子分析的 GMM-SVM 說(shuō)話人識(shí)別45-46
- 4.4 實(shí)驗(yàn)結(jié)果與分析46-50
- 第5章 總結(jié)與展望50-52
- 5.1 工作總結(jié)50-51
- 5.2 研究展望51-52
- 參考文獻(xiàn)52-55
- 作者簡(jiǎn)介及在學(xué)期間所取得的科研成果55-56
- 致謝56
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉雪燕;張娜;袁寶玲;;說(shuō)話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期
2 何金鑫;康凱;關(guān)勝曉;;與文本無(wú)關(guān)的聲紋識(shí)別系統(tǒng)的研究[J];電子技術(shù);2013年02期
3 李俊頡;葛良全;涂小芳;;說(shuō)話人識(shí)別系統(tǒng)的實(shí)現(xiàn)[J];電子制作;2014年05期
4 魏君穎;魏維;;說(shuō)話人識(shí)別特征提取算法改進(jìn)[J];成都信息工程學(xué)院學(xué)報(bào);2014年S1期
5 黃奮;馬皓;鄧菁;;說(shuō)話人識(shí)別技術(shù)在社保系統(tǒng)中的遠(yuǎn)程身份認(rèn)證應(yīng)用研究[J];電子技術(shù)與軟件工程;2014年02期
6 沈思秋;呂勇;楊蕓;齊彥云;;基于說(shuō)話人特有特征集的GMM和i-矢量方法的說(shuō)話人識(shí)別[J];電子設(shè)計(jì)工程;2014年23期
7 林琳;陳虹;陳建;金煥梅;;基于多核SVM-GMM的短語(yǔ)音說(shuō)話人識(shí)別[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2013年02期
8 趙玉曉;顧秀秀;張二華;;與文本無(wú)關(guān)說(shuō)話人識(shí)別[J];計(jì)算機(jī)與數(shù)字工程;2014年02期
9 栗志意;張衛(wèi)強(qiáng);何亮;劉加;;基于核函數(shù)的IVEC-SVM說(shuō)話人識(shí)別系統(tǒng)研究[J];自動(dòng)化學(xué)報(bào);2014年04期
10 李壯輝;;基音特征融合高斯混合模型的說(shuō)話人識(shí)別研究[J];測(cè)控技術(shù);2014年06期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 蔣曄;基于短語(yǔ)音和信道變化的說(shuō)話人識(shí)別研究[D];南京理工大學(xué);2013年
2 王琳琳;說(shuō)話人識(shí)別中的時(shí)變魯棒性問(wèn)題研究[D];清華大學(xué);2013年
本文關(guān)鍵詞:基于GMM-SVM說(shuō)話人識(shí)別的信道算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):359745
本文鏈接:http://sikaile.net/kejilunwen/wltx/359745.html