基于聲紋識(shí)別的說話人身份確認(rèn)方法的研究
本文關(guān)鍵詞:基于聲紋識(shí)別的說話人身份確認(rèn)方法的研究
更多相關(guān)文章: 聲紋識(shí)別 文本相關(guān) 高斯混合模型 語音識(shí)別
【摘要】:聲紋識(shí)別技術(shù)是一種生物認(rèn)證的方法,從說話人能反映自己生理和行為個(gè)性特征的語音參數(shù)中提取出說話人是誰的信息的過程。聲紋識(shí)別以其的使用靈活、經(jīng)濟(jì)和實(shí)用等方面的優(yōu)勢(shì)在很多領(lǐng)域中有著廣泛的應(yīng)用前景。本文主要對(duì)文本無關(guān)的聲紋識(shí)別技術(shù)、在短時(shí)條件下的與文本相關(guān)的聲紋識(shí)別技術(shù)和聲紋識(shí)別技術(shù)的實(shí)際應(yīng)用等方面的相關(guān)內(nèi)容做出了研究。在文本無關(guān)領(lǐng)域,重點(diǎn)分析了采用最主流的技術(shù)高斯混合模型(Gaussian Mixture Model)和高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM),詳細(xì)介紹了兩種模型的概念、參數(shù)的估計(jì)以及識(shí)別算法等基礎(chǔ)理論,并使用QT這款跨平臺(tái)C++圖形用戶界面應(yīng)用軟件,用圖形用戶界面設(shè)計(jì)了一個(gè)簡(jiǎn)單實(shí)用的基于GMM的與文本無關(guān)的聲紋識(shí)別系統(tǒng),進(jìn)行了相關(guān)模型參數(shù)訓(xùn)練和匹配識(shí)別過程,并通過實(shí)驗(yàn)研究分析了GMM-UBM模型的階數(shù)對(duì)識(shí)別性能的影響。在與文本相關(guān)的聲紋識(shí)別研究中,既要包含說話人身份的識(shí)別,又要包含語音文本內(nèi)容的識(shí)別。本文提出一種結(jié)合語音識(shí)別的與文本相關(guān)的聲紋識(shí)別方法,從而建立說話人的聲紋模型和語音文本模型,與傳統(tǒng)的僅建立一種模型的方法相比,該方法能更精確的描述說話人身份信息和語音的文本信息,較好地解決了短時(shí)語音樣本識(shí)別效果不佳的問題。測(cè)試實(shí)驗(yàn)表明,和傳統(tǒng)與文本相關(guān)的聲紋識(shí)別方法(如DTW、GMM-UBM)相比,在漏警概率相同的條件下,由本方法建立的系統(tǒng)虛警概率降低了8.9%,識(shí)別性能得到了提高。最后在熟練掌握基于GMM-UBM聲紋識(shí)別系統(tǒng)的基礎(chǔ)上,論文針對(duì)聲紋識(shí)別技術(shù)的應(yīng)用方面做出創(chuàng)新性探究,首先設(shè)計(jì)了一種基于聲紋識(shí)別的文件夾多重加密保護(hù)系統(tǒng),不僅將聲紋加密的方法應(yīng)用到文件夾保護(hù),也將傳統(tǒng)文字加密和聲紋加密相結(jié)合。其次,設(shè)計(jì)了一種在Android平臺(tái)下采用聲紋識(shí)別模擬手機(jī)銀行轉(zhuǎn)賬的應(yīng)用軟件,將個(gè)人的聲紋信息來作為銀行轉(zhuǎn)賬時(shí)的支付密碼,即將聲紋識(shí)別的技術(shù)應(yīng)用到轉(zhuǎn)賬業(yè)務(wù)上,為銀行的保護(hù)系統(tǒng)增添新的聲紋密碼服務(wù),也為推動(dòng)聲紋識(shí)別技術(shù)的廣泛應(yīng)用打下堅(jiān)實(shí)的基礎(chǔ)。
【關(guān)鍵詞】:聲紋識(shí)別 文本相關(guān) 高斯混合模型 語音識(shí)別
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-8
- 第1章 緒論8-13
- 1.1 聲紋識(shí)別研究背景及意義8-9
- 1.2 聲紋識(shí)別研究現(xiàn)狀和發(fā)展9-10
- 1.3 聲紋識(shí)別概述10-11
- 1.3.1 聲紋識(shí)別的概念10-11
- 1.3.2 聲紋識(shí)別的分類11
- 1.3.3 聲紋識(shí)別的基本原理和系統(tǒng)結(jié)構(gòu)11
- 1.4 本論文的主要工作11-13
- 第2章 語音信號(hào)的特征提取13-21
- 2.1 語音信號(hào)處理基礎(chǔ)13-15
- 2.1.1 語音信號(hào)的前期處理13-14
- 2.1.2 語音信號(hào)的端點(diǎn)檢測(cè)14-15
- 2.2 常用聲紋識(shí)別的特征參數(shù)15-20
- 2.2.1 LPCC分析16-18
- 2.2.2 MFCC參數(shù)分析18-20
- 2.3 本章小結(jié)20-21
- 第3章 基于高斯混合模型的聲紋識(shí)別技術(shù)21-32
- 3.1 高斯混合模型簡(jiǎn)介21-25
- 3.1.1 GMM模型參數(shù)描述21
- 3.1.2 GMM模型參數(shù)估計(jì)21-22
- 3.1.3 模型參數(shù)初始化22-24
- 3.1.4 基于GMM的說話人確認(rèn)系統(tǒng)24-25
- 3.2 高斯混合通用背景模型25-27
- 3.2.1 模型提出25
- 3.2.2 基于GMM-UBM模型的聲紋識(shí)別系統(tǒng)25-27
- 3.3 聲紋識(shí)別系統(tǒng)界面27-29
- 3.4 實(shí)驗(yàn)29-31
- 3.4.1 實(shí)驗(yàn)數(shù)據(jù)29
- 3.4.2 實(shí)驗(yàn)系統(tǒng)描述29-30
- 3.4.3 實(shí)驗(yàn)結(jié)果與分析30-31
- 3.5 本章小結(jié)31-32
- 第4章 結(jié)合語音識(shí)別的與文本相關(guān)的聲紋識(shí)別方法32-39
- 4.1 引言32-33
- 4.2 聲紋模型與語音文本模型的建立33
- 4.3 智能判定33-35
- 4.4 系統(tǒng)性能評(píng)價(jià)標(biāo)準(zhǔn)35
- 4.5 實(shí)驗(yàn)35-38
- 4.5.1 實(shí)驗(yàn)數(shù)據(jù)采集35-36
- 4.5.2 實(shí)驗(yàn)系統(tǒng)描述36
- 4.5.3 實(shí)驗(yàn)結(jié)果與分析36-38
- 4.6 本章小結(jié)38-39
- 第5章 聲紋識(shí)別系統(tǒng)的應(yīng)用與開發(fā)39-45
- 5.1 一種基于聲紋識(shí)別的文件夾多重加密保護(hù)系統(tǒng)的設(shè)計(jì)39-42
- 5.2 采用聲紋識(shí)別模擬手機(jī)銀行轉(zhuǎn)賬的應(yīng)用軟件設(shè)計(jì)42-44
- 5.3 本章小結(jié)44-45
- 第6章 總結(jié)與展望45-48
- 6.1 總結(jié)45-46
- 6.2 展望46-48
- 參考文獻(xiàn)48-51
- 攻讀學(xué)位期間取得的研究成果51-52
- 致謝52
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王韻琪;俞一彪;;自適應(yīng)高斯混合模型及說話人識(shí)別應(yīng)用[J];通信技術(shù);2014年07期
2 吳慧玲;杜成東;毛鶴;;基于GMM的說話人識(shí)別算法的研究與應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2014年14期
3 趙玉曉;顧秀秀;張二華;;與文本無關(guān)說話人識(shí)別[J];計(jì)算機(jī)與數(shù)字工程;2014年02期
4 陳覺之;張貴榮;周宇歡;;基于GMM模型的自適應(yīng)說話人識(shí)別研究[J];計(jì)算機(jī)與現(xiàn)代化;2013年07期
5 李杰;劉賀平;;用于說話人識(shí)別的基于可變因子整合的高斯混合模型[J];模式識(shí)別與人工智能;2012年06期
6 胡政權(quán);曾毓敏;宗原;李夢(mèng)超;;說話人識(shí)別中MFCC參數(shù)提取的改進(jìn)[J];計(jì)算機(jī)工程與應(yīng)用;2014年07期
7 陳黎;徐東平;;基于SVM-GMM的開集說話人識(shí)別方法[J];計(jì)算機(jī)工程;2011年14期
8 曹潔;潘鵬;;基于GMM的說話人識(shí)別技術(shù)研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年11期
9 陳業(yè)仙;張歆奕;毛杰;;基于GMM-UBM的語言辨識(shí)算法研究[J];五邑大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
10 檀蕊蓮;;基于DTW的說話人識(shí)別技術(shù)研究[J];黑龍江科技信息;2010年13期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 辛全超;基于GMM的說話人語音識(shí)別研究與實(shí)踐[D];華東師范大學(xué);2010年
,本文編號(hào):857447
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/857447.html