語音聲紋密碼驗證技術研究
本文關鍵詞:語音聲紋密碼驗證技術研究
更多相關文章: 語音聲紋密碼 深度神經網絡 特征端因子分析 差異因子 高斯混合模型
【摘要】:語音聲紋密碼是采用語音段中的文本信息和說話人信息對用戶信息進行雙重加密的技術。因此具有較好的安全性和便捷性,在銀行、公安、智能家居等領域都有廣泛的應用。但是在實際應用中,傳統(tǒng)的語音聲紋密碼識別仍然面臨著密碼泄露、特征冗余、抗干擾性差等方面所帶來的挑戰(zhàn)。傳統(tǒng)的語音聲紋密碼識別屬于文本相關的聲紋識別任務。由于密碼文本是固定的,容易遺忘和泄露,因此安全性不高。針對這個問題,本文采用文本提示型的語音聲紋密碼識別方案。用戶每次登陸系統(tǒng)時系統(tǒng)會提示輸入的動態(tài)密碼,用戶根據提示文本說出密碼語音。這種方法安全性雖然高但動態(tài)聲紋密碼識別屬于文本無關的聲紋識別任務其聲紋識別性能相對較低。針對以上各個問題,本文主要從以下幾個方面來提升文本提示型語音聲紋密碼的識別率。首先,語音聲紋密碼識別系統(tǒng)包含語音密碼識別和聲紋密碼識別兩個部分。因此系統(tǒng)前端需要一個識別率相對較高的語音識別系統(tǒng)來驗證用戶所說密碼是否正確。傳統(tǒng)基于GMM-HMM的語音密碼識別系統(tǒng)識別率相對較低難以滿足安全性要求,因此本文采用識別性能更好的DNN-HMM語音密碼識別系統(tǒng)。第二、傳統(tǒng)聲紋識別中采用的聲學特征(如MFCC,PLP等特征)包含的主要是文本信息和信道信息,說話人信息屬于其中的弱信息。聲紋密碼識別性能極易受到語音信號中的文本、信道以及噪聲等干擾信息的影響。針對這個問題,本文利用深度神經網絡的特征提取能力提出一種基于深度神經網絡的說話人信息提取方法。采用該方法提取出的說話人信息相對傳統(tǒng)聲學特征具有更好的說話人區(qū)分能力。第三、同樣針對傳統(tǒng)聲學特征中包含的冗余信息,本文進一步采用特征端因子分析的方法來去除聲學特征中的冗余干擾信息。傳統(tǒng)的特征端因子分析方法是在高斯混合模型的每個高斯上借用因子分析思想來對特征降維。但GMM模型屬于無監(jiān)督的聚類算法,其每個高斯成分物理意義不夠明確無法與具體的發(fā)音文本信息相對應。為解決這一問題,本文在特征端因子分析中利用語音識別中的聲學模型深度神經網絡取代高斯混合模型,分別對不同音素上的語音特征進行分類然后在每個音素子空間內實現對特征降維,提取出說話人信息并用于提取DNNi-vector。接著在基于DNN的說話人信息提取中,本文采用基于DNN的特征端因子分析取代LDA對每幀語音的隱層輸出超矢量進行降維。最后根據文本提示型的聲紋密碼識別的特點,本文提出分數字建模聲紋密碼識別方案。針對數字聲紋密碼中的每個數字分別訓練一個聲紋識別模型。注冊和測試時匹配同時出現的數字進行測試,將文本無關聲紋密碼識別任務轉化為文本相關聲紋密碼識別任務。本文實驗采用的數據庫為RSR2015數據,通過在該數據庫上的實驗驗證以上所述算法的有效性。
【關鍵詞】:語音聲紋密碼 深度神經網絡 特征端因子分析 差異因子 高斯混合模型
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要5-7
- ABSTRACT7-14
- 主要符號對照表14-15
- 第1章 緒論15-23
- 1.1 語音聲紋密碼的研究背景15-17
- 1.2 語音聲紋密碼的國內外研究現狀17-18
- 1.3 語音聲紋密碼系統(tǒng)的框架18-20
- 1.4 語音聲紋密碼的性能評價指標20-21
- 1.5 論文的研究內容21-22
- 1.6 論文的結構安排22-23
- 第2章 基于DNN-HMM的語音密碼識別系統(tǒng)23-33
- 2.1 引言23
- 2.2 聲學模型深度神經網絡原理23-29
- 2.2.1 深度神經網絡結構23-25
- 2.2.2 深度神經網絡的參數訓練25-27
- 2.2.3 基于DNN-HMM的語音密碼識別27-29
- 2.3 語音聲紋密碼識別的數據庫29-30
- 2.4 實驗結果及分析30-31
- 2.4.1 實驗步驟及配置30
- 2.4.2 實驗結果分析30-31
- 2.5 本章小結31-33
- 第3章 基于深度神經網絡提取說話人信息33-45
- 3.1 引言33
- 3.2 全差異空間因子建模33-37
- 3.2.1 全差異空間因子分析原理33-35
- 3.2.2 TV模型信道補償方法35-37
- 3.3 采用深度神經網絡提取說話人信息37-40
- 3.3.1 說話人信息提取原理37-39
- 3.3.2 說話S-vector注冊和測試算法39-40
- 3.4 實驗結果及分析40-44
- 3.4.1 S-vector說話人區(qū)分性分析40-41
- 3.4.2 RSR2015 PartⅠ聲紋識別實驗41-42
- 3.4.3 RSR2015 PartⅢ數字密碼聲紋識別實驗42-44
- 3.5 本章小結44-45
- 第4章 基于深度神經網絡的特征端因子分析45-59
- 4.1 引言45-46
- 4.2 基于GMM的特征端因子分析46-48
- 4.3 基于DNN的特征端因子分析48-52
- 4.3.1 基于DNN的i-vector技術48-50
- 4.3.2 基于DNN的特征端因子分析50-52
- 4.4 基于DNN的特征端因子分析在S-vector中的應用52-53
- 4.5 實驗結果及分析53-56
- 4.5.1 基于DNN的特征端因子分析在MFCC特征中的應用53-56
- 4.5.2 基于DNN的特征端因子分析在S-vector中的應用56
- 4.6 本章小結56-59
- 第5章 分數字建模聲紋識別技術研究59-65
- 5.1 引言59-60
- 5.2 分詞建模聲紋識別原理60-61
- 5.3 實驗結果及分析61-64
- 5.3.1 基于GMM的分詞建模實驗61-63
- 5.3.2 基于DNN的分詞建模實驗63-64
- 5.4 本章小結64-65
- 第6章 總結與展望65-67
- 6.1 論文總結65-66
- 6.2 研究展望66-67
- 參考文獻67-73
- 致謝73-75
- 在讀期間發(fā)表的學術論文與取得的研究成果75
【相似文獻】
中國期刊全文數據庫 前10條
1 ;得意聲紋加密鑰匙[J];信息網絡安全;2004年10期
2 王英利;論聲紋鑒定中復合韻母和鼻韻母中音素間連接形態(tài)特征[J];警察技術;2001年05期
3 李敬陽;胡國平;王莉;;聲紋自動識別技術與聲紋庫建設應用[J];警察技術;2012年04期
4 深度;;聲紋 讓“芝麻開門”成現實[J];電腦愛好者;2013年04期
5 韓小康;聲紋[J];知識就是力量;1998年08期
6 竇光宇;利用電腦識別聲紋[J];家庭電子;2003年05期
7 陳海東;魏炳生;;淺析計算機聲紋技術在安全防范工作中的應用[J];警察技術;2007年06期
8 孫戎;戚越峰;;聲紋鑒定中鼻塞語聲的研究[J];科教文匯(上旬刊);2012年10期
9 黎粵華,谷志新,劉淑清,王述洋;聲紋認證技術[J];水利科技與經濟;2005年06期
10 徐文華;陳國華;黃國權;;采用特征與用戶名分離方法保護聲紋特征[J];微型機與應用;2012年01期
中國重要會議論文全文數據庫 前10條
1 陳文翔;楊瑩春;;聲紋漂移現象初探[A];第九屆中國語音學學術會議論文集[C];2010年
2 鄭玉玲;張志勇;孟慶華;;光盤聲紋鑒定中的一些問題[A];語言與法律研究的新視野——語言與法律首屆學術研討會論文集[C];2002年
3 曹俊興;;地震聲紋分析[A];中國地球物理2010——中國地球物理學會第二十六屆年會、中國地震學會第十三次學術大會論文集[C];2010年
4 岳俊發(fā);;動態(tài)分析——聲紋鑒定的根本方法[A];邊緣法學論壇[C];2005年
5 單振宇;楊瑩春;吳朝暉;;聲紋打卡系統(tǒng)[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
6 鮑懷翹;;語音學與聲紋鑒定[A];語言與法律研究的新視野——語言與法律首屆學術研討會論文集[C];2002年
7 王英利;;關于聲紋鑒定技術的若干問題[A];第九屆中國語音學學術會議論文集[C];2010年
8 金陽天;;信號增強處理與電話錄音聲紋鑒定[A];第六屆全國現代語音學學術會議論文集(下)[C];2003年
9 李敬陽;崔效義;王莉;馮祖yN;;三種不同錄音器材錄制的電話對聲紋鑒定的影響[A];新世紀的現代語音學——第五屆全國現代語音學學術會議論文集[C];2001年
10 金怡珠;張桂清;劉紅偉;崔效義;;AV VCS變聲語音聲紋變化模式研究[A];第九屆中國語音學學術會議論文集[C];2010年
中國重要報紙全文數據庫 前10條
1 深圳特區(qū)報記者 林清容 實習生 劉春宇;聲紋鑒定協助破案數百起[N];深圳特區(qū)報;2014年
2 本報記者 李嬋;用聲音當鑰匙聲紋鎖是否更安全[N];北京科技報;2005年
3 張書濤;聲紋鑒定:服務偵查破案[N];檢察日報;2002年
4 馮祖yN;聲紋鑒定:個體識別的又一利器[N];人民公安報;2003年
5 喬地;聲紋鑒定技術鎖牢一受賄官員[N];科技日報;2007年
6 南方日報記者 洪奕宜 通訊員 粵公宣;“看得見的聲音”破案更犀利[N];南方日報;2011年
7 ;解密聲紋鎖 一聲令下,“芝麻開門”[N];廣東科技報;2011年
8 曲豆;聲紋鑒定找到敲詐人[N];北京科技報;2004年
9 秦剛邋李厚健;河南洛陽:聲紋鑒定鎖住受賄證據[N];檢察日報;2007年
10 張澤民;中國警方迅速作出反應[N];人民公安報;2004年
中國博士學位論文全文數據庫 前2條
1 潘逸倩;聲紋密碼技術研究[D];中國科學技術大學;2012年
2 朱華虹;聲紋特征模板保護方法研究[D];華南理工大學;2014年
中國碩士學位論文全文數據庫 前10條
1 孟慧;基于小波變換的聲紋參數提取方法與實現[D];沈陽理工大學;2015年
2 柏露;基于性別判定的聲紋辨別與確認系統(tǒng)設計與實現[D];電子科技大學;2014年
3 張冬梅;說話人多維聲紋特征參數提取平臺設計[D];齊齊哈爾大學;2015年
4 張濤濤;語音聲紋密碼驗證技術研究[D];中國科學技術大學;2016年
5 劉大龍;基于感知哈希的音樂聲紋檢索[D];南京郵電大學;2013年
6 谷志新;基于聲紋信息的身份認證模式與算法的研究[D];東北林業(yè)大學;2005年
7 章釗;聲紋密碼識別的關鍵問題研究[D];中國科學技術大學;2011年
8 周傳平;基于熵的音樂聲紋檢索算法的研究與實現[D];南京郵電大學;2012年
9 李敏丹;非線性動力學方法在聲紋分析中的應用[D];浙江大學;2003年
10 陳樂;聲紋分析的非線性動力學方法研究[D];浙江大學;2001年
,本文編號:726826
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/726826.html