變形欺騙性語音的檢測(cè)算法研究及對(duì)其魯棒的說話人識(shí)別系統(tǒng)實(shí)現(xiàn)
發(fā)布時(shí)間:2023-06-06 20:20
已有研究及實(shí)踐均證明語音變形(Voice Transformation,VT)、語音轉(zhuǎn)換(Voice Conversion,VC)、語音合成(Speech Synthesis,SS)及重播語音等欺騙性語音能有效地欺騙自動(dòng)說話人識(shí)別系統(tǒng),給社會(huì)安全帶來嚴(yán)重的危害。目前已有的研究主要集中于對(duì)VC、SS及重播語音的檢測(cè),而對(duì)VT相關(guān)的安全問題研究相對(duì)不足。然而,相較實(shí)現(xiàn)成本較高且算法尚未完全成熟的VC及SS等操作,VT已有的算法能在改變說話人聲音的同時(shí)高度保持語音的自然性,同時(shí)實(shí)現(xiàn)方式及成本便捷低廉,已集成在很多語音處理工具中,并在眾多的案件中作為犯罪手段。因此,研究VT欺騙性語音的安全問題具有重要意義。為此,本文研究VT欺騙性語音的檢測(cè)算法,并實(shí)現(xiàn)對(duì)VT欺騙魯棒的說話人識(shí)別系統(tǒng)。本文主要的工作如下:1.提出一種基于高斯混合模型-通用背景模型超向量的VT語音檢測(cè)算法。該算法利用MFCC在UBM下自適應(yīng)得出的GMM-UBM超向量作為學(xué)習(xí)特征,并利用支持向量機(jī)作為分類方法。實(shí)驗(yàn)結(jié)果表明,該算法的識(shí)別率能達(dá)到98.62%。同時(shí),當(dāng)測(cè)試語音時(shí)長(zhǎng)較短時(shí),該算法能保持高識(shí)別率。2.利用Visual St...
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 欺騙性語音安全問題研究的背景及意義
1.2 欺騙性語音安全問題的現(xiàn)狀與發(fā)展
1.3 本文的文章結(jié)構(gòu)
2 基礎(chǔ)理論概述
2.1 語音預(yù)處理
2.2 端點(diǎn)檢測(cè)
2.3 語音信號(hào)的頻域分析
2.3.1 短時(shí)傅里葉變換
2.3.2 倒譜分析與同態(tài)濾波處理
2.3.3 梅爾頻率倒譜系數(shù)
2.4 說話人識(shí)別模型
3 基于GMM-UBM超向量的VT欺騙性語音檢測(cè)算法
3.1 語音變形(VT)原理
3.2 基于MFCC的兩種特征提取
3.2.1 GMM超向量
3.2.2 MFCC統(tǒng)計(jì)矩特征
3.3 欺騙性語音VT的訓(xùn)練與檢測(cè)
3.3.1 VT的量化分析
3.3.2 建立多SVM混合模型
3.3.3 VT檢測(cè)算法
3.4 實(shí)驗(yàn)結(jié)果
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果分析
4 VT欺騙魯棒的說話人識(shí)別系統(tǒng)實(shí)現(xiàn)
4.1 系統(tǒng)的模塊設(shè)計(jì)
4.1.1 開發(fā)環(huán)境
4.1.2 系統(tǒng)模塊安排
4.2 特征提取模塊
4.2.1 讀入文件和預(yù)處理
4.2.2 特征提取功能
4.3 模型訓(xùn)練模塊
4.3.1 GMM 訓(xùn)練功能
4.3.2 SVM訓(xùn)練功能
4.4 檢測(cè)識(shí)別模塊
4.4.1 檢測(cè)功能
4.4.2 說話人識(shí)別功能
5 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的學(xué)術(shù)成果
學(xué)位論文數(shù)據(jù)集表
本文編號(hào):3832159
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 欺騙性語音安全問題研究的背景及意義
1.2 欺騙性語音安全問題的現(xiàn)狀與發(fā)展
1.3 本文的文章結(jié)構(gòu)
2 基礎(chǔ)理論概述
2.1 語音預(yù)處理
2.2 端點(diǎn)檢測(cè)
2.3 語音信號(hào)的頻域分析
2.3.1 短時(shí)傅里葉變換
2.3.2 倒譜分析與同態(tài)濾波處理
2.3.3 梅爾頻率倒譜系數(shù)
2.4 說話人識(shí)別模型
3 基于GMM-UBM超向量的VT欺騙性語音檢測(cè)算法
3.1 語音變形(VT)原理
3.2 基于MFCC的兩種特征提取
3.2.1 GMM超向量
3.2.2 MFCC統(tǒng)計(jì)矩特征
3.3 欺騙性語音VT的訓(xùn)練與檢測(cè)
3.3.1 VT的量化分析
3.3.2 建立多SVM混合模型
3.3.3 VT檢測(cè)算法
3.4 實(shí)驗(yàn)結(jié)果
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果分析
4 VT欺騙魯棒的說話人識(shí)別系統(tǒng)實(shí)現(xiàn)
4.1 系統(tǒng)的模塊設(shè)計(jì)
4.1.1 開發(fā)環(huán)境
4.1.2 系統(tǒng)模塊安排
4.2 特征提取模塊
4.2.1 讀入文件和預(yù)處理
4.2.2 特征提取功能
4.3 模型訓(xùn)練模塊
4.3.1 GMM 訓(xùn)練功能
4.3.2 SVM訓(xùn)練功能
4.4 檢測(cè)識(shí)別模塊
4.4.1 檢測(cè)功能
4.4.2 說話人識(shí)別功能
5 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的學(xué)術(shù)成果
學(xué)位論文數(shù)據(jù)集表
本文編號(hào):3832159
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3832159.html
最近更新
教材專著