基于文本無關(guān)的說話人識(shí)別技術(shù)的研究
本文關(guān)鍵詞:基于文本無關(guān)的說話人識(shí)別技術(shù)的研究
更多相關(guān)文章: 文本無關(guān) 清濁音劃分 基因周期檢測(cè) 音素分類
【摘要】:在實(shí)際生活中,身份認(rèn)證應(yīng)用在各個(gè)領(lǐng)域,身份認(rèn)證的方法有很多種,比如指紋、虹膜、人臉等等,聲紋識(shí)別也是其中一種,又叫說話人識(shí)別,是通過說話人的聲音辨識(shí)出說話者身份。說話人識(shí)別又分為與文本相關(guān)的和與文本無關(guān)的,本文主要研究與文本無關(guān)的說話人識(shí)別技術(shù),因?yàn)槠涓哂惺褂脙r(jià)值,并且提升空間比較大。通過對(duì)其關(guān)鍵技術(shù)的研究,以提高系統(tǒng)識(shí)別性能。本文在現(xiàn)有與文本無關(guān)的說話人識(shí)別技術(shù)的基礎(chǔ)上,結(jié)合語(yǔ)音學(xué)、音韻學(xué)及其語(yǔ)音信號(hào)的特征,研究基于文本無關(guān)的說話人識(shí)別關(guān)鍵技術(shù)。主要的研究?jī)?nèi)容包括以下幾個(gè)方面:清濁音劃分。在對(duì)語(yǔ)音信號(hào)排除靜音信號(hào)基礎(chǔ)上,針對(duì)過零率劃分清濁音方法,在處理振幅均值不在零點(diǎn)的信號(hào)時(shí)失效的問題,提出了有效翻轉(zhuǎn)率方法;又針對(duì)清、濁音有效翻轉(zhuǎn)率相似部分,運(yùn)用頻譜振幅均值方法區(qū)分清濁音;糁芷跈z測(cè)。在對(duì)語(yǔ)音信號(hào)靜音、清音、濁音劃分的基礎(chǔ)上,針對(duì)語(yǔ)音信號(hào)周期特征明顯段分布隨機(jī)性問題,提出改進(jìn)的LVAMDF(變長(zhǎng)度平均幅度差函數(shù)法)及綜合多因素基音檢測(cè)算法,該算法對(duì)語(yǔ)音信號(hào)進(jìn)行周期特征明顯段和周期特征不明顯段的聚類劃分,同時(shí),獲取周期特征明顯語(yǔ)音段的所有基音周期的起止端點(diǎn),針對(duì)少數(shù)基音周期劃分倍頻或半頻問題,提出識(shí)別、修正方法,其識(shí)別、修正率極高。與文本無關(guān)的說話人識(shí)別系統(tǒng)。根據(jù)與文本無關(guān)的說話人識(shí)別系統(tǒng)原理,運(yùn)用matlab和C++混合編程,完成說話人識(shí)別系統(tǒng)和系統(tǒng)測(cè)試,系統(tǒng)的等錯(cuò)誤率可達(dá)0.4762%。基于音素分類的說話人識(shí)別系統(tǒng)理論研究。在TIMIT語(yǔ)料庫(kù)的音素標(biāo)注基礎(chǔ)上,運(yùn)用混淆矩陣原理,研究了不同說話人不同發(fā)音特征的相似性和差異性,從而以強(qiáng)調(diào)差異性避開相似性的方法提高系統(tǒng)性能。該部分完成了部分理論研究和部分功能實(shí)現(xiàn)。本文提高了系統(tǒng)2處關(guān)鍵技術(shù)的性能,完成了與文本無關(guān)的說話人識(shí)別系統(tǒng)的功能,最后提出了系統(tǒng)識(shí)別原理的改進(jìn)方案。由于工作量較大,改進(jìn)方案還需完善和驗(yàn)證,系統(tǒng)性能還需要從音素識(shí)別、特征提取和系統(tǒng)原理方面進(jìn)一步提升。
【關(guān)鍵詞】:文本無關(guān) 清濁音劃分 基因周期檢測(cè) 音素分類
【學(xué)位授予單位】:西南科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要4-6
- ABSTRACT6-11
- 1 緒論11-17
- 1.1 選題背景及研究意義11-13
- 1.2 課題的研究現(xiàn)狀13-15
- 1.3 論文的主要研究工作及安排15-16
- 1.4 本章小結(jié)16-17
- 2 與文本無關(guān)的說話人識(shí)別原理17-39
- 2.1 原理結(jié)構(gòu)17-18
- 2.2 預(yù)處理18-23
- 2.3 特征提取23-32
- 2.3.1 mfcc原理結(jié)構(gòu)23-24
- 2.3.2 人類發(fā)音原理24-25
- 2.3.3 倒譜分析原理25-29
- 2.3.4 梅爾頻率29-32
- 2.4 GMM-UBM模型及其識(shí)別打分32-38
- 2.4.1 GMM介紹33-34
- 2.4.2 EM算法34-35
- 2.4.3 MAP自適應(yīng)35-37
- 2.4.4 似然比得分37-38
- 2.5 本章小結(jié)38-39
- 3 語(yǔ)音信號(hào)清濁劃分39-51
- 3.1 清濁音劃分的原理39-40
- 3.2 排除靜音語(yǔ)音段40
- 3.3 清濁音劃分40-42
- 3.3.1 判斷有沒有清音信號(hào)40-41
- 3.3.2 劃分清音信號(hào)結(jié)束位置41-42
- 3.4 短時(shí)平均過零率法42-44
- 3.5 短時(shí)有效翻轉(zhuǎn)率法44-49
- 3.6 實(shí)驗(yàn)結(jié)果49
- 3.7 本章小結(jié)49-51
- 4 語(yǔ)音信號(hào)基音周期檢測(cè)51-63
- 4.1 基音周期檢測(cè)原理51-52
- 4.2 預(yù)處理52
- 4.3 檢測(cè)基音周期52-53
- 4.4 LVAMDF算法改進(jìn)53-58
- 4.4.1 在周期端點(diǎn)檢測(cè)部分LVAMDF的優(yōu)化53-55
- 4.4.2 在倍頻和半頻識(shí)別修正部分LVAMDF的優(yōu)化55-58
- 4.5 LVAMDF算法58
- 4.6 實(shí)驗(yàn)結(jié)果58-61
- 4.7 本章小結(jié)61-63
- 5 基于音素分類的說話人識(shí)別系統(tǒng)63-72
- 5.1 音素分類的說話人識(shí)別原理63-64
- 5.2 音素識(shí)別64-65
- 5.3 音素分類方法65-69
- 5.3.1 模型建立部分的音素分類方法65-66
- 5.3.2 說話人差異分析音素分類66-69
- 5.4 音素分類實(shí)現(xiàn)69-71
- 5.4.1 建立背景模型的實(shí)現(xiàn)69
- 5.4.2 生成注冊(cè)者特征模型的實(shí)現(xiàn)69-70
- 5.4.3 識(shí)別測(cè)試者的實(shí)現(xiàn)70
- 5.4.4 說話人差異分析音素分類實(shí)現(xiàn)70-71
- 5.5 本章小結(jié)71-72
- 6 與文本無關(guān)的說話人識(shí)別系統(tǒng)的測(cè)試72-79
- 6.1 系統(tǒng)評(píng)估標(biāo)準(zhǔn)72-76
- 6.1.1 檢測(cè)代價(jià)函數(shù)73
- 6.1.2 等錯(cuò)誤率與DET曲線73-76
- 6.2 測(cè)試數(shù)據(jù)76-77
- 6.3 測(cè)試結(jié)果77-78
- 6.4 本章小結(jié)78-79
- 結(jié)論79-81
- 致謝81-83
- 參考文獻(xiàn)83-88
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文及研究成果88
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 潘崢嶸;戴芮;張寧;;改進(jìn)的基音周期檢測(cè)算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2015年10期
2 馬莎莎;戴曙光;穆平安;;基于短時(shí)能量的循環(huán)AMDF基音檢測(cè)算法[J];計(jì)算機(jī)仿真;2014年07期
3 鄭繼明;王勁松;;語(yǔ)音基音周期檢測(cè)方法[J];計(jì)算機(jī)工程;2010年10期
4 陳雪勤;劉正;趙鶴鳴;;基于相似度的高精度基音檢測(cè)算法[J];聲學(xué)技術(shù);2008年05期
5 張康杰;趙歡;饒居華;;基于LV-AMDF的自適應(yīng)基音檢測(cè)算法[J];計(jì)算機(jī)應(yīng)用;2007年07期
6 吳恬盈;;一種新的清濁音在線辨識(shí)法[J];計(jì)算機(jī)仿真;2007年04期
7 于明;袁玉倩;董浩;王哲;;一種基于MFCC和LPCC的文本相關(guān)說話人識(shí)別方法[J];計(jì)算機(jī)應(yīng)用;2006年04期
8 成新民,曾毓敏,趙力;一種改進(jìn)的AMDF求取語(yǔ)音基音的方法[J];微電子學(xué)與計(jì)算機(jī);2005年11期
9 顧良,劉潤(rùn)生;利用聲調(diào)判別提高漢語(yǔ)數(shù)碼語(yǔ)音識(shí)別性能[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);1998年09期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 潘逸倩;聲紋密碼技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
,本文編號(hào):524386
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/524386.html