基于多特征I-Vector的短語音說話人識(shí)別方法研究
【學(xué)位單位】:重慶郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.34
【部分圖文】:
說話人識(shí)別系統(tǒng)的總體框架主要包括語音信號(hào)的預(yù)處理模塊、特征提取模塊、型匹配模塊和得分判決模塊。本章將簡要分析每個(gè)模塊的性能和處理過程,為后章節(jié)的算法改進(jìn)提供了理論依據(jù)。2.1 說話人識(shí)別的系統(tǒng)框架說話人識(shí)別的任務(wù)是根據(jù)話者的語音信息確定話者的身份。實(shí)際上,說話人別是屬于模式識(shí)別的范疇,它的基本原理為:建立每個(gè)說話人的語音模型,使其夠最大程度地描述說話人的個(gè)體生理特征,再將這個(gè)語音模型作為參考模型,與樣得到的語音模型進(jìn)行對(duì)比分析,從而達(dá)到辨認(rèn)或確認(rèn)說話人的目的[25]。說話人別系統(tǒng)主要包括語音信號(hào)的預(yù)處理模塊、特征提取模塊、模型匹配模塊和得分判模塊。圖 2.1 為說話人識(shí)別系統(tǒng)框架。
[][][1]~x n xn xn 段未處理的語音信號(hào)整體上看是非平穩(wěn)的,這使信號(hào)進(jìn)行分析和建模,通常把說話人語音信號(hào)切分幀,每幀長度在 20~30ms,在這一區(qū)間內(nèi)的語音信號(hào)的短時(shí)平穩(wěn)性,其頻譜特性幾乎不變。而為一幀,可以把整段語音信號(hào)的分析轉(zhuǎn)化成對(duì)每以采用連續(xù)分段的方法,但是普遍采用交疊分段幀移,其長度一般為 0~1/2 倍幀長,圖 2.3 為語音
圖 2.4 DET 曲線的示例圖本章小結(jié)本章詳細(xì)地描述了說話人識(shí)別系統(tǒng)的整體框架,并分別地介紹了說話人識(shí)的預(yù)處理模塊、特征提取模塊、匹配模型模塊和得分判決模塊。同時(shí),簡了說話人識(shí)別系統(tǒng)的性能評(píng)價(jià)指標(biāo)。最后明確地把特征提取和匹配模型作節(jié)的主要研究內(nèi)容。
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉倩;李時(shí);;細(xì)菌趨藥性算法在說話人識(shí)別中的應(yīng)用[J];宿州學(xué)院學(xué)報(bào);2017年11期
2 趙艷;呂亮;趙力;;基于修正Fukunaga-Koontz變換的說話人識(shí)別方法[J];電子器件;2018年04期
3 李為州;楊印根;;說話人識(shí)別中基于深度信念網(wǎng)絡(luò)的超向量降維的研究[J];電腦知識(shí)與技術(shù);2017年22期
4 雷震春;萬艷紅;羅劍;朱明華;;基于Mahalanobis距離的說話人識(shí)別模型研究[J];中國語音學(xué)報(bào);2016年00期
5 王華朋;李寧;許鋒;蔡能斌;;基于元音共振峰特征的法庭說話人識(shí)別[J];中國刑警學(xué)院學(xué)報(bào);2014年02期
6 王華朋;楊軍;許勇;;應(yīng)用似然比框架的法庭說話人識(shí)別[J];數(shù)據(jù)采集與處理;2013年02期
7 檀蕊蓮;劉建平;;說話人識(shí)別技術(shù)的研究進(jìn)展[J];科技資訊;2007年33期
8 寧飛,陳頻;說話人識(shí)別的幾種方法[J];電聲技術(shù);2001年12期
9 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
10 王華朋;楊軍;吳鳴;許勇;;基于自適應(yīng)同源方差控制的法庭自動(dòng)說話人識(shí)別[J];應(yīng)用科學(xué)學(xué)報(bào);2014年06期
相關(guān)博士學(xué)位論文 前10條
1 徐瓏婷;基于稀疏分解的說話人識(shí)別技術(shù)研究[D];南京郵電大學(xué);2017年
2 陸偉;基于缺失特征的文本無關(guān)說話人識(shí)別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
3 俞一彪;基于互信息理論的說話人識(shí)別研究[D];上海大學(xué);2004年
4 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
5 侯麗敏;基于非線性理論和信息融合的說話人識(shí)別[D];上海大學(xué);2005年
6 雷震春;支持向量機(jī)在說話人識(shí)別中的應(yīng)用研究[D];浙江大學(xué);2006年
7 姚志強(qiáng);說話人識(shí)別中提高GMM性能方法的研究[D];中國科學(xué)技術(shù)大學(xué);2006年
8 包永強(qiáng);噪聲環(huán)境下說話人識(shí)別的研究[D];東南大學(xué);2006年
9 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年
10 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識(shí)別研究[D];中國科學(xué)技術(shù)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 姜孝偉;說話人識(shí)別系統(tǒng)的設(shè)計(jì)與研究[D];上海交通大學(xué);2018年
2 陳松;基于VQ的室內(nèi)說話人識(shí)別及FPGA實(shí)現(xiàn)研究[D];安徽理工大學(xué);2019年
3 蔡國都;基于x-vector的說話人識(shí)別研究[D];北京交通大學(xué);2019年
4 孫念;基于多特征I-Vector的短語音說話人識(shí)別方法研究[D];重慶郵電大學(xué);2019年
5 巴莉芳;基于含噪語音的說話人識(shí)別研究[D];重慶郵電大學(xué);2019年
6 劉崇鳴;基于三元組損失與流形降維的文本無關(guān)說話人識(shí)別方法研究[D];哈爾濱工業(yè)大學(xué);2019年
7 林婷;基于ICA和ASR語音特征選取的說話人識(shí)別算法[D];南昌大學(xué);2019年
8 陳園允;變形欺騙性語音的檢測(cè)算法研究及對(duì)其魯棒的說話人識(shí)別系統(tǒng)實(shí)現(xiàn)[D];廣東技術(shù)師范大學(xué);2019年
9 徐鈺婷;跨語言背景下基于單元音的說話人識(shí)別研究[D];深圳大學(xué);2018年
10 陳莉芬;基于英語爆破音和摩擦音的跨語言說話人識(shí)別研究[D];深圳大學(xué);2018年
本文編號(hào):2839181
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2839181.html