基于神經(jīng)網(wǎng)絡(luò)的聲紋識(shí)別研究
發(fā)布時(shí)間:2022-02-09 19:46
隨著信息化技術(shù)的迅速發(fā)展,身份認(rèn)證已成為了越來越多應(yīng)用場(chǎng)景中不可或缺的一部分。但是網(wǎng)絡(luò)智能化帶來了方便的同時(shí)也帶來了隱患。聲紋識(shí)別又稱說話人識(shí)別,由于其可靠性、安全性,還有經(jīng)濟(jì)便捷的特性,成為了發(fā)展空間廣泛、商業(yè)價(jià)值重大的研究熱點(diǎn)之一。將神經(jīng)網(wǎng)絡(luò)應(yīng)用在聲紋識(shí)別中能夠大幅提高識(shí)別準(zhǔn)確率,但是由于聲紋識(shí)別的研究時(shí)間較短,所以仍然有很多問題尚未解決:現(xiàn)有的聲紋識(shí)別大多需要待識(shí)別語音的文本內(nèi)容一致,即文本相關(guān),但是在實(shí)際應(yīng)用中文本無關(guān)的識(shí)別應(yīng)用更廣泛;聲紋識(shí)別需要大量的目標(biāo)說話人語音數(shù)據(jù),如果數(shù)據(jù)較少會(huì)使模型訓(xùn)練不充分、準(zhǔn)確率下降;在提取說話人模板時(shí)通常使用隨機(jī)選擇樣本的方法,但是噪聲會(huì)使隨機(jī)選擇的方式產(chǎn)生誤差;除此之外,語速對(duì)現(xiàn)有的聲紋識(shí)別系統(tǒng)準(zhǔn)確率有很大影響,但是還沒有針對(duì)此現(xiàn)象提出的有效方法。本文主要研究基于神經(jīng)網(wǎng)絡(luò)的文本無關(guān)說話人確認(rèn)系統(tǒng),采用梅爾頻率倒譜系數(shù)(MFCC)作為語音特征參數(shù),搭建基于深度神經(jīng)網(wǎng)絡(luò)(DNN)的聲紋識(shí)別系統(tǒng)作為基線系統(tǒng)。為了解決在目標(biāo)說話人數(shù)據(jù)不足時(shí)錯(cuò)誤率大幅提升的問題,本文對(duì)基線系統(tǒng)做出了改進(jìn),最終將改進(jìn)模型的準(zhǔn)確率提高了近10%。其次,本文基于遷移學(xué)習(xí)原理...
【文章來源】:電子科技大學(xué)四川省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
漢明窗與原始波形對(duì)比圖
梅爾頻率與實(shí)際頻率關(guān)系
三角濾波器組
【參考文獻(xiàn)】:
期刊論文
[1]聲紋識(shí)別技術(shù)及其應(yīng)用現(xiàn)狀[J]. 鄭方,李藍(lán)天,張慧,艾斯卡爾·肉孜. 信息安全研究. 2016(01)
[2]電話語音中基于多說話人的聲紋識(shí)別系統(tǒng)[J]. 鄭燕琳,楊曉炯,許星宇. 電信科學(xué). 2010(S2)
[3]聲紋識(shí)別技術(shù)及其應(yīng)用[J]. 楊陽(yáng),陳永明. 電聲技術(shù). 2007(02)
碩士論文
[1]基于Android的聲紋識(shí)別和語音識(shí)別的設(shè)計(jì)[D]. 司向軍.東南大學(xué) 2017
[2]卷積神經(jīng)網(wǎng)絡(luò)在聲紋識(shí)別中的應(yīng)用研究[D]. 胡青.貴州大學(xué) 2016
[3]聲紋識(shí)別相關(guān)技術(shù)研究及應(yīng)用[D]. 張芝旖.南京航空航天大學(xué) 2016
[4]基于MFCC的聲紋識(shí)別系統(tǒng)研究[D]. 王正創(chuàng).江南大學(xué) 2014
[5]基于矢量量化與神經(jīng)網(wǎng)絡(luò)的聲紋識(shí)別系統(tǒng)的研究[D]. 徐衛(wèi)中.重慶大學(xué) 2012
本文編號(hào):3617552
【文章來源】:電子科技大學(xué)四川省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
漢明窗與原始波形對(duì)比圖
梅爾頻率與實(shí)際頻率關(guān)系
三角濾波器組
【參考文獻(xiàn)】:
期刊論文
[1]聲紋識(shí)別技術(shù)及其應(yīng)用現(xiàn)狀[J]. 鄭方,李藍(lán)天,張慧,艾斯卡爾·肉孜. 信息安全研究. 2016(01)
[2]電話語音中基于多說話人的聲紋識(shí)別系統(tǒng)[J]. 鄭燕琳,楊曉炯,許星宇. 電信科學(xué). 2010(S2)
[3]聲紋識(shí)別技術(shù)及其應(yīng)用[J]. 楊陽(yáng),陳永明. 電聲技術(shù). 2007(02)
碩士論文
[1]基于Android的聲紋識(shí)別和語音識(shí)別的設(shè)計(jì)[D]. 司向軍.東南大學(xué) 2017
[2]卷積神經(jīng)網(wǎng)絡(luò)在聲紋識(shí)別中的應(yīng)用研究[D]. 胡青.貴州大學(xué) 2016
[3]聲紋識(shí)別相關(guān)技術(shù)研究及應(yīng)用[D]. 張芝旖.南京航空航天大學(xué) 2016
[4]基于MFCC的聲紋識(shí)別系統(tǒng)研究[D]. 王正創(chuàng).江南大學(xué) 2014
[5]基于矢量量化與神經(jīng)網(wǎng)絡(luò)的聲紋識(shí)別系統(tǒng)的研究[D]. 徐衛(wèi)中.重慶大學(xué) 2012
本文編號(hào):3617552
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3617552.html
最近更新
教材專著