社保聲紋認(rèn)證的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-10 18:39
本文主要講述的是基于深度學(xué)習(xí)的聲紋識(shí)別在社保領(lǐng)域的應(yīng)用。聲紋是從語(yǔ)音中經(jīng)過(guò)深度學(xué)習(xí)提取出來(lái)的個(gè)人聲音紋理特征信息。社保聲紋是從語(yǔ)音信息中提取出來(lái)應(yīng)用于社保領(lǐng)域的聲紋信息。聲紋信息具有廣泛的應(yīng)用前景:監(jiān)獄親屬遠(yuǎn)程探監(jiān)身份確認(rèn)、老年人社保身份確認(rèn)。人臉識(shí)別容易受到光線強(qiáng)弱、梳妝打扮的影響。因此對(duì)聲紋識(shí)別的研究具有重要的理論意義和實(shí)際應(yīng)用價(jià)值。本文的主要工作內(nèi)容有如下:首先對(duì)聲紋識(shí)別在國(guó)內(nèi)外的現(xiàn)狀進(jìn)行了研究,闡述了聲紋識(shí)別相關(guān)的一些理論知識(shí)。其次對(duì)聲紋識(shí)別的需求現(xiàn)狀進(jìn)行了闡述和分析并得出神經(jīng)網(wǎng)絡(luò)在社保方面具有廣泛的應(yīng)用前景。本文的研究主要針對(duì)于社保聲紋領(lǐng)域。對(duì)社保聲紋的應(yīng)用做了需求分析。需求分析中主要講述了聲紋應(yīng)用的客戶需求、社保聲紋應(yīng)用的經(jīng)濟(jì)可行性、技術(shù)可行性、社保聲紋應(yīng)用的前景。本系統(tǒng)完成了語(yǔ)音信息的提取、預(yù)處理、訓(xùn)練和驗(yàn)證。聲紋識(shí)別主要分為身份確認(rèn)、可疑人信息辨認(rèn)兩個(gè)方面。在人員流動(dòng)如此頻繁的時(shí)代,經(jīng)常會(huì)出現(xiàn)異地身份認(rèn)證問(wèn)題,聲紋信息主要用于解決異地身份驗(yàn)證問(wèn)題。同指紋認(rèn)證相比,聲紋認(rèn)證的好處在于防止特征復(fù)制,解決遠(yuǎn)程認(rèn)證困難。同人臉識(shí)別相比,聲紋認(rèn)證的優(yōu)勢(shì)在于紋理特征更加明顯,防干擾...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
神經(jīng)元示意圖
第二章 深度學(xué)習(xí)的社保理論基礎(chǔ)的響應(yīng)程度。通過(guò)對(duì)上一層輸入的多重運(yùn)算把上一層的神經(jīng)元轉(zhuǎn)化為新的,從而對(duì)輸入信息的處理方式進(jìn)行了擴(kuò)容。這個(gè)擴(kuò)容的過(guò)程就是多重非線的映射。作為前饋神經(jīng)網(wǎng)絡(luò)與淺度學(xué)習(xí)相比最大的改進(jìn)就是在于它的容量的擴(kuò)充來(lái)的單層信息處理、多參數(shù)表示,改變?yōu)槎鄬哟尉W(wǎng)絡(luò)處理,每一層之間由構(gòu)成。由于是前饋神經(jīng)網(wǎng)絡(luò)的信息傳播方向只能由前一層往后一層進(jìn)行傳向是從前往后具有單一性。在神經(jīng)網(wǎng)絡(luò)之中最少具有一個(gè)信息輸入層和一結(jié)果輸出層。一般的神經(jīng)網(wǎng)絡(luò)都具有多層隱藏信息層,隱藏信息層的主要是為了擴(kuò)大信息容量以及增多信息處理的方式。下圖 2-2 中展示了一個(gè)簡(jiǎn)單前饋神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。圖中信號(hào)傳遞方向由左往右,每傳播一層就會(huì)經(jīng)處理,離我們想要的輸出信號(hào)的距離就會(huì)更近,所以越往后需要的處理過(guò)越少[3]。如圖 2-2 所示:
法、牛頓法、BP 算法 等等。度下降多的學(xué)習(xí)方法之中,梯度下降算法由于其簡(jiǎn)單易懂,方便快經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化。梯度下降算法首先要做的就是求解目標(biāo)后再使用迭代的方法使得梯度向量往局部極小值的方向?qū)W習(xí)式(2-2)所示:0 1 1 2 2( ) ...n nxh x x x 2-2)既可以是一元函數(shù)也可以是多元函數(shù),既可以是線性函數(shù)也可以式可以轉(zhuǎn)化為公式(2-3): 0ni iih x x Txθ 式(2-3)中的函數(shù)Txθ 是一個(gè)矩陣表達(dá)形式。在求解這個(gè)系著信息處理的最優(yōu)解,損失函數(shù)可以被用來(lái)評(píng)估梯度下降的最。
【參考文獻(xiàn)】:
期刊論文
[1]基于MFCC和雙重GMM的鳥(niǎo)類(lèi)識(shí)別方法[J]. 王恩澤,何東健. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(05)
[2]DNN與微軟同聲傳譯系統(tǒng)背后的故事[J]. 盧鶇翔. 程序員. 2013 (06)
[3]對(duì)MFCC進(jìn)行GMM聚類(lèi)的漢語(yǔ)數(shù)字識(shí)別方法[J]. 高文曦,于鳳芹. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2011(11)
本文編號(hào):3075095
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
神經(jīng)元示意圖
第二章 深度學(xué)習(xí)的社保理論基礎(chǔ)的響應(yīng)程度。通過(guò)對(duì)上一層輸入的多重運(yùn)算把上一層的神經(jīng)元轉(zhuǎn)化為新的,從而對(duì)輸入信息的處理方式進(jìn)行了擴(kuò)容。這個(gè)擴(kuò)容的過(guò)程就是多重非線的映射。作為前饋神經(jīng)網(wǎng)絡(luò)與淺度學(xué)習(xí)相比最大的改進(jìn)就是在于它的容量的擴(kuò)充來(lái)的單層信息處理、多參數(shù)表示,改變?yōu)槎鄬哟尉W(wǎng)絡(luò)處理,每一層之間由構(gòu)成。由于是前饋神經(jīng)網(wǎng)絡(luò)的信息傳播方向只能由前一層往后一層進(jìn)行傳向是從前往后具有單一性。在神經(jīng)網(wǎng)絡(luò)之中最少具有一個(gè)信息輸入層和一結(jié)果輸出層。一般的神經(jīng)網(wǎng)絡(luò)都具有多層隱藏信息層,隱藏信息層的主要是為了擴(kuò)大信息容量以及增多信息處理的方式。下圖 2-2 中展示了一個(gè)簡(jiǎn)單前饋神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。圖中信號(hào)傳遞方向由左往右,每傳播一層就會(huì)經(jīng)處理,離我們想要的輸出信號(hào)的距離就會(huì)更近,所以越往后需要的處理過(guò)越少[3]。如圖 2-2 所示:
法、牛頓法、BP 算法 等等。度下降多的學(xué)習(xí)方法之中,梯度下降算法由于其簡(jiǎn)單易懂,方便快經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化。梯度下降算法首先要做的就是求解目標(biāo)后再使用迭代的方法使得梯度向量往局部極小值的方向?qū)W習(xí)式(2-2)所示:0 1 1 2 2( ) ...n nxh x x x 2-2)既可以是一元函數(shù)也可以是多元函數(shù),既可以是線性函數(shù)也可以式可以轉(zhuǎn)化為公式(2-3): 0ni iih x x Txθ 式(2-3)中的函數(shù)Txθ 是一個(gè)矩陣表達(dá)形式。在求解這個(gè)系著信息處理的最優(yōu)解,損失函數(shù)可以被用來(lái)評(píng)估梯度下降的最。
【參考文獻(xiàn)】:
期刊論文
[1]基于MFCC和雙重GMM的鳥(niǎo)類(lèi)識(shí)別方法[J]. 王恩澤,何東健. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(05)
[2]DNN與微軟同聲傳譯系統(tǒng)背后的故事[J]. 盧鶇翔. 程序員. 2013 (06)
[3]對(duì)MFCC進(jìn)行GMM聚類(lèi)的漢語(yǔ)數(shù)字識(shí)別方法[J]. 高文曦,于鳳芹. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2011(11)
本文編號(hào):3075095
本文鏈接:http://sikaile.net/shekelunwen/shehuibaozhanglunwen/3075095.html
最近更新
教材專(zhuān)著