基于深度學(xué)習(xí)的說話人識別研究
【學(xué)位單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN912.34;TP181
【部分圖文】:
圖2-1?說話人識別系統(tǒng)框架??先通常在進行特征提取之前,都要對原始序列做一系列的預(yù)處理。用換(channel?conversion)、預(yù)加重(pre-emphasis)、重米樣(resample)、)和力口窗(windowing)。??
第二章說話人識別研究概述關(guān)定義上來說,GMM是一種參數(shù)化(Paraodel),具備對實際數(shù)據(jù)極強的表征力,但強,其負(fù)面效應(yīng)也會越明顯:參數(shù)規(guī)模也動GMM的參數(shù)訓(xùn)練才能得到-個更加通或者幾個小時的語音數(shù)據(jù),都遠(yuǎn)遠(yuǎn)無法滿足稀缺又容易讓GMM出現(xiàn)過擬合(Over-fming因此,盡管一開始GMM在小規(guī)模的文本無框架的性能,但它卻遠(yuǎn)遠(yuǎn)無法滿足實際場
泛化能力急劇衰退。因此,盡管一開始GMM在小規(guī)模的文本無關(guān)數(shù)據(jù)集合上表??現(xiàn)出了超越傳統(tǒng)技術(shù)框架的性能,但它卻遠(yuǎn)遠(yuǎn)無法滿足實際場景下的需求。??圖2-2最初的目標(biāo)用戶模型訓(xùn)練??2000年,DA?Reynolds1121的團隊提出了一種改進的方案:既然沒法從目標(biāo)??用戶那里收集到足夠的語音,那就可以從其他地方收集大量非目標(biāo)用戶的聲音,??將這些非目標(biāo)用戶數(shù)據(jù)(聲紋識別領(lǐng)域稱為背景數(shù)據(jù))混合起來充分訓(xùn)練出一個??GMM,這個GMM可以看作是對語音的表征,但由于它是從大量身份的混雜數(shù)??據(jù)中訓(xùn)練而成,它又不具備表征具體某位說話人身份的能力。??該混合GMM就是起到了類似的作用,它對語音特征在空間分布的概率模型??給出了一個良好的預(yù)先估計,不必再像過去那樣從頭開始計算GMM的參數(shù)??(GMM的參數(shù)估計是一種稱為EM的迭代式估計算法),只需要基于目標(biāo)用戶的??數(shù)據(jù)在這個混合GMM上進行參數(shù)的微調(diào)即可實現(xiàn)目標(biāo)用戶參數(shù)的估計
【參考文獻】
相關(guān)期刊論文 前8條
1 楊瑞田;周萍;楊青;;TEO能量與Mel倒譜混合參數(shù)應(yīng)用于說話人識別[J];計算機仿真;2017年08期
2 林舒都;邵曦;;基于i-vector和深度學(xué)習(xí)的說話人識別[J];計算機技術(shù)與發(fā)展;2017年06期
3 歐國振;孫林慧;薛海雙;;基于重組超矢量的GMM-SVM說話人辨認(rèn)系統(tǒng)[J];計算機技術(shù)與發(fā)展;2017年07期
4 周雷;龍艷花;魏浩然;;一種新型的與文本相關(guān)的說話人識別方法研究[J];上海師范大學(xué)學(xué)報(自然科學(xué)版);2017年02期
5 楊瑩春;鄧立才;;基于GMM托肯配比相似度校正得分的說話人識別[J];清華大學(xué)學(xué)報(自然科學(xué)版);2017年01期
6 李燕萍;陶定元;林樂;;基于DTW模型補償?shù)膫窝b語音說話人識別研究[J];計算機技術(shù)與發(fā)展;2017年01期
7 ;COMBINATION OF PITCH SYNCHRONOUS ANALYSIS AND FISHER CRITERION FOR SPEAKER IDENTIFICATION[J];Journal of Electronics(China);2007年06期
8 ;A new frequency scale of Chinese whispered speech in the application of speaker identification[J];Progress in Natural Science;2006年10期
本文編號:2837037
本文鏈接:http://sikaile.net/kejilunwen/wltx/2837037.html