一種基于GMM-DNN的說話人確認方法
本文關鍵詞:一種基于GMM-DNN的說話人確認方法
更多相關文章: 說話人識別 深度神經(jīng)網(wǎng)絡 高斯混合模型 統(tǒng)計參數(shù)
【摘要】:針對說話人確認中話者建模問題,提出GMM-DNN的混合建模方法。該方法先通過GMM提取原始語音特征的統(tǒng)計特征,然后進一步通過DNN非線性映射的方式將統(tǒng)計特征變換到一個與說話人相關的線性可分空間。選用棧式自編碼神經(jīng)網(wǎng)絡SAE(Stacked Auto-encoder Neutral Network)作為深度神經(jīng)網(wǎng)絡的基本模型。在注冊階段從已訓練的DNN網(wǎng)絡中抽取最后一層作為說話人模型,稱為p-vector。測試階段,通過抽取測試語音的p-vector與注冊說話人p-vector進行匹配,從而作出判決;另外還詳細說明了DNN隱藏層的作用。通過對NIST語料庫的實驗表明,采用GMM-DNN的說話人確認方法相對于傳統(tǒng)的GMM-UBM話者建模方法具有一定的優(yōu)勢。
【作者單位】: 公安部物證鑒定中心;中國科學技術大學電子科學與技術系;
【關鍵詞】: 說話人識別 深度神經(jīng)網(wǎng)絡 高斯混合模型 統(tǒng)計參數(shù)
【基金】:北京市科委項目(Z141100006014002)
【分類號】:TN912.34;TP183
【正文快照】: 0引言 隨著語音相關技術的發(fā)展和成熟,在日常生活中語音的應用越來越廣泛,而語音作為證據(jù)在安全方面的應用也日益重要,使得對說話人確認技術的需求越來越迫切。說話人確認[1]的任務是通過測試給定語音波形信號中包含的說話人個性信息,從而對其聲明的身份進行判決。目前,主流
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭偉;李輝;許敏強;劉青松;;基于高維空間映射失配補償方法的說話人確認[J];中國科學技術大學學報;2010年02期
2 張怡穎,朱小燕,張鈸;一種新的說話人確認方法[J];軟件學報;1999年04期
3 翁武斌,方棣棠;應用分段辨認序列頻度信息的說話人確認方法[J];中文信息學報;2000年05期
4 文學,劉加,劉潤生;一種改進的新型說話人確認算法[J];清華大學學報(自然科學版);2003年01期
5 陳繼旭;劉明輝;戴蓓劏;李輝;;文本無關說話人確認中的一種新的評分規(guī)整方法[J];信號處理;2006年04期
6 劉明輝;戴蓓劏;解焱陸;;基于GMM多維概率輸出的SVM話者確認[J];模式識別與人工智能;2008年01期
7 解焱陸;劉青松;戴蓓劏;李輝;;一種用于魯棒性說話人確認的分段概率分布參數(shù)規(guī)整方法[J];電路與系統(tǒng)學報;2008年06期
8 郭武;李軼杰;戴禮榮;王仁華;;采用非監(jiān)督得分規(guī)整和因子分析的說話人確認[J];電子學報;2009年04期
9 許東星;戴蓓劏;許敏強;劉青松;;聲母發(fā)聲特點參數(shù)的提取及其提高說話人確認魯棒性的研究[J];信號處理;2009年09期
10 陳存寶;趙力;;嵌入時延網(wǎng)絡的高斯混合背景模型說話人確認[J];信號處理;2010年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認系統(tǒng)[A];第三屆全國人機語音通訊學術會議論文集[C];1994年
2 洪青陽;陳毅東;;一種用于說話人確認的區(qū)別性訓練方法[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
3 許云飛;黃厚軍;金怡珠;李桂蓮;周若華;;基于PLDA的“一對多”下的說話人確認方法研究[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
4 展領;景新幸;;矢量量化和VQ-UBM在說話人確認中的應用[A];中國聲學學會2009年青年學術會議[CYCA’09]論文集[C];2009年
5 趙賢宇;董遠;張雪峰;楊浩;王海拉;;說話人確認系統(tǒng)中基于高斯混合分布相似度選擇TNorm背景模型的研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
6 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風語音增強和雜混模型訓練相結合的頑健說話人確認[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
7 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認系統(tǒng)中的研究[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年
8 張濤;王嵐;遲惠生;;基于VQ的說話人確認系統(tǒng)的硬件實現(xiàn)[A];第六屆全國人機語音通訊學術會議論文集[C];2001年
9 尹聰;白靜;龔[,
本文編號:657097
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/657097.html