天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于距離與相似性度量學習的說話人識別研究

發(fā)布時間:2020-04-08 20:19
【摘要】:說話人識別是以語音作為識別特征,采用機器學習方法對語音信息進行處理,自動進行識別說話人身份的技術(shù)。目前,基于I-vector模型的說話人識別模型性能良好,已經(jīng)成為說話人識別領域中的主流模型。本文主要是對基于I-vector模型的說話人識別算法進行研究,并在此基礎上引入距離與相似性度量學習算法。度量學習算法通過使得同類樣本更緊湊,非同類樣本更分散,提高說話人識別系統(tǒng)性能。本文主要研究KISS(Keep It Simple and Straightforward)與SUB-SML(intra-person Subspace Similarity Metric Learning)度量學習算法在說話人識別系統(tǒng)中的應用。KISS算法具備可利用大規(guī)模數(shù)據(jù)集和可擴展性等特點,通過引入等價約束關(guān)系學習度量矩陣,而且學習得到的度量矩陣可保證同類樣本強相關(guān)。本文將KISS度量學習算法應用在說話人識別系統(tǒng)中,通過對i-vector向量進行KISS度量矩陣線性變換,減少信道差異和說話人個人內(nèi)在變化對系統(tǒng)的影響。在NIST SRE 2014庫上進行實驗,分別使用余弦相似分類器和馬氏距離分類器進行打分判別。實驗結(jié)果表明KISS模型采用余弦相似分類器打分可以提高系統(tǒng)性能,而且采用采用馬氏距離分類器打分系統(tǒng)性能提高更顯著。此外,對KISS模型與PLDA模型進行得分融合實驗,實驗結(jié)果表明系統(tǒng)性能得到進一步提高。SUB-SML算法從保持相似性度量學習的魯棒性和判別性兩方面出發(fā),提出在說話人個人子空間內(nèi)學習訓練度量矩陣,聯(lián)合馬氏距離度量和雙線性相似性度量,形成廣義的相似性度量學習。NIST SRE 2014庫只提供訓練樣本的標簽信息,所以需要為SUB-SML算法構(gòu)造訓練樣本對集合。本文提出選取歐式距離最大的相似對和歐氏距離最小的非相似對構(gòu)造訓練樣本對集合,使得訓練得到的度量矩陣具備判別相似度低的同類樣本以及相似度高的非同類樣本能力。本文將SUBSML度量學習算法應用在說話人識別系統(tǒng)中,提出新方法構(gòu)造SUB-SML算法的訓練樣本對集合,并且對i-vector向量進行SUB-SML度量矩陣線性變換。實驗結(jié)果表明基于SUB-SML模型與基線i-vector模型相比系統(tǒng)性能有所提高,而且采用新方法構(gòu)造的訓練樣本對集合的SUB-SML模型性能提高顯著。SUB-SML算法聯(lián)合馬氏距離度量和雙線性相似性度量,若只考慮馬氏距離度量或雙線性相似性度量,則分別得到SUB-ML和SUB-SL算法。本文將SUB-ML和SUB-SL度量學習算法分別應用到說話人識別中,實驗在NIST SRE 2014年庫上進行,結(jié)果表明這兩種模型性能均優(yōu)于傳統(tǒng)余弦距離分類器模型。此外,還對SUB-ML模型與基于SUB-SL模型進行系統(tǒng)得分融合實驗,實驗結(jié)果表明融合后的系統(tǒng)性能比基于PLDA模型的系統(tǒng)性能更佳。
【圖文】:

結(jié)構(gòu)圖,結(jié)構(gòu)圖,說話人,模式匹配


圖 1-1:說話人識別系統(tǒng)結(jié)構(gòu)圖觀察圖 1-1 可知,說話人識別系統(tǒng)的關(guān)鍵階段為:訓練階段和識別階段。說話人模型的訓練過程即建模,識別過程就是模式匹配的過程。由此得出,,要想提升說話人識別系統(tǒng)性能,需要從建立說話人模型和模式匹配兩方面著手。從說話人模型角度出發(fā),經(jīng)典的 GMM-UBM[26](高斯混合模型-通用背景模

系統(tǒng)流程圖,系統(tǒng)流程圖,說話人確認


說話人確認系統(tǒng)流程圖
【學位授予單位】:江西師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.3;TP181

【相似文獻】

相關(guān)期刊論文 前10條

1 劉倩;李時;;細菌趨藥性算法在說話人識別中的應用[J];宿州學院學報;2017年11期

2 趙艷;呂亮;趙力;;基于修正Fukunaga-Koontz變換的說話人識別方法[J];電子器件;2018年04期

3 李為州;楊印根;;說話人識別中基于深度信念網(wǎng)絡的超向量降維的研究[J];電腦知識與技術(shù);2017年22期

4 雷震春;萬艷紅;羅劍;朱明華;;基于Mahalanobis距離的說話人識別模型研究[J];中國語音學報;2016年00期

5 王華朋;李寧;許鋒;蔡能斌;;基于元音共振峰特征的法庭說話人識別[J];中國刑警學院學報;2014年02期

6 王華朋;楊軍;許勇;;應用似然比框架的法庭說話人識別[J];數(shù)據(jù)采集與處理;2013年02期

7 檀蕊蓮;劉建平;;說話人識別技術(shù)的研究進展[J];科技資訊;2007年33期

8 寧飛,陳頻;說話人識別的幾種方法[J];電聲技術(shù);2001年12期

9 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進展[J];河南科技;1998年09期

10 王華朋;楊軍;吳鳴;許勇;;基于自適應同源方差控制的法庭自動說話人識別[J];應用科學學報;2014年06期

相關(guān)會議論文 前10條

1 孫帆;遲惠生;;循環(huán)網(wǎng)絡說話人識別[A];第二屆全國人機語音通訊學術(shù)會議(NCMMSC1992)論文集[C];1992年

2 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學術(shù)會議(NCMMSC7)論文集[C];2003年

3 吳璽宏;劉文舉;;聽神經(jīng)計算模型及其在抗噪說話人識別中的應用[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年

4 任舒彬;楊瑩春;吳朝暉;;面向多通道說話人識別的預處理方法實驗研究(類別:聲紋鑒定)[A];第六屆全國現(xiàn)代語音學學術(shù)會議論文集(下)[C];2003年

5 劉大力;趙力;;與文本無關(guān)說話人識別系統(tǒng)的性能比較[A];2004年全國物理聲學會議論文集[C];2004年

6 張陳昊;鄭方;王琳琳;;基于多音素類模型的文本無關(guān)短語音說話人識別[A];需將論文集名稱修改為“第十二屆全國人機語音通訊學術(shù)會議(NCMMSC2013)論文集[C];2013年

7 周昊朗;王嵐;陳珂;;一個面向說話人識別的漢語語音數(shù)據(jù)庫[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年

8 龍川;景新幸;楊海燕;;矢量量化與協(xié)方差矩陣結(jié)合的說話人識別方法[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術(shù)會議論文集[C];2010年

9 周昊朗;王嵐;吳璽宏;遲惠生;;一個面向說話人識別的漢語語音數(shù)據(jù)庫[A];信號與信息處理技術(shù)——第一屆信號與信息處理聯(lián)合學術(shù)會議論文集[C];2002年

10 王波;王炳錫;徐毅瓊;;基于多分類器的抗噪聲說話人識別系統(tǒng)[A];現(xiàn)代通信理論與信號處理進展——2003年通信理論與信號處理年會論文集[C];2003年

相關(guān)重要報紙文章 前2條

1 汪永安;科大訊飛說話人識別技術(shù)世界領先[N];安徽日報;2008年

2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年

相關(guān)博士學位論文 前10條

1 徐瓏婷;基于稀疏分解的說話人識別技術(shù)研究[D];南京郵電大學;2017年

2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學技術(shù)大學;2008年

3 俞一彪;基于互信息理論的說話人識別研究[D];上海大學;2004年

4 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年

5 侯麗敏;基于非線性理論和信息融合的說話人識別[D];上海大學;2005年

6 雷震春;支持向量機在說話人識別中的應用研究[D];浙江大學;2006年

7 姚志強;說話人識別中提高GMM性能方法的研究[D];中國科學技術(shù)大學;2006年

8 包永強;噪聲環(huán)境下說話人識別的研究[D];東南大學;2006年

9 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年

10 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學技術(shù)大學;2007年

相關(guān)碩士學位論文 前10條

1 劉樂;基于SlicedWasserstein距離的GMM-UBM說話人識別的研究[D];內(nèi)蒙古大學;2019年

2 郭萬鵬;基于深度學習的說話人識別技術(shù)研究[D];蘭州理工大學;2019年

3 萬艷紅;基于距離與相似性度量學習的說話人識別研究[D];江西師范大學;2018年

4 李為州;深度學習與超向量在說話人識別中的應用[D];江西師范大學;2018年

5 徐鈺婷;跨語言背景下基于單元音的說話人識別研究[D];深圳大學;2018年

6 陳莉芬;基于英語爆破音和摩擦音的跨語言說話人識別研究[D];深圳大學;2018年

7 易中曼;關(guān)于法庭說話人識別的評估[D];西南政法大學;2018年

8 郭慧陽;基于深度學習的說話人識別技術(shù)研究[D];廈門大學;2018年

9 楊楠;基于深度學習的說話人識別研究與實現(xiàn)[D];鄭州大學;2019年

10 梅文星;說話人識別中通用背景模型研究及深度學習初探[D];浙江大學;2019年



本文編號:2619791

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2619791.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cc194***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
91熟女大屁股偷偷对白| 夫妻性生活黄色录像视频 | 九九热这里只有精品哦| 国产中文另类天堂二区| 欧美一区二区三区在线播放| 欧美激情视频一区二区三区| 国产成人精品资源在线观看| 日韩免费av一区二区三区| 国产肥女老熟女激情视频一区 | 亚洲国产av一二三区| 久久99亚洲小姐精品综合| 99亚洲综合精品成人网色播| 成年人视频日本大香蕉久久| 午夜精品在线视频一区| 久久福利视频视频一区二区| 九九热在线免费在线观看| 蜜桃av人妻精品一区二区三区| 国产一级特黄在线观看| 亚洲中文字幕有码在线观看| 日韩欧美一区二区黄色| 亚洲视频一级二级三级| 国产精品大秀视频日韩精品| 日韩欧美精品一区二区三区| 免费性欧美重口味黄色| 亚洲精品偷拍视频免费观看| 国产精品久久香蕉国产线| 精品欧美在线观看国产| 亚洲欧美日本国产不卡| 日韩成人动作片在线观看| 91免费精品国自产拍偷拍| 成年男女午夜久久久精品| 日韩人妻精品免费一区二区三区| 99久免费精品视频在线观| 国产日韩欧美专区一区| 欧美区一区二区在线观看| 国产又黄又爽又粗视频在线| 国产精品亚洲二区三区| 亚洲欧美黑人一区二区| 一区二区三区亚洲国产| 国产剧情欧美日韩中文在线| 欧美一区二区三区在线播放|