天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

說話人識(shí)別中的背景模型與得分問題研究

發(fā)布時(shí)間:2017-03-19 17:07

  本文關(guān)鍵詞:說話人識(shí)別中的背景模型與得分問題研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:作為一種生物認(rèn)證識(shí)別技術(shù),說話人識(shí)別技術(shù)具有遠(yuǎn)程控制的獨(dú)特優(yōu)勢(shì),在互聯(lián)網(wǎng)發(fā)展日新月異的今天擁有非常廣泛的應(yīng)用前景。近年來出現(xiàn)的說話人識(shí)別主流方法如GMM-SVM, JFA 和 i-vector等都是以GMM-UBM (Gaussian Mixture Model-Universal Background Model,高斯混合-通用背景模型)的識(shí)別框架為基礎(chǔ)。因此對(duì)GMM-UBM的研究仍有很大價(jià)值。本文基于GMM-UBM的說話人識(shí)別框架,對(duì)背景模型建模與得分問題進(jìn)行了新的探索,并提出了改進(jìn)系統(tǒng)安全性和性能的方法。本文主要貢獻(xiàn)如下:1.對(duì)通用背景模型UBM的構(gòu)建方法進(jìn)行了新的嘗試。我們驗(yàn)證了自包容的UBM的有效性,并在此基礎(chǔ)上提出了支撐說話人的概念,即對(duì)構(gòu)建UBM起關(guān)鍵作用的是部分關(guān)鍵說話人。通過PCA降維我們發(fā)現(xiàn),空間分布分散的說話人更有助于組成支撐說話人集合,比隨機(jī)選擇的方式平均識(shí)別效果好1%左右;2.針對(duì)說話人識(shí)別系統(tǒng)的樣本復(fù)制語音攻擊極大限制了說話人識(shí)別技術(shù)的應(yīng)用和發(fā)展。我們提出了一種基于模型階數(shù)相關(guān)的似然得分單調(diào)性(Order dependent Likelihood Score Monotonic, OLSM)的樣本復(fù)制語音檢測(cè)方法,該方法利用了GMM模型的過擬合現(xiàn)象,可以有效提高GMM-UBM說話人識(shí)別系統(tǒng)的安全性。MASC庫上該方法對(duì)樣本復(fù)制語音的檢測(cè)正確率達(dá)99.3%。3. GMM token是似然得分最高的高斯分量的索引。作為一種高層次特征,GMM token可以提供很多輔助信息來提高系統(tǒng)性能。傳統(tǒng)GMM token中只取得分最高的高斯分量,我們將它擴(kuò)展為取前N個(gè)得分最高的高斯分量,即N-Best token;此外,我們研究了不同GMMtokenizer對(duì)改進(jìn)系統(tǒng)性能上的不同影響。在基于GMM token配比相似度得分校正的說話人識(shí)別系統(tǒng)上進(jìn)行了驗(yàn)證,性能提升效果良好。
【關(guān)鍵詞】:說話人識(shí)別 GMM-UBM 自包容的UBM 樣本復(fù)制語音攻擊檢測(cè) GMM token N-Best token
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要4-5
  • Abstract5-12
  • 第1章 緒論12-18
  • 1.1 研究背景與意義12-13
  • 1.2 說話人識(shí)別任務(wù)介紹13-16
  • 1.2.1 說話人識(shí)別的發(fā)展歷程13-14
  • 1.2.2 說話人識(shí)別任務(wù)分類14-16
  • 1.3 說話人識(shí)別中背景模型和得分問題16-17
  • 1.4 本文章節(jié)安排17-18
  • 第2章 基于GMM-UBM的說話人識(shí)別方法18-31
  • 2.1 概述18
  • 2.2 基于GMM-UBM的說話人識(shí)別系統(tǒng)框架18-19
  • 2.3 前端處理19-24
  • 2.3.1 預(yù)處理20-21
  • 2.3.2 特征提取21-24
  • 2.4 GMM模型介紹24-29
  • 2.4.1 GMM模型定義24-25
  • 2.4.2 GMM模型的參數(shù)估計(jì)25-28
  • 2.4.3 MAP自適應(yīng)算法得到目標(biāo)模型28-29
  • 2.4.4 GMM-UBM模型似然得分計(jì)算29
  • 2.5 系統(tǒng)性能評(píng)價(jià)29-30
  • 2.6 本章小結(jié)30-31
  • 第3章 UBM支撐說話人集合31-45
  • 3.1 引言31-32
  • 3.2 UBM數(shù)據(jù)選擇方法32-33
  • 3.3 自包容的UBM33-35
  • 3.4 UBM支撐說話人集合35-40
  • 3.4.1 UBM三元組36-38
  • 3.4.2 UBM空間三角形38-40
  • 3.5 結(jié)果驗(yàn)證及分析40-44
  • 3.6 本章小結(jié)44-45
  • 第4章 基于OLSM的樣本復(fù)制語音入侵檢測(cè)方法45-58
  • 4.1 引言45
  • 4.2 說話人識(shí)別攻擊防御技術(shù)研究現(xiàn)狀45-46
  • 4.3 基于OLSM的樣本復(fù)制語音攻擊檢測(cè)方法46-52
  • 4.3.1 機(jī)器學(xué)習(xí)中的過擬合現(xiàn)象47-48
  • 4.3.2 模型階數(shù)相關(guān)的似然得分單調(diào)性48-51
  • 4.3.3 基于OLSM的樣本復(fù)制語音檢測(cè)模型51-52
  • 4.4 基于OLSM現(xiàn)象樣本復(fù)制語音檢測(cè)方法的應(yīng)用52-56
  • 4.4.1 系統(tǒng)流程53-54
  • 4.4.2 對(duì)樣本復(fù)制語音回放攻擊的檢測(cè)54
  • 4.4.3 對(duì)樣本復(fù)制語音直接攻擊的檢測(cè)54-56
  • 4.5 實(shí)驗(yàn)及分析56-57
  • 4.6 本章小結(jié)57-58
  • 第5章 N-Best token與GMM_t tokenizer在說話人識(shí)別中的應(yīng)用58-67
  • 5.1 GMM token在語音領(lǐng)域的應(yīng)用58-60
  • 5.2 基于GMM token配比向量得分校正的說話人識(shí)別系統(tǒng)60-61
  • 5.3 N-Best token在說話人識(shí)別中的應(yīng)用61-64
  • 5.3.1 N-Best token的定義61-62
  • 5.3.2 N-Best token對(duì)系統(tǒng)性能的影響62-64
  • 5.4 GMM_t tokenizer在說話人識(shí)別中的應(yīng)用64-66
  • 5.5 本章小結(jié)66-67
  • 第6章 總結(jié)與展望67-70
  • 6.1 工作總結(jié)67-68
  • 6.2 工作展望68-70
  • 參考文獻(xiàn)70-74
  • 附錄A:NIST庫UBM訓(xùn)練集降維后空間分布74-76
  • 攻讀碩士學(xué)位期間主要的研究成果76-77
  • 致謝77

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 石艷;王曉曄;;新穎檢測(cè)法在說話人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說話人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期

4 單進(jìn);;說話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期

6 謝建勛;;淺談?wù)f話人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期

7 安茂波;劉建;;一個(gè)快速說話人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識(shí)別綜述[J];電子科技;2012年06期

9 武光利;;說話人識(shí)別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 鮑福良;方志剛;徐潔;;說話人識(shí)別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識(shí)別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識(shí)別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識(shí)別中的應(yīng)用研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 戴紅霞;趙力;;文本無關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識(shí)別中的應(yīng)用[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識(shí)別的說話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年

10 張晶;董金明;馮文全;;說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議專刊[C];2008年

中國重要報(bào)紙全文數(shù)據(jù)庫 前2條

1 汪永安;科大訊飛說話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年

2 吳長鋒;科大訊飛勇奪說話人識(shí)別國際大賽第一[N];科技日?qǐng)?bào);2008年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年

2 陸偉;基于缺失特征的文本無關(guān)說話人識(shí)別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

3 劉鏑;說話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年

4 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

5 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

6 邱政權(quán);在噪聲環(huán)境下的說話人識(shí)別[D];華南理工大學(xué);2007年

7 郭武;復(fù)雜信道下的說話人識(shí)別[D];中國科學(xué)技術(shù)大學(xué);2007年

8 錢博;基于漢語元音映射的說話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年

9 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年

10 俞一彪;基于互信息理論的說話人識(shí)別研究[D];上海大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識(shí)別[D];電子科技大學(xué);2008年

2 任舒彬;面向手持應(yīng)用的說話人識(shí)別算法研究[D];浙江大學(xué);2006年

3 申志生;文本相關(guān)說話人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年

4 汪q

本文編號(hào):256285


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/256285.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶92f8f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
91欧美视频在线观看免费| 在线观看视频日韩成人| 久热99中文字幕视频在线| 日韩国产亚洲欧美激情| 亚洲最新中文字幕在线视频| 日韩欧美一区二区不卡视频| 91麻豆精品欧美一区| 国产精品人妻熟女毛片av久 | 精品亚洲香蕉久久综合网| 人人妻人人澡人人夜夜| 开心久久综合激情五月天| 日韩欧美国产精品中文字幕| 精品一区二区三区免费看| 国产精品不卡高清在线观看| 夫妻性生活黄色录像视频| 亚洲欧美中文字幕精品| 青青草草免费在线视频| 欧美胖熟妇一区二区三区| 黄色国产一区二区三区| 色婷婷在线视频免费播放| 青青操视频在线播放免费| 亚洲天堂久久精品成人| 婷婷基地五月激情五月| 亚洲av首页免费在线观看| 乱女午夜精品一区二区三区| 欧美日韩国产成人高潮| 欧美日韩精品综合在线| 精品国产一区二区欧美| 九九热精彩视频在线播放| 欧美日韩国产免费看黄片| 国产永久免费高清在线精品| 日本精品啪啪一区二区三区| 日韩人妻免费视频一专区| 亚洲国产成人一区二区在线观看| 99久久国产综合精品二区| 一区二区在线激情视频| 色哟哟哟在线观看视频| 日韩欧美三级中文字幕| 日韩丝袜诱惑一区二区| 久久91精品国产亚洲| 久久久免费精品人妻一区二区三区 |