天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

話者確認中信道和時長失配補償研究

發(fā)布時間:2017-06-08 23:01

  本文關(guān)鍵詞:話者確認中信道和時長失配補償研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:文本無關(guān)的說話人確認技術(shù)旨在從語音中提取說話人的個性信息從而完成說話人身份的驗證。使用便捷以及非接觸式交互等獨特的優(yōu)勢使其得到越來越廣泛的應(yīng)用,并成為當(dāng)今生物特征識別領(lǐng)域的研究熱點。近年來,說話人確認技術(shù)逐漸走向?qū)嵱?但由于實際環(huán)境的復(fù)雜性,面臨著傳輸信道的多樣化、背景噪聲污染等問題,說話人確認技術(shù)性能難以提升。本論文主要是研究環(huán)境失配下的說話人確認,從失配補償?shù)慕嵌瘸霭l(fā),探討了全局差異空間方法以及概率線性鑒別分析方法,并對其存在的問題提出改進方案。本論文主要的研究工作有:首先,探討了美爾頻率倒譜參數(shù)的提取過程,介紹了高斯混合模型(Gaussian Mixture Model, GMM),對其原理以及訓(xùn)練算法進行詳細的闡述,并深入分析了GMM用于說話人確認的優(yōu)缺點,構(gòu)建了基于GMM-UBM框架的說話人確認系統(tǒng),并通過實驗分析GMM-UBM系統(tǒng)的性能。接著,深入研究說話人確認失配補償方法。利用因子分析的方法,從高斯均值超矢量提取出具有區(qū)分性的身份矢量I-Vector,構(gòu)建了基于I-Vector的說話人確認系統(tǒng)。給出線性鑒別分析、類內(nèi)協(xié)方差規(guī)整等信道補償方法對I-Vector系統(tǒng)進行改進,實驗結(jié)果表明這些方法可以有效地改善信道失配對說話人確認系統(tǒng)的負面影響。最后,深入研究概率線性鑒別分析(Probabilistic Linear Discriminant Analysis, PLDA)方法對說話人以及干擾信息的建模能力,簡化高斯概率線性鑒別分析(Gaussian PLDA, GPLDA)以及其得分公式,構(gòu)建基于高斯概率線性鑒別分析的說話人確認系統(tǒng),研究其對I-Vector矢量的補償能力。此外,針對訓(xùn)練語音與測試語音時長失配的情況,提出估計時長差異信息的方法,并將此時長差異信息融入PLDA系統(tǒng),實驗表明,該方法在一定程度上提高系統(tǒng)的性能。
【關(guān)鍵詞】:說話人確認 高斯混合模型 I-Vector矢量 概率線性鑒別分析 失配
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
【目錄】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 緒論11-21
  • 1.1 引言11
  • 1.2 研究背景以及意義11-12
  • 1.3 說話人識別發(fā)展概況12-13
  • 1.4 說話人識別的分類13
  • 1.5 說話人確認13-18
  • 1.5.1 前端處理14-15
  • 1.5.2 模型匹配15
  • 1.5.3 評分決策15-16
  • 1.5.4 說話人確認系統(tǒng)的性能評價指標16-18
  • 1.5.4.1 等誤識率與DET曲線17
  • 1.5.4.2 檢測代價函數(shù)17-18
  • 1.6 影響說話人確認系統(tǒng)性能的因素18-20
  • 1.7 本文主要研究工作20-21
  • 第二章 基于GMM-UBM的說話人確認系統(tǒng)21-33
  • 2.1 引言21-22
  • 2.2 前端處理22-24
  • 2.2.1 特征提取22
  • 2.2.2 美爾頻率倒譜參數(shù)22-24
  • 2.3 高斯混合模型24-28
  • 2.3.1 高斯混合模型的概念24-26
  • 2.3.2 模型參數(shù)估計26-28
  • 2.4 基于GMM-UBM的說話人確認28-31
  • 2.4.1 GMM-UBM系統(tǒng)框架28-29
  • 2.4.2 MAP自適應(yīng)算法29-31
  • 2.5 實驗結(jié)果與分析31-32
  • 2.5.1 實驗參數(shù)說明31-32
  • 2.5.2 混合度對GMM-UBM系統(tǒng)影響32
  • 2.6 本章小結(jié)32-33
  • 第三章 基于I-Vector的說話人確認研究33-49
  • 3.1 引言33-34
  • 3.2 均值超矢量34
  • 3.3 因子分析的概念34-35
  • 3.4 聯(lián)合因子分析35-37
  • 3.5 I-Vector矢量37-40
  • 3.5.1 全局差異空間矩陣估計38-39
  • 3.5.2 I-Vector提取39
  • 3.5.3 余弦評分39-40
  • 3.6 信道補償技術(shù)40-43
  • 3.6.1 線性鑒別分析41-42
  • 3.6.2 類內(nèi)協(xié)方差規(guī)整42-43
  • 3.7 實驗結(jié)果與分析43-47
  • 3.7.1 訓(xùn)練數(shù)據(jù)以及參數(shù)配置43-44
  • 3.7.2 I-Vector維度對系統(tǒng)的影響44
  • 3.7.3 信道補償系統(tǒng)的性能分析44-45
  • 3.7.4 時長對I-Vector系統(tǒng)的影響45-47
  • 3.8 本章小結(jié)47-49
  • 第四章 基于PLDA的說話人確認研究49-65
  • 4.1 引言49-50
  • 4.2 PLDA模型50-57
  • 4.2.1 簡化GPLDA模型51-52
  • 4.2.2 GPLDA模型訓(xùn)練52-55
  • 4.2.3 GPLDA得分計算55-57
  • 4.3 I-Vector矢量后處理57-59
  • 4.4 改進GPLDA模型59-61
  • 4.4.1 時長對GPLDA系統(tǒng)的影響分析59
  • 4.4.2 融入時長差異信息的GPLDA59-60
  • 4.4.3 時長差異信息的估計60-61
  • 4.5 實驗結(jié)果與分析61-64
  • 4.5.1 訓(xùn)練數(shù)據(jù)以及參數(shù)配置61
  • 4.5.2 GPLDA系統(tǒng)的性能分析61-62
  • 4.5.3 改進GPLDA模型的性能分析62-64
  • 4.6 本章小結(jié)64-65
  • 第五章 總結(jié)與展望65-67
  • 參考文獻67-71
  • 致謝71-73
  • 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果73

【參考文獻】

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 劉青松;話者識別中失配信息補償理論和方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年


  本文關(guān)鍵詞:話者確認中信道和時長失配補償研究,由筆耕文化傳播整理發(fā)布。



本文編號:433883

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/433883.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶921d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com