天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

加權成對約束度量學習算法在說話人識別中的應用

發(fā)布時間:2017-03-27 14:11

  本文關鍵詞:加權成對約束度量學習算法在說話人識別中的應用,由筆耕文化傳播整理發(fā)布。


【摘要】:說話人識別技術是一種通過對目標說話人的語音進行處理與分析,從而判斷出該說話人身份的技術。目前,說話人識別作為人與計算機進行交互的一種智能接口有著非常廣泛的用途,它具有方便快捷、經濟可靠和擴展性好等許多優(yōu)點,已經被廣泛用于遠程身份驗證,同時在軍事和醫(yī)學領域,尤其是基于電信網絡的身份識別應用,說話人識別技術的前景同樣非常廣闊。如何有效地對說話人語音進行相似度判別,是目前說話人識別研究領域非常重要的關鍵問題之一。模式識別領域中,樣本間相似度的衡量方法有很多,其中常用的方法有距離打分法,如余弦距離打分(cosine distance scoring)和馬氏距離打分(Mahalanobis distance scoring)等。目前最流行的基于i-vector模型的說話人識別系統(tǒng)常用余弦距離來衡量說話人語音間的相似度,余弦距離打分法根據樣本向量間的夾角來判斷樣本間的相似度,難以衡量樣本在量上的區(qū)別。馬氏距離打分法根據投影在能真實反映樣本相似性的樣本空間中的新樣本向量間的歐氏距離,來衡量樣本間的相似度。用于投影到樣本空間的映射矩陣稱為度量矩陣,它可用于描述樣本空間的相似性。不同的度量矩陣描述的樣本空間也不同,只有得到正確的度量矩陣,通過其計算出來的馬氏距離才能真實的反映樣本間的相似性。度量學習根據訓練樣本含有的信息,通過自動學習得到一個距離度量矩陣,常用于計算目標樣本間的馬氏距離,從而對未知數據的相似度進行預測。本文主要工作和創(chuàng)新如下:(1)本文對Cao等提出的子空間相似性度量學習(Subspace Similarity Metric Learning,SUB-SML)算法中的子算法(Subspace Metric Learning,SUB-ML)進行改進,根據相似訓練樣本對與非相似訓練樣本對在度量學習訓練過程的影響程度進行加權約束,提出加權成對約束度量學習(Weighted Pairwise constraint Metric Learning,WPCML)算法。該算法利用成對訓練樣本的約束信息訓練一個用于描述樣本空間相似度的度量矩陣,用來計算i-vector語音樣本間的馬氏距離。該算法的原理非常直觀,而且簡單有效,目標函數的最優(yōu)化求解能得到全局最優(yōu)解,并能迅速求得滿足設定條件的度量矩陣,而用于訓練的樣本對只需知道其是否屬于同類。美國國家標準技術局(NIST)說話人評測(SRE)2008年數據集上的實驗結果表明,WPCML算法訓練度量矩陣用于馬氏距離相似度打分的分類性能優(yōu)于余弦距離相似度打分。(2)訓練樣本對集的構造是度量學習研究中的一個重要問題。合適的訓練樣本對含有的有效信息更能正確指導訓練過程。大部分度量學習算法采用隨機構造的方法來構造度量學習訓練樣本對集。本文對訓練樣本對集的構造方法進行研究,提出選擇訓練樣本對法構建度量矩陣訓練樣本對集。選擇訓練樣本對方法用于度量學習訓練樣本集的構造能進一步提高系統(tǒng)實驗性能,并優(yōu)于目前最流行的PLDA分類器。
【關鍵詞】:說話人識別 馬氏距離 度量學習 機器學習 模式識別
【學位授予單位】:江西師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181;TN912.34
【目錄】:
  • 中文摘要3-5
  • Abstract5-9
  • 1 緒論9-15
  • 1.1 說話人識別概述9-11
  • 1.1.1 說話人識別的概念9-10
  • 1.1.2 說話人識別研究現狀分析10-11
  • 1.2 度量學習概述11-13
  • 1.2.1 度量學習的概念11-12
  • 1.2.2 度量學習的研究現狀分析12-13
  • 1.3 研究內容與創(chuàng)新點:13-14
  • 1.3.1 研究內容13
  • 1.3.2 創(chuàng)新點13-14
  • 1.4 本文內容組織14-15
  • 2 基于I-VECTOR模型的說話人識別系統(tǒng)15-25
  • 2.1 語音預處理15-16
  • 2.2 基于MFCC的特征提取16
  • 2.3 說話人模型的建立16-20
  • 2.3.1 GMM-UBM說話人識別模型16-18
  • 2.3.2 說話人i-vector模型18-20
  • 2.4 信道補償技術20-22
  • 2.4.1 線性判別性分析21
  • 2.4.2 類內協(xié)方差規(guī)整21-22
  • 2.4.3 長度規(guī)整22
  • 2.5 打分判別22-23
  • 2.5.1 余弦相似度打分22
  • 2.5.2 PLDA模型打分22-23
  • 2.5.3 馬氏距離打分23
  • 2.6 性能評估23-24
  • 2.6.1 識別率23
  • 2.6.2 等錯誤率EER23-24
  • 2.6.3 檢測代價函數DCF24
  • 2.7 本章小結24-25
  • 3 加權成對約束度量學習算法25-33
  • 3.1 子空間度量學習算法SUB-ML26-29
  • 3.1.1 映射類內子空間26
  • 3.1.2 度量學習目標函數26-27
  • 3.1.3 目標函數的求解27-29
  • 3.2 加權成對約束度量學習算法WPCML29-32
  • 3.2.1 映射類內子空間29
  • 3.2.2 度量學習目標函數29
  • 3.2.3 加權約束對損失函數29-30
  • 3.2.4 目標函數的求解30-32
  • 3.3 本章小結32-33
  • 4 度量矩陣訓練樣本對集的構造33-38
  • 4.1 成對約束訓練樣本對集的構造33-34
  • 4.2 傳統(tǒng)度量矩陣訓練樣本對集的構造方法34-35
  • 4.2.1 隨機選擇法34
  • 4.2.2 交叉驗證法34-35
  • 4.3 選擇訓練樣本對集構造方法35-37
  • 4.4 本章小結37-38
  • 5 實驗及結果分析38-45
  • 5.1 實驗設置38-39
  • 5.2 基線對比實驗39
  • 5.2.1 實驗 1(Cosine+ZTNORM):39
  • 5.2.2 實驗 2(PLDA):39
  • 5.3 度量學習實驗39-40
  • 5.3.1 實驗 3(SUB-ML):40
  • 5.3.2 實驗 4(SUB-ML-s):40
  • 5.3.3 實驗 5(SUB-WPCML-s):40
  • 5.4 實驗結果與分析40-44
  • 5.5 本章小結44-45
  • 6 總結與展望45-47
  • 6.1 總結45
  • 6.2 展望45-47
  • 參考文獻47-51
  • 致謝51-52
  • 在讀期間公開發(fā)表論文(著)及科研情況52

【相似文獻】

中國期刊全文數據庫 前10條

1 石艷;王曉曄;;新穎檢測法在說話人識別技術中的應用[J];現代計算機(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術;2009年01期

3 邱政權;范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術與工程;2010年02期

4 單進;;說話人識別技術研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識別算法的定點DSP實現[J];單片機與嵌入式系統(tǒng)應用;2011年03期

6 謝建勛;;淺談說話人識別技術[J];電腦知識與技術;2011年11期

7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設計和實現[J];網絡新媒體技術;2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期

9 武光利;;說話人識別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術現狀與進展[J];河南科技;1998年09期

中國重要會議論文全文數據庫 前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網絡說話人識別[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經網絡組的文本無關說話人識別[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關說話人識別[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年

6 戴紅霞;趙力;;文本無關說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術交流會論文集[C];2007年

7 陳聯武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經網絡特征維數壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術年會暨高新技術前沿與發(fā)展學術會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現[A];全國第二屆信號處理與應用學術會議?痆C];2008年

中國重要報紙全文數據庫 前2條

1 汪永安;科大訊飛說話人識別技術世界領先[N];安徽日報;2008年

2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年

中國博士學位論文全文數據庫 前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年

2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年

4 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年

5 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年

6 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年

7 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年

8 邱政權;在噪聲環(huán)境下的說話人識別[D];華南理工大學;2007年

9 郭武;復雜信道下的說話人識別[D];中國科學技術大學;2007年

10 錢博;基于漢語元音映射的說話人識別技術研究[D];南京理工大學;2007年

中國碩士學位論文全文數據庫 前10條

1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年

2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年

3 申志生;文本相關說話人識別嵌入式系統(tǒng)及其關鍵技術研究[D];河北工業(yè)大學;2011年

4 汪q,

本文編號:270520


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/270520.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶54040***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com