天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于GMM-UBM模型的說話人識(shí)別系統(tǒng)

發(fā)布時(shí)間:2017-10-04 03:31

  本文關(guān)鍵詞:基于GMM-UBM模型的說話人識(shí)別系統(tǒng)


  更多相關(guān)文章: 說話人識(shí)別 特征提取 GMM-UBM MFCC


【摘要】:說話人識(shí)別技術(shù)通過提取語(yǔ)音中的一些有用信息作為特征,建立模型來(lái)識(shí)別說話人的身份。最近幾十年,科技發(fā)展迅猛,在人們生活目益方便的同時(shí),安全問題也越來(lái)越嚴(yán)重,身份驗(yàn)證必須更加安全有效才能保證人們的財(cái)產(chǎn)和人身安全。而說話人識(shí)別技術(shù)所需成本低并且特征容易提取以及方便擴(kuò)展等優(yōu)勢(shì),所以可以應(yīng)用于多個(gè)領(lǐng)域,比如計(jì)算機(jī)遠(yuǎn)程登錄、門禁系統(tǒng)、數(shù)據(jù)庫(kù)訪問等等。近些年來(lái),說話人識(shí)別已然成為了語(yǔ)音識(shí)別中熱門研究方向之一。在眾多的說話人識(shí)別技術(shù)中,本文主要進(jìn)行基于梅爾倒譜特征提取方法和GMM-UBM模型的研究。論文主要研究?jī)?nèi)容如下:(1)介紹與分析了說話人識(shí)別的研究目的、背景以及意義,對(duì)說話人識(shí)別在國(guó)內(nèi)外的發(fā)展歷史和近況以及在實(shí)際中的應(yīng)用進(jìn)行了介紹和分析;(2)對(duì)說話人識(shí)別的分類、識(shí)別的流程、常用的方法等等進(jìn)行了介紹,分析了幾種特征提取方法以及系統(tǒng)識(shí)別方法,并給出它的評(píng)價(jià)方法的公式與流程;(3)從語(yǔ)音的發(fā)聲原理講起,研究了語(yǔ)音特征提取的各個(gè)步驟,介紹了梅爾倒譜特征、動(dòng)態(tài)特征、短時(shí)歸一化能量的提取,并進(jìn)行實(shí)驗(yàn)驗(yàn)證了動(dòng)態(tài)特征以及短時(shí)歸一化能量的作用;(4)重點(diǎn)介紹了GMM-UBM模型的實(shí)現(xiàn),對(duì)于實(shí)現(xiàn)該模型的EM算法、K-means算法等也進(jìn)行了分析,并進(jìn)行實(shí)驗(yàn)對(duì)于模型的各種參數(shù)變化進(jìn)行了對(duì)比,得出最優(yōu)的結(jié)果。
【關(guān)鍵詞】:說話人識(shí)別 特征提取 GMM-UBM MFCC
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-12
  • 第一章 緒論12-15
  • 1.1 說話人識(shí)別的研究目的與意義12
  • 1.2 說話人識(shí)別的發(fā)展歷史和研究現(xiàn)狀12-14
  • 1.3 存在的問題14
  • 1.4 本文的主要內(nèi)容及安排14-15
  • 第二章 說話人識(shí)別簡(jiǎn)介15-22
  • 2.1 說話人識(shí)別分類15
  • 2.2 說話人識(shí)別的原理和結(jié)構(gòu)15-16
  • 2.3 說話人識(shí)別的特征提取16-17
  • 2.3.1 特征提取的原則16
  • 2.3.2 特征提取的原則16-17
  • 2.4 說話人識(shí)別的建模方法17-19
  • 2.4.1 模板匹配17-18
  • 2.4.2 概率統(tǒng)計(jì)模型18
  • 2.4.3 人工神經(jīng)網(wǎng)絡(luò)18-19
  • 2.4.4 融合方法19
  • 2.5 說話人識(shí)別的性能評(píng)價(jià)指標(biāo)19-22
  • 2.5.1 說話人辨認(rèn)19
  • 2.5.2 說話人確認(rèn)19-20
  • 2.5.3 實(shí)際應(yīng)用的要求20-22
  • 第三章 語(yǔ)音信號(hào)處理及特征提取22-36
  • 3.1 語(yǔ)音信號(hào)的產(chǎn)生22-23
  • 3.1.1 語(yǔ)音信號(hào)的產(chǎn)生機(jī)理22-23
  • 3.1.2 語(yǔ)音產(chǎn)生的數(shù)學(xué)模型23
  • 3.2 語(yǔ)音信號(hào)的預(yù)處理23-26
  • 3.2.1 采樣與量化23-24
  • 3.2.2 歸一化24
  • 3.2.3 預(yù)加重24-25
  • 3.2.4 分幀與加窗25-26
  • 3.3 語(yǔ)音信號(hào)的時(shí)域分析26-29
  • 3.3.1 短時(shí)平均能量26-27
  • 3.3.2 短時(shí)平均過零率27-28
  • 3.3.3 語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)28-29
  • 3.4 語(yǔ)音信號(hào)的頻域分析29-30
  • 3.4.1 短時(shí)傅立葉變換29
  • 3.4.2 語(yǔ)譜圖29-30
  • 3.5 語(yǔ)音信號(hào)的同態(tài)倒譜分析30-31
  • 3.5.1 倒譜和復(fù)倒譜30
  • 3.5.2 線性預(yù)測(cè)系數(shù)30-31
  • 3.6 語(yǔ)音信號(hào)特征提取31-35
  • 3.6.1 線性預(yù)測(cè)倒譜系數(shù)31-32
  • 3.6.2 梅爾頻率倒譜系數(shù)32-34
  • 3.6.3 短時(shí)歸一化能量34
  • 3.6.4 動(dòng)態(tài)特征34-35
  • 3.7 矢量特征的參數(shù)規(guī)整35-36
  • 第四章 基于GMM-UBM的說話人識(shí)別36-43
  • 4.1 GMM的基本原理36-39
  • 4.1.1 GMM模型的原理36-37
  • 4.1.2 GMM模型的參數(shù)估計(jì)37-39
  • 4.1.3 GMM模型的參數(shù)初始化39
  • 4.2 GMM-UBM模型39-43
  • 4.2.1 UBM在說話人識(shí)別中的應(yīng)用39-40
  • 4.2.2 MAP算法40-41
  • 4.2.3 GMM-UBM的對(duì)數(shù)似然比41-43
  • 第五章 系統(tǒng)實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果43-50
  • 5.1 說話人識(shí)別系統(tǒng)平臺(tái)43-45
  • 5.1.1 硬件平臺(tái)43
  • 5.1.2 軟件平臺(tái)43
  • 5.1.3 系統(tǒng)功能與模塊43-45
  • 5.2 高斯混合密度個(gè)數(shù)對(duì)系統(tǒng)的影響45-46
  • 5.3 語(yǔ)音長(zhǎng)度對(duì)系統(tǒng)影響46-47
  • 5.3.1 訓(xùn)練語(yǔ)音長(zhǎng)度對(duì)系統(tǒng)影響46-47
  • 5.3.2 測(cè)試語(yǔ)音長(zhǎng)度對(duì)系統(tǒng)影響47
  • 5.4 特征維數(shù)對(duì)系統(tǒng)影響47-48
  • 5.5 端點(diǎn)檢測(cè)對(duì)系統(tǒng)影響48-49
  • 5.6 GMM模型與GMM-UBM模型的比較49
  • 5.7 實(shí)驗(yàn)結(jié)果49-50
  • 第六章 總結(jié)與展望50-52
  • 6.1 主要結(jié)論50
  • 6.2 待研究的問題50-52
  • 參考文獻(xiàn)52-55
  • 致謝55

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 石艷;王曉曄;;新穎檢測(cè)法在說話人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說話人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期

4 單進(jìn);;說話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期

6 謝建勛;;淺談?wù)f話人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期

7 安茂波;劉建;;一個(gè)快速說話人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識(shí)別綜述[J];電子科技;2012年06期

9 武光利;;說話人識(shí)別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鮑福良;方志剛;徐潔;;說話人識(shí)別綜述[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無(wú)關(guān)說話人識(shí)別[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識(shí)別中的應(yīng)用研究[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 戴紅霞;趙力;;文本無(wú)關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識(shí)別的說話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國(guó)科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年

10 張晶;董金明;馮文全;;說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議專刊[C];2008年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條

1 汪永安;科大訊飛說話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年

2 吳長(zhǎng)鋒;科大訊飛勇奪說話人識(shí)別國(guó)際大賽第一[N];科技日?qǐng)?bào);2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年

2 別凡虎;說話人識(shí)別中區(qū)分性問題的研究[D];清華大學(xué);2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識(shí)別方法研究[D];哈爾濱理工大學(xué);2016年

4 陸偉;基于缺失特征的文本無(wú)關(guān)說話人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

5 劉鏑;說話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年

6 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

7 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

8 邱政權(quán);在噪聲環(huán)境下的說話人識(shí)別[D];華南理工大學(xué);2007年

9 郭武;復(fù)雜信道下的說話人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

10 錢博;基于漢語(yǔ)元音映射的說話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識(shí)別[D];電子科技大學(xué);2008年

2 任舒彬;面向手持應(yīng)用的說話人識(shí)別算法研究[D];浙江大學(xué);2006年

3 申志生;文本相關(guān)說話人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年

4 汪q,

本文編號(hào):968412


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/968412.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2e397***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com