天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于非重構(gòu)壓縮采樣的抗噪說(shuō)話人識(shí)別技術(shù)研究

發(fā)布時(shí)間:2017-08-25 01:24

  本文關(guān)鍵詞:基于非重構(gòu)壓縮采樣的抗噪說(shuō)話人識(shí)別技術(shù)研究


  更多相關(guān)文章: 說(shuō)話人識(shí)別 魯棒性 壓縮感知 語(yǔ)音增強(qiáng) 加權(quán)融合


【摘要】:隨著計(jì)算機(jī)的產(chǎn)生和互聯(lián)網(wǎng)技術(shù)的發(fā)展,說(shuō)話人識(shí)別作為生物認(rèn)證的一種,憑借其獨(dú)一無(wú)二的優(yōu)勢(shì)在人機(jī)交互領(lǐng)域一直備受關(guān)注。說(shuō)話人識(shí)別技術(shù)已經(jīng)從實(shí)驗(yàn)室轉(zhuǎn)向了實(shí)際應(yīng)用中,同時(shí)用戶對(duì)其準(zhǔn)確性、友好性和魯棒性的要求越來(lái)越高。在實(shí)際應(yīng)用環(huán)境中,說(shuō)話人識(shí)別性能受到諸多因素影響,其中最主要的因素是環(huán)境噪聲的存在。環(huán)境噪聲污染了采集的語(yǔ)音信號(hào),導(dǎo)致訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集之間的匹配度降低,引起識(shí)別性能下降。另一方面,隨著云計(jì)算、大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,人們獲得的信息量不斷增加,為了減輕傳輸和處理數(shù)據(jù)的負(fù)擔(dān),信號(hào)的壓縮感知技術(shù)應(yīng)運(yùn)而生。奈奎斯特采樣下的說(shuō)話人識(shí)別,當(dāng)為了確保高的識(shí)別率而采集較長(zhǎng)時(shí)間說(shuō)話人語(yǔ)音時(shí),采樣數(shù)據(jù)量特別大,其中有許多冗余造成了采樣資源的浪費(fèi),壓縮感知理論可以很好地解決此問(wèn)題。本文將壓縮感知理論應(yīng)用到噪聲環(huán)境下的說(shuō)話人識(shí)別系統(tǒng)中,直接對(duì)觀測(cè)矩陣壓縮后的觀測(cè)序列進(jìn)行特征提取,針對(duì)基于壓縮感知的魯棒性說(shuō)話人識(shí)別進(jìn)行研究,論文工作是導(dǎo)師國(guó)家自然科學(xué)基金工作的一部分,本文主要工作和創(chuàng)新如下:(1)研究壓縮感知壓縮比和語(yǔ)音分幀長(zhǎng)度對(duì)識(shí)別系統(tǒng)性能影響。對(duì)行階梯矩陣投影下的觀測(cè)序列展開(kāi)研究,研究壓縮比和幀長(zhǎng)對(duì)識(shí)別率的影響。發(fā)現(xiàn)在壓縮比為1:2時(shí),識(shí)別性能與傳統(tǒng)方法相當(dāng);幀長(zhǎng)過(guò)短或過(guò)長(zhǎng)時(shí),說(shuō)話人識(shí)別率有明顯的下降趨勢(shì),一般所取的幀長(zhǎng)在20ms-30ms左右。(2)研究在有噪環(huán)境下語(yǔ)音壓縮感知識(shí)別系統(tǒng)的特征參數(shù)和消噪技術(shù)。首先提出了基于譜減法的特征參數(shù)CS-SSMFCC,提高了系統(tǒng)的魯棒性。將時(shí)頻分析特性較好的小波閾值去噪應(yīng)用到系統(tǒng)前端,發(fā)現(xiàn)小波軟閾值去噪效果比譜減法更好,在15dB信噪比下,識(shí)別率可以達(dá)到90%以上。(3)語(yǔ)音信號(hào)是由激勵(lì)源和聲道函數(shù)共同作用的結(jié)果,基于行階梯矩陣提取另一種關(guān)鍵特征參數(shù)—基音頻率。為了提高識(shí)別率,提出一種將基音信息和Mel倒譜特征分?jǐn)?shù)層線性加權(quán)融合方法,根據(jù)加權(quán)系數(shù)是否與每條測(cè)試語(yǔ)音有關(guān),采用固定加權(quán)和動(dòng)態(tài)加權(quán)兩種融合方法,實(shí)驗(yàn)結(jié)果表明動(dòng)態(tài)加權(quán)融合識(shí)別效果更好。在此基礎(chǔ)上,將小波軟閾值去噪增加到系統(tǒng)前端,設(shè)計(jì)一種新的抗噪融合識(shí)別系統(tǒng),增強(qiáng)了系統(tǒng)的魯棒性。
【關(guān)鍵詞】:說(shuō)話人識(shí)別 魯棒性 壓縮感知 語(yǔ)音增強(qiáng) 加權(quán)融合
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 專用術(shù)語(yǔ)注釋表9-10
  • 第一章 緒論10-17
  • 1.1 引言10-11
  • 1.2 說(shuō)話人識(shí)別技術(shù)11-15
  • 1.2.1 說(shuō)話人識(shí)別的發(fā)展歷程12-13
  • 1.2.2 說(shuō)話人識(shí)別中的問(wèn)題13-14
  • 1.2.3 說(shuō)話人識(shí)別的應(yīng)用14-15
  • 1.3 基于CS的說(shuō)話人識(shí)別技術(shù)研究現(xiàn)狀15
  • 1.4 論文內(nèi)容和結(jié)構(gòu)安排15-17
  • 第二章 說(shuō)話人識(shí)別技術(shù)與壓縮感知理論17-37
  • 2.1 說(shuō)話人識(shí)別原理17
  • 2.2 語(yǔ)音預(yù)處理17-20
  • 2.3 特征參數(shù)提取20-24
  • 2.4 說(shuō)話人識(shí)別模型24-28
  • 2.4.1 矢量量化模型(VQ)24-25
  • 2.4.2 隱馬爾科夫模型(HMM)25
  • 2.4.3 高斯混合模型(GMM)25-27
  • 2.4.4 支持向量機(jī)(SVM)27-28
  • 2.5 說(shuō)話人識(shí)別性能評(píng)價(jià)28-29
  • 2.6 壓縮感知基本理論29-35
  • 2.6.1 語(yǔ)音信號(hào)的稀疏性30-32
  • 2.6.2 觀測(cè)矩陣的選取32-35
  • 2.7 基于CS的識(shí)別系統(tǒng)框架35-36
  • 2.8 本章小結(jié)36-37
  • 第三章 基于壓縮感知的增強(qiáng)型特征參數(shù)研究37-53
  • 3.1 引言37
  • 3.2 基于CS的增強(qiáng)型識(shí)別系統(tǒng)37-38
  • 3.3 有噪環(huán)境下基于CS的說(shuō)話人識(shí)別38-47
  • 3.3.1 行階梯觀測(cè)矩陣39-41
  • 3.3.2 基于譜減法的特征提取41-43
  • 3.3.3 基于小波閾值去噪法的特征提取43-47
  • 3.4 實(shí)驗(yàn)結(jié)果與分析47-51
  • 3.4.1 實(shí)驗(yàn)一:壓縮比與識(shí)別率的關(guān)系47-48
  • 3.4.2 實(shí)驗(yàn)二:幀長(zhǎng)對(duì)識(shí)別率的影響48-49
  • 3.4.3 實(shí)驗(yàn)三:有噪環(huán)境下輸出信噪比對(duì)比49-50
  • 3.4.4 實(shí)驗(yàn)四:有噪環(huán)境下特征參數(shù)性能對(duì)比50-51
  • 3.5 本章小結(jié)51-53
  • 第四章 基于壓縮感知信息融合的說(shuō)話人識(shí)別系統(tǒng)53-69
  • 4.1 引言53-54
  • 4.2 基于CS的基音特征提取54-57
  • 4.3 基于CS的倒譜特征提取57
  • 4.4 兩種特征信息融合方法研究57-63
  • 4.4.1 匹配分?jǐn)?shù)線性融合的具體過(guò)程58-59
  • 4.4.2 固定權(quán)重融合方法59-60
  • 4.4.3 動(dòng)態(tài)權(quán)重融合方法60-62
  • 4.4.4 有噪環(huán)境下信息融合的說(shuō)話人識(shí)別系統(tǒng)62-63
  • 4.5 實(shí)驗(yàn)結(jié)果及分析63-67
  • 4.5.1 實(shí)驗(yàn)一:?jiǎn)我惶卣髯R(shí)別率63-65
  • 4.5.2 實(shí)驗(yàn)二:特征融合后的識(shí)別率65-66
  • 4.5.3 實(shí)驗(yàn)三:噪聲環(huán)境下融合系統(tǒng)識(shí)別效果66-67
  • 4.6 本章小結(jié)67-69
  • 第五章 總結(jié)與展望69-71
  • 5.1 論文總結(jié)69-70
  • 5.2 工作展望70-71
  • 參考文獻(xiàn)71-75
  • 附錄1 攻讀碩士學(xué)位期間撰寫的論文75-76
  • 附錄2 攻讀碩士學(xué)位期間參加的科研項(xiàng)目76-77
  • 致謝77

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 石艷;王曉曄;;新穎檢測(cè)法在說(shuō)話人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說(shuō)話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說(shuō)話人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期

4 單進(jìn);;說(shuō)話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說(shuō)話人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期

6 謝建勛;;淺談?wù)f話人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期

7 安茂波;劉建;;一個(gè)快速說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說(shuō)話人識(shí)別綜述[J];電子科技;2012年06期

9 武光利;;說(shuō)話人識(shí)別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說(shuō)話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鮑福良;方志剛;徐潔;;說(shuō)話人識(shí)別綜述[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說(shuō)話人識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無(wú)關(guān)說(shuō)話人識(shí)別[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說(shuō)話人識(shí)別中的應(yīng)用研究[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說(shuō)話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 戴紅霞;趙力;;文本無(wú)關(guān)說(shuō)話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說(shuō)話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說(shuō)話人識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識(shí)別的說(shuō)話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國(guó)科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年

10 張晶;董金明;馮文全;;說(shuō)話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條

1 汪永安;科大訊飛說(shuō)話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年

2 吳長(zhǎng)鋒;科大訊飛勇奪說(shuō)話人識(shí)別國(guó)際大賽第一[N];科技日?qǐng)?bào);2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 單振宇;情感說(shuō)話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年

2 別凡虎;說(shuō)話人識(shí)別中區(qū)分性問(wèn)題的研究[D];清華大學(xué);2015年

3 謝怡寧;基于稀疏編碼的魯棒說(shuō)話人識(shí)別方法研究[D];哈爾濱理工大學(xué);2016年

4 陸偉;基于缺失特征的文本無(wú)關(guān)說(shuō)話人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

5 劉鏑;說(shuō)話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年

6 付中華;說(shuō)話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

7 林琳;基于模糊聚類與遺傳算法的說(shuō)話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

8 邱政權(quán);在噪聲環(huán)境下的說(shuō)話人識(shí)別[D];華南理工大學(xué);2007年

9 郭武;復(fù)雜信道下的說(shuō)話人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

10 錢博;基于漢語(yǔ)元音映射的說(shuō)話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說(shuō)話人識(shí)別[D];電子科技大學(xué);2008年

2 任舒彬;面向手持應(yīng)用的說(shuō)話人識(shí)別算法研究[D];浙江大學(xué);2006年

3 申志生;文本相關(guān)說(shuō)話人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年

4 汪q,

本文編號(hào):734267


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/734267.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59697***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com