特定人語(yǔ)音增強(qiáng)算法的研究
本文關(guān)鍵詞:特定人語(yǔ)音增強(qiáng)算法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息化的發(fā)展,語(yǔ)音通信成為人們?nèi)粘W罨镜臏贤ǚ绞?但在實(shí)際環(huán)境中會(huì)不可避免的受到各種噪聲的影響,導(dǎo)致語(yǔ)音質(zhì)量和系統(tǒng)性能的下降,因此很多學(xué)者致力于研究高效的語(yǔ)音增強(qiáng)算法。目前,越來(lái)越多的電子設(shè)備被“私有化”,即在日常生活中,僅被一個(gè)人或固定的幾個(gè)人長(zhǎng)期使用,所以根據(jù)這個(gè)特點(diǎn),我們考慮在語(yǔ)音增強(qiáng)算法中引入特定說(shuō)話人的特征信息,進(jìn)而提高噪聲的抑制能力。本文通過(guò)分析幾種經(jīng)典語(yǔ)音增強(qiáng)算法,給出了一種基于特定人特征的改進(jìn)算法。在語(yǔ)音存在與否的雙狀態(tài)模型下,最優(yōu)修正的最小均方差對(duì)數(shù)幅度譜估計(jì)(OMLSA)算法與改進(jìn)的最小值控制的遞歸平均(IMCRA)算法相結(jié)合的方法,相對(duì)于其他經(jīng)典算法在噪聲抑制方面具有明顯優(yōu)勢(shì)。因此,本文在IMCRA-OMLSA算法的基礎(chǔ)上,引入特定說(shuō)話人的特征信息。在特定人語(yǔ)音增強(qiáng)算法中,特定人特征信息是經(jīng)過(guò)大量特定人的語(yǔ)音訓(xùn)練后得到的高斯混合模型(GMM)。根據(jù)語(yǔ)音存在概率對(duì)不同信號(hào)譜的估計(jì)過(guò)程和權(quán)重系數(shù)的影響,分別從先驗(yàn)信噪比估計(jì)、IMCRA噪聲估計(jì)和OMLSA語(yǔ)音估計(jì)三個(gè)角度,利用特定人的GMM模型對(duì)該算法進(jìn)行了改進(jìn)。在多種噪聲類(lèi)型和輸入信噪比條件下,利用六種客觀評(píng)價(jià)指標(biāo)對(duì)所提出的特定人語(yǔ)音增強(qiáng)算法和其他經(jīng)典算法進(jìn)行了對(duì)比測(cè)試。通過(guò)實(shí)驗(yàn)結(jié)果表明,本文所給出的特定人語(yǔ)音增強(qiáng)算法無(wú)論在噪聲抑制還是語(yǔ)音失真方面,均優(yōu)于其他經(jīng)典算法。
【關(guān)鍵詞】:語(yǔ)音增強(qiáng)技術(shù) 特定說(shuō)話人 高斯混合模型 OMLSA
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.35
【目錄】:
- 摘要3-4
- ABSTRACT4-11
- 第一章 緒論11-17
- 1.1 研究背景及意義11-12
- 1.2 語(yǔ)音增強(qiáng)算法的研究現(xiàn)狀12-14
- 1.3 課題的研究?jī)?nèi)容及目標(biāo)14-15
- 1.4 論文結(jié)構(gòu)安排15-17
- 第二章 語(yǔ)音增強(qiáng)技術(shù)的概述17-33
- 2.1 譜減法18-19
- 2.2 維納濾波算法19-21
- 2.3 基于統(tǒng)計(jì)的MMSE算法21-25
- 2.3.1 基于短時(shí)頻譜幅度的MMSE估計(jì)器21-23
- 2.3.2 對(duì)數(shù)MMSE估計(jì)器23-24
- 2.3.3 結(jié)合語(yǔ)音存在概率的對(duì)數(shù)MMSE估計(jì)器24-25
- 2.4 噪聲估計(jì)算法25-29
- 2.4.1 最小值跟蹤算法26-27
- 2.4.2 最小值控制的遞歸平均MCRA算法27-29
- 2.5 語(yǔ)音增強(qiáng)的其他優(yōu)選算法29-31
- 2.5.1 信號(hào)子空間算法30
- 2.5.2 基于HMM的語(yǔ)音增強(qiáng)算法30-31
- 2.6 本章小結(jié)31-33
- 第三章 特定人語(yǔ)音增強(qiáng)系統(tǒng)33-41
- 3.1 特定人語(yǔ)音增強(qiáng)的總體框架33
- 3.2 前端去噪預(yù)處理算法33-34
- 3.3 說(shuō)話人識(shí)別算法34-36
- 3.4 基于特定人的語(yǔ)音增強(qiáng)算法36-37
- 3.5 去噪預(yù)處理的測(cè)試結(jié)果及性能分析37-40
- 3.6 本章小結(jié)40-41
- 第四章 基于GMM和OMLSA的特定人語(yǔ)音增強(qiáng)算法41-61
- 4.1 基于MFCC和GMM的說(shuō)話人特征提取方法42-43
- 4.1.1 MFCC參數(shù)的GMM模型建立42-43
- 4.1.2 說(shuō)話人特征信息的頻域轉(zhuǎn)換43
- 4.2 基于特定人特征的IMCRA噪聲估計(jì)器43-49
- 4.2.1 IMCRA噪聲估計(jì)器44-45
- 4.2.2 基于特定人特征改進(jìn)的SD-IMCRA方法45-47
- 4.2.3 特征系數(shù)的選取47-49
- 4.2.4 基于特定人的IMCRA噪聲估計(jì)性能分析49
- 4.3 基于特定人特征的先驗(yàn)信噪比估計(jì)方法49-53
- 4.3.1 先驗(yàn)信噪比估計(jì)的直接判決法51
- 4.3.2 基于特征人特征改進(jìn)的先驗(yàn)信噪比估計(jì)SD-DD方法51-52
- 4.3.3 特征系數(shù)的選取及應(yīng)用擴(kuò)展52-53
- 4.4 基于特定人特征的OMLSA語(yǔ)音估計(jì)器53-59
- 4.4.1 OMLSA語(yǔ)音估計(jì)器54-56
- 4.4.2 基于特定人信息改進(jìn)的SD-OMLSA語(yǔ)音估計(jì)56-58
- 4.4.3 特征系數(shù)的選取和分析58-59
- 4.5 本章小結(jié)59-61
- 第五章 測(cè)試結(jié)果及性能分析61-75
- 5.1 語(yǔ)音增強(qiáng)算法的性能評(píng)估方法61-64
- 5.1.1 主觀音質(zhì)評(píng)估方法61-63
- 5.1.2 客觀音質(zhì)評(píng)估方法63-64
- 5.2 基于特定人的語(yǔ)音增強(qiáng)算法的測(cè)試結(jié)果64-73
- 5.2.1 測(cè)試環(huán)境64
- 5.2.2 基于特定人的SD-IMCRA-OMLSA算法性能測(cè)試64-68
- 5.2.3 基于通用說(shuō)話人特征的USD-IMCRA-OMLSA算法性能測(cè)試68-69
- 5.2.4 基于特定人先驗(yàn)信噪比的維納濾波算法性能測(cè)試69-70
- 5.2.5 特定人語(yǔ)音增強(qiáng)算法性能分析70-73
- 5.3 本章小結(jié)73-75
- 第六章 工作總結(jié)與展望75-77
- 6.1 本文的主要研究成果75-76
- 6.2 后續(xù)研究工作76-77
- 參考文獻(xiàn)77-81
- 攻讀碩士學(xué)位期間已發(fā)表或錄用的論文81-83
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語(yǔ)音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報(bào);2000年07期
2 姚峰英,張敏;用于語(yǔ)音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報(bào);2002年05期
3 彭煊,劉金福,王炳錫;基于獨(dú)立分量分析的語(yǔ)音增強(qiáng)[J];信號(hào)處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語(yǔ)音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語(yǔ)音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報(bào);2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語(yǔ)音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報(bào);2004年01期
7 孫新德;一種改進(jìn)的語(yǔ)音增強(qiáng)方法及實(shí)現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
8 錢(qián)國(guó)青;趙鶴鳴;;基于改進(jìn)譜減算法的語(yǔ)音增強(qiáng)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運(yùn)偉;語(yǔ)音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達(dá)太;;語(yǔ)音增強(qiáng)及其消噪能力研究[J];微電子學(xué)與計(jì)算機(jī);2006年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語(yǔ)音增強(qiáng)系統(tǒng)性能評(píng)測(cè)方法綜述[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語(yǔ)音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語(yǔ)音增強(qiáng)方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國(guó)慶;;諧波能量匯集度在語(yǔ)音增強(qiáng)中的應(yīng)用[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
5 國(guó)雁萌;;一種極低信噪比條件下的語(yǔ)音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語(yǔ)音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬(wàn)海斌;;語(yǔ)音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
9 魏臻;張景達(dá);陸陽(yáng);;嵌入式系統(tǒng)中語(yǔ)音增強(qiáng)改進(jìn)算法的研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語(yǔ)音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 歐世峰;變換域語(yǔ)音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語(yǔ)音增強(qiáng)方法及質(zhì)量評(píng)估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計(jì)模型的語(yǔ)音增強(qiáng)算法研究[D];吉林大學(xué);2011年
4 方瑜;語(yǔ)音增強(qiáng)相關(guān)問(wèn)題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語(yǔ)音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動(dòng)通信的單通道語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語(yǔ)音增強(qiáng)的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語(yǔ)音增強(qiáng)方法研究[D];吉林大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 肖佩霖;雙通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 魏有權(quán);基于噪聲估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
3 郭栗;特定人語(yǔ)音增強(qiáng)算法的研究[D];上海交通大學(xué);2015年
4 熊敏;基于巴克域語(yǔ)音增強(qiáng)算法的研究與實(shí)現(xiàn)[D];湖南大學(xué);2009年
5 張濤;基于時(shí)域?yàn)V波器的語(yǔ)音增強(qiáng)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
6 楊海波;基于耳蝸濾波及諧波特性的語(yǔ)音增強(qiáng)方法研究[D];蘭州大學(xué);2010年
7 靳晨升;語(yǔ)音增強(qiáng)算法的研究[D];太原理工大學(xué);2010年
8 孟靜;語(yǔ)音增強(qiáng)算法性能的評(píng)價(jià)研究[D];蘭州交通大學(xué);2010年
9 馮巖;基于提升小波的語(yǔ)音增強(qiáng)算法的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
10 卓露;語(yǔ)音增強(qiáng)算法的研究與實(shí)現(xiàn)[D];湖北工業(yè)大學(xué);2011年
本文關(guān)鍵詞:特定人語(yǔ)音增強(qiáng)算法的研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):258495
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/258495.html