車載環(huán)境下駕駛員語音增強方法研究
本文關鍵詞:車載環(huán)境下駕駛員語音增強方法研究
更多相關文章: 車載環(huán)境 語音增強 小波變換 盲源分離 聲紋識別
【摘要】:車載語音識別系統(tǒng)是出于解放駕駛員雙手、提供駕駛樂趣、促進安全出行等目的而誕生的。近年來,伴隨著我國汽車使用量的激增,車載語音識別系統(tǒng)也得到了廣泛關注,國內外從2000年開始已有相關產品陸續(xù)問世,F(xiàn)有的語音識別產品,在安靜環(huán)境下識別率能達到97%左右,但在車載環(huán)境下,卻難以達到實用標準。究其原因,主要是車載環(huán)境下路況復雜,各種環(huán)境噪聲影響了識別率,嚴重時甚至會影響駕駛安全。車載語音識別系統(tǒng)中很重要的一方面是首先要在車載環(huán)境中區(qū)別出駕駛員的語音,這是后面駕駛員語音識別的關鍵,因此本文重點研究車載環(huán)境下駕駛員語音增強問題。車載環(huán)境噪聲包含語音噪聲和非語音噪聲,傳統(tǒng)的語音增強方法并不能去除非駕駛員的語音干擾,因此本文從語音分離的角度出發(fā)來增強駕駛員語音。本文所做的工作包括如下兩個方面:(1)設計了一種基于小波閾值去噪預處理與盲源分離相結合的方法。由于車載環(huán)境下駕駛員語音分離問題屬于欠定盲源分離,不易于實現(xiàn),而且盲源分離算法不能高效提高信噪比,因此引入小波閾值去噪算法作為預處理。該方法首先對帶噪語音進行小波閾值去噪,過濾掉非語音噪聲,得到包含駕駛員語音的多人混合語音。從而將欠定盲源分離問題轉化為非欠定盲源分離問題,并且大大提高了信噪比。然后采用快速獨立分量分析法對多人混合語音進行分離,得到各個說話人的獨立語音分量。(2)利用聲紋特征從多人語音中選擇出駕駛員語音分量。該方法選擇梅爾倒譜系數(shù)(MFCC)作為聲紋特征參數(shù),并用矢量量化(VQ)作為模式匹配方法。在訓練階段,訓練駕駛員的MFCC參數(shù)模板;在測試階段,對盲源分離得到的各個說話人信號提取MFCC參數(shù),計算其與模板的距離,將距離最小的語音分量判斷為駕駛員語音。對上述方法的仿真結果表明,本文所提出的駕駛員語音增強方法對復雜路況的非語音噪聲具有一定的去噪效果,并能提高信噪比;去除了非語音噪聲能夠將復雜的欠定盲源分離問題轉化為簡單的非欠定盲源分離問題,從而清晰地分離出多人混合語音分量;采用聲紋匹配的方法,不需要麥克風陣列的支持,就能準確地識別出駕駛員語音分量。該方法較為簡單、易于在車載硬件平臺上實現(xiàn)。
【關鍵詞】:車載環(huán)境 語音增強 小波變換 盲源分離 聲紋識別
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.35
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 縮略語對照表11-14
- 第一章 緒論14-18
- 1.1 引言14
- 1.2 研究背景及意義14-15
- 1.3 車載環(huán)境下駕駛員語音增強的研究進展15-17
- 1.4 論文主要研究內容和組織結構17-18
- 第二章 車載語音增強18-36
- 2.1 語音信號的特點18-20
- 2.2 車載環(huán)境噪聲分析20-21
- 2.2.1 噪聲20-21
- 2.2.2 車載噪聲21
- 2.3 語音增強常用算法21-31
- 2.3.1 譜減法22-24
- 2.3.2 維納濾波算法24-27
- 2.3.3 子空間語音增強算法27-31
- 2.4 語音增強算法的性能評估31-34
- 2.5 語音信號盲源分離34-35
- 2.6 本章小結35-36
- 第三章 一種基于小波閾值去噪和盲源分離的語音增強算法36-60
- 3.1 小波閾值去噪算法36-42
- 3.1.1 小波變換的定義37-38
- 3.1.2 離散小波變換38
- 3.1.3 常用小波函數(shù)38-39
- 3.1.4 小波閾值去噪算法39-42
- 3.2 FastICA盲源分離算法42-44
- 3.2.1 盲源分離數(shù)學模型42-43
- 3.2.2 ICA43-44
- 3.2.3 FastICA44
- 3.3 基于小波閾值去噪的盲源分離算法44-47
- 3.4 實驗仿真47-57
- 3.5 本章小結57-60
- 第四章 多人語音中的駕駛員語音識別60-72
- 4.1 聲紋60-61
- 4.2 聲紋識別方法61-67
- 4.2.1 聲紋識別61-62
- 4.2.2 常用特征提取62-66
- 4.2.3 模式匹配方法66-67
- 4.3 利用聲紋識別駕駛員語音67
- 4.4 實驗仿真67-70
- 4.5 本章小結70-72
- 第五章 總結與展望72-74
- 5.1 總結72
- 5.2 展望72-74
- 參考文獻74-78
- 致謝78-80
- 作者簡介80-81
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 宋宇寧;郭榮;朱麗軍;;基于小波基函數(shù)選取與閾值法的語音去噪算法研究[J];科技展望;2014年11期
2 朱淑琴;趙瑛;;DTW語音識別算法研究與分析[J];微計算機信息;2012年05期
3 李文;夏秀渝;何培宇;李源;;基于麥克風陣列的近場聲源定位[J];四川大學學報(自然科學版);2008年02期
4 林志斌;徐柏齡;;基于球麥克風陣列的三維空間多聲源定位(英文)[J];南京大學學報(自然科學版);2006年04期
5 馬義德,袁敏,齊春亮,劉悅,劉映杰;基于PCNN的語譜圖特征提取在說話人識別中的應用[J];計算機工程與應用;2005年20期
6 杜先平 ,隋修禮;汽車噪聲解析[J];汽車運用;2005年06期
7 張萬里,劉橋;Mel頻率倒譜系數(shù)提取及其在聲紋識別中的作用[J];貴州大學學報(自然科學版);2005年02期
8 江太輝;基于VQ的說話人識別算法與實驗[J];計算機工程與應用;2004年09期
9 王讓定,柴佩琪;語音倒譜特征的研究[J];計算機工程;2003年13期
10 趙力,鄒采榮,吳鎮(zhèn)揚;HMM在說話人識別中的應用[J];電路與系統(tǒng)學報;2001年03期
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 徐志奪;基于小波變換的語音增強算法研究[D];哈爾濱工程大學;2013年
2 盧宏;欠定盲信號分離方法研究[D];杭州電子科技大學;2011年
3 鄧玉娟;基于小波變換的語音閾值去噪算法研究[D];重慶大學;2009年
4 劉瑾;基于盲源分離的語音增強方法研究[D];大連理工大學;2006年
,本文編號:1069116
本文鏈接:http://sikaile.net/kejilunwen/wltx/1069116.html