當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究

發(fā)布時(shí)間：2017-05-04 04:11

本文關(guān)鍵詞：基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究，由筆耕文化傳播整理發(fā)布。

【摘要】：基于計(jì)算聽覺場(chǎng)景分析的語音分離技術(shù)在人工智能、機(jī)器感知和自動(dòng)語音分離等領(lǐng)域有著非常廣泛的應(yīng)用。目前國(guó)內(nèi)外學(xué)者致力于噪聲環(huán)境中語音分離的相關(guān)研究,其中語音和噪聲自動(dòng)分離的研究最為困難。多說話人的混合聲音分離系統(tǒng)難以取得令人滿意的效果,主要是因?yàn)樵诜蛛x的過程中不能綜合考慮清音和濁音的情況。本文就是在此研究基礎(chǔ)上采取耳間時(shí)間差和耳間強(qiáng)度差作為聲音的分離線索,其中就如何根據(jù)掩蔽閾值獲取掩蔽矩陣方面做了重點(diǎn)研究和探討。首先,詳細(xì)介紹了計(jì)算聽覺場(chǎng)景分析的相關(guān)理論,并對(duì)已有的依據(jù)耳間時(shí)間差和耳間強(qiáng)度差的語音分離算法進(jìn)行仿真分析,發(fā)現(xiàn)該算法中存在不能任意選取目標(biāo)語音的缺陷。其次,在已有理論的基礎(chǔ)上針對(duì)其不足之處,提出了一種縮小篩選范圍的改進(jìn)方案。通過仿真實(shí)驗(yàn)表明,優(yōu)化后的算法可以任意分離兩路來自不同方位的語音信號(hào),不但改善了系統(tǒng)的分離效果,而且消除了原始算法中存在的只能分離相對(duì)時(shí)延較小的聲源的局限性。再次,將分離得到的有效時(shí)頻段信息合成可供我們?cè)嚶牭穆曇粜盘?hào),并從時(shí)域失真度、分段信噪比、信號(hào)波形圖和主觀聽覺四個(gè)方面進(jìn)行考量,從而驗(yàn)證本文提出的改進(jìn)方法的有效性。最后,在根據(jù)掩蔽閾值篩選有效時(shí)頻段的過程中,引入三個(gè)控制范圍參數(shù)優(yōu)化系統(tǒng)的分離性能。然后從三個(gè)參數(shù)入手,逐個(gè)研究它們?cè)谙到y(tǒng)中的重要性,通過改變它們的數(shù)值,對(duì)系統(tǒng)進(jìn)行大量的實(shí)驗(yàn)仿真,衡量它們對(duì)整個(gè)系統(tǒng)分離效果的影響,繼而確定每個(gè)參數(shù)的最佳取值。
【關(guān)鍵詞】：語音分離 計(jì)算聽覺場(chǎng)景分析 聽覺掩蔽效應(yīng) 麥克風(fēng)陣列 耳間時(shí)間差 耳間強(qiáng)度差 語音合成
【學(xué)位授予單位】：燕山大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2015
【分類號(hào)】：TN912.3
【目錄】：

摘要5-6
Abstract6-10
第1章緒論10-16
1.1 課題研究的目的及意義10-11
1.2 國(guó)內(nèi)外研究現(xiàn)狀11-14
1.2.1 盲信號(hào)分離11-13
1.2.2 計(jì)算聽覺場(chǎng)景分析13-14
1.3 本文主要研究?jī)?nèi)容14
1.4 論文結(jié)構(gòu)安排14-16
第2章計(jì)算聽覺場(chǎng)景分析模型16-24
2.1 聽覺生理結(jié)構(gòu)16-18
2.1.1 外耳16-17
2.1.2 中耳17
2.1.3 內(nèi)耳17-18
2.2 聽覺場(chǎng)景分析18-20
2.2.1 同時(shí)組合18-19
2.2.2 序列組合19-20
2.2.3 聽覺場(chǎng)景分析的準(zhǔn)則20
2.3 計(jì)算聽覺場(chǎng)景的分類20-22
2.3.1 數(shù)據(jù)驅(qū)動(dòng)型CASA20-21
2.3.2 圖式驅(qū)動(dòng)型CASA21-22
2.4 聲音分離線索22-23
2.5 本章小結(jié)23-24
第3章基于CASA和麥克風(fēng)陣列的語音分離24-46
3.1 聽覺外圍24-30
3.1.1 模擬人耳濾波器組24-27
3.1.2 內(nèi)耳毛細(xì)胞的發(fā)放特性和Meddis模型27-30
3.2 特征提取30-35
3.2.1 耳間時(shí)間差I(lǐng)TD30-34
3.2.2 耳間強(qiáng)度差I(lǐng)ID34-35
3.3 聽覺組織35-39
3.3.1 聽覺掩蔽效應(yīng)35-36
3.3.2 確定聲音分離線索36-37
3.3.3 利用ITD確定有效時(shí)頻段37-38
3.3.4 利用IID確定有效時(shí)頻段38-39
3.4 波形合成39-40
3.5 聲音分離的衡量標(biāo)準(zhǔn)40-41
3.6 改進(jìn)前后的效果對(duì)比41-45
3.7 本章小結(jié)45-46
第4章語音分離系統(tǒng)的優(yōu)化46-58
4.1 系統(tǒng)流程46-48
4.2 參數(shù)的優(yōu)化48-56
4.2.1 ITD對(duì)應(yīng)參數(shù)μ的優(yōu)化48-51
4.2.2 IID對(duì)應(yīng)參數(shù)β的優(yōu)化51-53
4.2.3 IID對(duì)應(yīng)參數(shù)η的優(yōu)化53-55
4.2.4 理想?yún)?shù)的選擇55-56
4.3 誤差分析56-57
4.4 本章小結(jié)57-58
結(jié)論58-60
參考文獻(xiàn)60-63
攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果63-64
致謝64-65
作者簡(jiǎn)介65

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫前3條

1 王忠文;謝莉萍;梁杰豪;;基于計(jì)算聽覺場(chǎng)景分析的混疊語音分離算法[J];電聲技術(shù);2008年10期

2 李白燕;郭水旺;李應(yīng)生;;基于兩步法稀疏分量分析的欠定盲源分離[J];電聲技術(shù);2010年09期

3 王想實(shí);;聽覺場(chǎng)景分析簡(jiǎn)析[J];技術(shù)與市場(chǎng);2011年06期

本文關(guān)鍵詞：基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究，由筆耕文化傳播整理發(fā)布。

，

本文編號(hào)：344366

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/344366.html

上一篇：激光通信系統(tǒng)中伺服控制器設(shè)計(jì)及實(shí)現(xiàn)
下一篇：基于運(yùn)動(dòng)與紋理區(qū)域檢測(cè)的HEVC視頻編碼研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究