天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究

發(fā)布時(shí)間:2017-05-04 04:11

  本文關(guān)鍵詞:基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:基于計(jì)算聽覺場(chǎng)景分析的語音分離技術(shù)在人工智能、機(jī)器感知和自動(dòng)語音分離等領(lǐng)域有著非常廣泛的應(yīng)用。目前國(guó)內(nèi)外學(xué)者致力于噪聲環(huán)境中語音分離的相關(guān)研究,其中語音和噪聲自動(dòng)分離的研究最為困難。多說話人的混合聲音分離系統(tǒng)難以取得令人滿意的效果,主要是因?yàn)樵诜蛛x的過程中不能綜合考慮清音和濁音的情況。本文就是在此研究基礎(chǔ)上采取耳間時(shí)間差和耳間強(qiáng)度差作為聲音的分離線索,其中就如何根據(jù)掩蔽閾值獲取掩蔽矩陣方面做了重點(diǎn)研究和探討。首先,詳細(xì)介紹了計(jì)算聽覺場(chǎng)景分析的相關(guān)理論,并對(duì)已有的依據(jù)耳間時(shí)間差和耳間強(qiáng)度差的語音分離算法進(jìn)行仿真分析,發(fā)現(xiàn)該算法中存在不能任意選取目標(biāo)語音的缺陷。其次,在已有理論的基礎(chǔ)上針對(duì)其不足之處,提出了一種縮小篩選范圍的改進(jìn)方案。通過仿真實(shí)驗(yàn)表明,優(yōu)化后的算法可以任意分離兩路來自不同方位的語音信號(hào),不但改善了系統(tǒng)的分離效果,而且消除了原始算法中存在的只能分離相對(duì)時(shí)延較小的聲源的局限性。再次,將分離得到的有效時(shí)頻段信息合成可供我們?cè)嚶牭穆曇粜盘?hào),并從時(shí)域失真度、分段信噪比、信號(hào)波形圖和主觀聽覺四個(gè)方面進(jìn)行考量,從而驗(yàn)證本文提出的改進(jìn)方法的有效性。最后,在根據(jù)掩蔽閾值篩選有效時(shí)頻段的過程中,引入三個(gè)控制范圍參數(shù)優(yōu)化系統(tǒng)的分離性能。然后從三個(gè)參數(shù)入手,逐個(gè)研究它們?cè)谙到y(tǒng)中的重要性,通過改變它們的數(shù)值,對(duì)系統(tǒng)進(jìn)行大量的實(shí)驗(yàn)仿真,衡量它們對(duì)整個(gè)系統(tǒng)分離效果的影響,繼而確定每個(gè)參數(shù)的最佳取值。
【關(guān)鍵詞】:語音分離 計(jì)算聽覺場(chǎng)景分析 聽覺掩蔽效應(yīng) 麥克風(fēng)陣列 耳間時(shí)間差 耳間強(qiáng)度差 語音合成
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 緒論10-16
  • 1.1 課題研究的目的及意義10-11
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-14
  • 1.2.1 盲信號(hào)分離11-13
  • 1.2.2 計(jì)算聽覺場(chǎng)景分析13-14
  • 1.3 本文主要研究?jī)?nèi)容14
  • 1.4 論文結(jié)構(gòu)安排14-16
  • 第2章 計(jì)算聽覺場(chǎng)景分析模型16-24
  • 2.1 聽覺生理結(jié)構(gòu)16-18
  • 2.1.1 外耳16-17
  • 2.1.2 中耳17
  • 2.1.3 內(nèi)耳17-18
  • 2.2 聽覺場(chǎng)景分析18-20
  • 2.2.1 同時(shí)組合18-19
  • 2.2.2 序列組合19-20
  • 2.2.3 聽覺場(chǎng)景分析的準(zhǔn)則20
  • 2.3 計(jì)算聽覺場(chǎng)景的分類20-22
  • 2.3.1 數(shù)據(jù)驅(qū)動(dòng)型CASA20-21
  • 2.3.2 圖式驅(qū)動(dòng)型CASA21-22
  • 2.4 聲音分離線索22-23
  • 2.5 本章小結(jié)23-24
  • 第3章 基于CASA和麥克風(fēng)陣列的語音分離24-46
  • 3.1 聽覺外圍24-30
  • 3.1.1 模擬人耳濾波器組24-27
  • 3.1.2 內(nèi)耳毛細(xì)胞的發(fā)放特性和Meddis模型27-30
  • 3.2 特征提取30-35
  • 3.2.1 耳間時(shí)間差I(lǐng)TD30-34
  • 3.2.2 耳間強(qiáng)度差I(lǐng)ID34-35
  • 3.3 聽覺組織35-39
  • 3.3.1 聽覺掩蔽效應(yīng)35-36
  • 3.3.2 確定聲音分離線索36-37
  • 3.3.3 利用ITD確定有效時(shí)頻段37-38
  • 3.3.4 利用IID確定有效時(shí)頻段38-39
  • 3.4 波形合成39-40
  • 3.5 聲音分離的衡量標(biāo)準(zhǔn)40-41
  • 3.6 改進(jìn)前后的效果對(duì)比41-45
  • 3.7 本章小結(jié)45-46
  • 第4章 語音分離系統(tǒng)的優(yōu)化46-58
  • 4.1 系統(tǒng)流程46-48
  • 4.2 參數(shù)的優(yōu)化48-56
  • 4.2.1 ITD對(duì)應(yīng)參數(shù)μ的優(yōu)化48-51
  • 4.2.2 IID對(duì)應(yīng)參數(shù)β的優(yōu)化51-53
  • 4.2.3 IID對(duì)應(yīng)參數(shù)η的優(yōu)化53-55
  • 4.2.4 理想?yún)?shù)的選擇55-56
  • 4.3 誤差分析56-57
  • 4.4 本章小結(jié)57-58
  • 結(jié)論58-60
  • 參考文獻(xiàn)60-63
  • 攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果63-64
  • 致謝64-65
  • 作者簡(jiǎn)介65

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前3條

1 王忠文;謝莉萍;梁杰豪;;基于計(jì)算聽覺場(chǎng)景分析的混疊語音分離算法[J];電聲技術(shù);2008年10期

2 李白燕;郭水旺;李應(yīng)生;;基于兩步法稀疏分量分析的欠定盲源分離[J];電聲技術(shù);2010年09期

3 王想實(shí);;聽覺場(chǎng)景分析簡(jiǎn)析[J];技術(shù)與市場(chǎng);2011年06期


  本文關(guān)鍵詞:基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):344366

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/344366.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2c7fc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com