天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

單通道語音分離關(guān)鍵技術(shù)研究

發(fā)布時間:2017-08-03 22:09

  本文關(guān)鍵詞:單通道語音分離關(guān)鍵技術(shù)研究


  更多相關(guān)文章: 計算聽覺場景 語音分離 音質(zhì)客觀評價算法 基音跟蹤


【摘要】:隨著智能手機的普及,人機語音交互技術(shù)又一次迎來了發(fā)展的機會,如何讓人機語音交互變得方便高效成為近年來的研究熱點。語音分離作為人機語音交互技術(shù)中的核心問題,是自動語音識別、語言自動翻譯、說話者識別等技術(shù)的有力支撐。由于很多人機語音交互的實際應(yīng)用場景中只有一個語音輸入設(shè)備,單通道語音分離技術(shù)受到許多研究人員的關(guān)注。以聽覺場景分析理論為基礎(chǔ),研究人員提出了基于計算聽覺場景分析的單通道語音分離系統(tǒng)。這種語音分離系統(tǒng)的處理過程與人類聽覺系統(tǒng)感知語音信號的過程類似,經(jīng)過不斷的改進,取得了較好的分離效果。本文對計算聽覺場景分析的相關(guān)理論和算法進行了研究,詳細的介紹了目前比較先進的Hu-Wang系統(tǒng)。并在Hu-Wang提出的單通道語音分離系統(tǒng)的基礎(chǔ)上,提出了一些改進方法,本文主要的創(chuàng)新點如下:1.本文通過使用數(shù)學形態(tài)學圖像處理技術(shù),對CASA系統(tǒng)進行初步濁音分段得到的二值掩碼圖進行了改進。傳統(tǒng)的CASA系統(tǒng)使用固定的閾值來進行濁音的初步分段,導致得到的二值掩碼圖中包含了殘余的噪聲和破損的語音。CASA系統(tǒng)后續(xù)的基音檢測和組合過程都是以這個二值掩碼圖為基礎(chǔ)的,不準確的二值掩碼圖會嚴重的影響CASA系統(tǒng)的語音分離結(jié)果。本文利用數(shù)學形態(tài)學圖像處理技術(shù),在二值掩碼圖的高頻區(qū)域利用開運算消除噪聲,在低頻區(qū)域利用閉運算修補目標語音。實驗表明,該方法能有效的提高初步濁音分段結(jié)果中目標語音信號的比例。2.針對Hu-wang串聯(lián)語音分離系統(tǒng)在控制迭代過程中的不足,本文提出了一種基于語音客觀評價算法改進迭代過程的方法。具體的做法是,對每一次迭代的結(jié)果,都經(jīng)過后續(xù)的處理過程形成語音文件,將語音文件進行p.563語音質(zhì)量檢測,通過語音質(zhì)量檢測的結(jié)果來決定是否需要再次進行迭代。實驗證明利用語音客觀評價方法控制迭代流程要比傳統(tǒng)方式更好。第一,客觀語音質(zhì)量評價算法可以根據(jù)每次迭代后目標語音的MOS-LQP評分值來控制迭代過程,讓整個語音分離系統(tǒng)能夠適用于不同的使用場景和不用的需求。第二,Hu-Wang系統(tǒng)中將數(shù)據(jù)是否收斂作為終止迭代系統(tǒng)的一個指標,而語音的客觀評價標準比這個指標更具有權(quán)威性,更適合用來控制迭代流程。
【關(guān)鍵詞】:計算聽覺場景 語音分離 音質(zhì)客觀評價算法 基音跟蹤
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.3
【目錄】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第一章 緒論10-15
  • 1.1 選題背景及研究意義10
  • 1.2 單通道語音分離技術(shù)的發(fā)展10-13
  • 1.2.1 基于CASA的語音分離技術(shù)10-12
  • 1.2.2 基于頻譜分解法的語音分離技術(shù)12-13
  • 1.2.3 基于模型的語音分離技術(shù)13
  • 1.3 本文主要工作13-14
  • 1.4 本論文的結(jié)構(gòu)安排14-15
  • 第二章 計算聽覺場景分析理論概述15-24
  • 2.1 人耳的聽覺感知系統(tǒng)15-16
  • 2.2 語音的聽覺特性16-18
  • 2.2.1 清、濁音與基音周期16-17
  • 2.2.2 聲音的掩蔽效應(yīng)17-18
  • 2.3 CASA系統(tǒng)的基本原理和目標18-20
  • 2.3.1 CASA系統(tǒng)的基本原理18
  • 2.3.2 CASA系統(tǒng)的目標18-20
  • 2.4 CASA系統(tǒng)的分類20-21
  • 2.4.1 數(shù)據(jù)驅(qū)動型CASA系統(tǒng)20
  • 2.4.2 圖式驅(qū)動型CASA系統(tǒng)20-21
  • 2.5 CASA單通道語音系統(tǒng)的難點21-22
  • 2.6 CASA語音分離系統(tǒng)的應(yīng)用前景22-24
  • 第三章 一個典型的CASA系統(tǒng)24-42
  • 3.1 聽覺前端處理24-26
  • 3.2 特征提取26-29
  • 3.2.1 自相關(guān)圖及其包絡(luò)圖26-29
  • 3.2.2 信道之間的相關(guān)性29
  • 3.3 分段29-31
  • 3.3.1 清音語音的分段30
  • 3.3.2 濁音語音的分段30-31
  • 3.4 基音檢測31-39
  • 3.4.1 給定目標語音基音情況下檢測IBM32-35
  • 3.4.2 給定IBM情況下進行基音檢測35-37
  • 3.4.3 迭代過程37-39
  • 3.5 時-頻單元標注與組合39-42
  • 第四章 基于數(shù)學形態(tài)學圖像處理的初步濁音分段42-60
  • 4.1 引言42-43
  • 4.2 數(shù)學形態(tài)學圖像處理簡介43-46
  • 4.2.1 結(jié)構(gòu)元素43
  • 4.2.2 腐蝕運算43-45
  • 4.2.3 膨脹運算45-46
  • 4.3 基于數(shù)學形態(tài)圖像處理的濁音分段46-50
  • 4.3.1 開運算濾除噪聲47-48
  • 4.3.2 閉運算修補語音信號48-50
  • 4.4 算法實現(xiàn)與評估50-58
  • 4.4.1 算法實現(xiàn)50-55
  • 4.4.2 算法評估55-58
  • 4.5 本章小結(jié)58-60
  • 第五章 基于單端客觀語音測量算法的CASA系統(tǒng)60-73
  • 5.1 引言60
  • 5.2 語音質(zhì)量評價60-63
  • 5.3 基于單端語音測量算法對CASA系統(tǒng)的改進63-65
  • 5.3.1Hu-Wang串聯(lián)語音分離系統(tǒng)的迭代過程63-64
  • 5.3.2 基于語音客觀評價方法改進串聯(lián)語音分離系統(tǒng)的迭代過程64-65
  • 5.4 算法實現(xiàn)與評估65-71
  • 5.4.1 基于語音客觀評價方法改進串聯(lián)語音分離系統(tǒng)的實現(xiàn)65-69
  • 5.4.2 算法的評估69-71
  • 5.5 本章小結(jié)71-73
  • 第六章 總結(jié)與展望73-75
  • 6.1 全文研究工作總結(jié)73
  • 6.2 展望73-75
  • 致謝75-76
  • 參考文獻76-79
  • 攻碩期間取得的成果79-80

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機應(yīng)用;2008年05期

2 張磊;劉繼芳;項學智;;基于計算聽覺場景分析的混合語音分離[J];計算機工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機應(yīng)用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學學報;2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學學報;2000年02期

6 張雪峰,劉建強,馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學學報;2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號源個數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識與技術(shù);2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計算機工程與應(yīng)用;2013年21期

中國重要會議論文全文數(shù)據(jù)庫 前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國航海學會通信導航專業(yè)委員會2004學術(shù)年會論文集[C];2004年

2 劉學觀;陳雪勤;趙鶴鳴;;基于改進遺傳算法的混疊語音分離研究[A];第十屆全國信號處理學術(shù)年會(CCSP-2001)論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學術(shù)會議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國物理聲學會議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強心理學服務(wù)社會的意識和功能——中國心理學會成立90周年紀念大會暨第十四屆全國心理學學術(shù)會議論文摘要集[C];2011年

中國博士學位論文全文數(shù)據(jù)庫 前2條

1 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學技術(shù)大學;2012年

2 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 趙訓川;基于計算聽覺場景分析和麥克風陣列的語音分離的研究[D];燕山大學;2015年

2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學;2015年

3 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學;2014年

4 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學;2012年

5 陳雪勤;基于計算聲場景分析的混疊語音分離研究[D];蘇州大學;2002年

6 丁文;非負矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學;2014年

7 汪健;基于空域濾波的語音分離研究[D];西南交通大學;2011年

8 劉仙偉;卷積語音盲分離的SOPC實現(xiàn)[D];大連理工大學;2011年

9 宋岳陽;基于單源欠定語音分離的音樂主旋律提取方法研究[D];北京郵電大學;2012年

10 吳春;基于計算聽覺場景分析的雙說話人混合語音分離研究[D];廣西大學;2014年

,

本文編號:616544

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/616544.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1ec20***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com