天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 網絡通信論文 >

武漢方言語音識別系統(tǒng)研究

發(fā)布時間:2017-08-23 14:22

  本文關鍵詞:武漢方言語音識別系統(tǒng)研究


  更多相關文章: 武漢方言 語音識別 小波變換 重分形


【摘要】:語音識別自上世紀50年代興起一直是研究的熱點之一。我國研究語音識別技術較國外稍晚,自八十年代為其設立專項開始,到今天為止已經取得很多突破性的進展,但仍然有很多技術難關沒有攻破,除了語音識別技術的復雜性,漢語方言的多樣性也給其帶來了諸多的挑戰(zhàn)。當前,已經有一些科研人員將地方方言考慮到語音識別系統(tǒng)之中,但是由于這才處于開始階段,仍然有很多關鍵性問題沒有被解決。完整的連續(xù)語音識別系統(tǒng)主要包括四個部分:預處理,特征提取,聲學模型和語言模型。預處理模塊主要是對輸入語音信號進行處理,原始語音信號通常受到噪音的干擾,以及聲源緣故可能造成的信號較弱,通過預處理之后,語音信號在不失真的情況下能過濾掉大部分噪音,且使得原本較弱的信號得到加強。特征提取主要是提取語音信號中能夠區(qū)別不同信號的特征參數,目前應用最為廣泛的特征參數是Mel倒譜系數。聲學模型通過訓練語音庫獲取參數模型,識別階段得到最佳參數流。語音模型的作用就是根據聲學層的參數流預測某個自然語言出現的概率。本文根據著重討論其中三部分:預處理中語音端點檢測、基于HMM的聲學模型和基于統(tǒng)計的語言模型。完成的主要工作如下:1)分析了武漢方言的發(fā)音特點,對比普通話的發(fā)音特性,標注出其差異性,提取其語音特征,創(chuàng)建小型的武漢方言語音識別語料庫。2)利用小波重構語音信號,平滑處理背景噪音,改善語音端點檢測在低信噪比情形下檢測準確率低的缺點。3)提出一種基于重分形的語音端點檢測方法。利用語音信號的分形特性,逐次求取分形維數,并計算其與語音段和非語音段的相關性,以此確定語音信號的端點。4)構建基于HTK的武漢方言語音識別系統(tǒng),從不同維度提取武漢方言的不同特征參數進行語音識別實驗。
【關鍵詞】:武漢方言 語音識別 小波變換 重分形
【學位授予單位】:武漢工程大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34
【目錄】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第1章 緒論10-16
  • 1.1 語音識別研究背景10-12
  • 1.1.1 語音識別的發(fā)展歷史與現狀10-11
  • 1.1.2 國內語音識別的發(fā)展歷史與現狀11-12
  • 1.2 語音識別關鍵技術概述12-13
  • 1.3 課題研究內容及意義13-16
  • 1.3.1 研究意義13-14
  • 1.3.2 論文結構安排14-16
  • 第2章 語音端點檢測16-22
  • 2.1 語音端點檢測概述16
  • 2.2 語音端點檢測原理16-18
  • 2.3 常用語音端點檢測算法18-20
  • 2.3.1 短時能量18
  • 2.3.2 短時平均過零率18-19
  • 2.3.3 基于短時能量和過零率的雙門限檢測方法19-20
  • 2.4 本章小結20-22
  • 第3章 基于小波變換的重分形語音端點檢測方法22-38
  • 3.1 概述22-25
  • 3.1.1 分形簡介22-23
  • 3.1.2 典型單重分形維數23-24
  • 3.1.3 分形盒維數計算方法24-25
  • 3.2 多重分形25-27
  • 3.2.1 多重分形概述25-26
  • 3.2.2 廣義維數計算方法26-27
  • 3.3 分形維數的信號度量能力27-29
  • 3.4 小波去噪29-33
  • 3.4.1 小波去噪原理29-30
  • 3.4.2 合理選擇分解與重構尺度30-33
  • 3.5 重分形的語音端點檢測技術33-38
  • 3.5.1 多重分形端點檢測基本原理33-34
  • 3.5.2 重分形的相關性度量方法34
  • 3.5.3 重分形的語音端點檢測實現過程34-38
  • 第4章 基于HMM的聲學模型38-48
  • 4.1 HMM基本原理38-40
  • 4.2 HMM的核心問題40-41
  • 4.3 HMM基本算法41-46
  • 4.3.1 向前-向后算法41-44
  • 4.3.2 Viterbi算法44-45
  • 4.3.3 Baum-Welch算法45-46
  • 4.4 本章小結46-48
  • 第5章 語言模型48-56
  • 5.1 語言模型的分類48-51
  • 5.1.1 基于規(guī)則的語言模型48-49
  • 5.1.2 基于統(tǒng)計的語言模型49-51
  • 5.2 語言模型的平滑技術51-54
  • 5.2.1 線性插值平滑52
  • 5.2.2 Good-Turing平滑法52-53
  • 5.2.3 Katz平滑技術53-54
  • 5.3 語言模型的度量54-55
  • 5.3.1 困惑度54-55
  • 5.3.2 熵55
  • 5.4 本章小結55-56
  • 第6章 基于HTK的武漢方言語音識別系統(tǒng)的構建56-64
  • 6.1 HTK工作基本原理56-57
  • 6.2 語音采集與語料庫建立57-59
  • 6.2.1 聲學模型建模單元的選取57-58
  • 6.2.2 武漢方言注音符號系統(tǒng)58
  • 6.2.3 語料庫建立58-59
  • 6.3 特征提取59-60
  • 6.4 語言模型的建立與訓練60-63
  • 6.5 聲學模型訓練63-64
  • 第7章 實驗及數據分析64-70
  • 7.1 實驗樣本64
  • 7.2 實驗評價標準64-66
  • 7.3 實驗方案設計與結果分析66-70
  • 第8章 總結與展望70-72
  • 參考文獻72-78
  • 攻讀碩士期間已發(fā)表的論文78-80
  • 致謝80

【相似文獻】

中國期刊全文數據庫 前10條

1 韓紀慶,王承發(fā),呂成國,張磊,任為民,馬永林;噪聲環(huán)境下頑健的語音識別系統(tǒng)[J];電聲技術;2002年01期

2 單翼翔,張昊天,李虎生,鐘林,張進,劉加,劉潤生;郵包校核語音識別系統(tǒng)的實時實現[J];電子學報;2002年04期

3 許海天,吳及,王作英;漢語連續(xù)數字串語音識別系統(tǒng)[J];計算機工程與應用;2002年02期

4 梁釗;分布式語音識別系統(tǒng)及其相關技術[J];計算機工程與應用;2002年12期

5 武劍虹,黃石磊,匡鏡明;語音識別系統(tǒng)測試平臺設計[J];電訊技術;2003年04期

6 孫恒,李春;嵌入式語音識別系統(tǒng)的研究[J];計算機與現代化;2003年06期

7 孟建庭,吳及,王作英;分布式語音識別系統(tǒng)的架構分析和具體實現[J];電聲技術;2004年08期

8 郭罡,李錦宇,李小兵,劉波,王仁華;嵌入式命令詞語音識別系統(tǒng)[J];信號處理;2004年05期

9 黃啟良;漢語方言語音識別系統(tǒng)的構建[J];廣西科學院學報;2005年03期

10 劉彬;董金明;;語音識別系統(tǒng)[J];電子測量技術;2005年06期

中國重要會議論文全文數據庫 前10條

1 王仁華;倪晉富;;語音識別系統(tǒng)評估初探[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

2 遲邊進;方棣棠;;粗識別在大字表語音識別系統(tǒng)中的應用[A];第一屆全國語言識別學術報告與展示會論文集[C];1990年

3 劉家松;劉承璽;李愛軍;;對語音識別系統(tǒng)中一些環(huán)節(jié)的計算方法的選擇[A];第一屆全國語言識別學術報告與展示會論文集[C];1990年

4 秦勇;莫福源;李昌立;關定華;;漢語超大詞匯語音識別系統(tǒng)的研究與實現[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

5 幸璐璐;謝莎莎;王俠;孫甲松;王作英;;利用廢料模型改進受限域語音識別系統(tǒng)[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

6 胡春靜;吳善培;;不定人的語音識別系統(tǒng)[A];第三屆全國人機語音通訊學術會議論文集[C];1994年

7 方敏;浦劍濤;李成榮;臺憲青;;嵌入式語音識別系統(tǒng)的研究和實現[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

8 高勤;吳昊;袁麗;吳璽宏;遲惠生;;語音識別系統(tǒng)實時優(yōu)化方法研究及實現[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

9 孫甲松;肖熙;王作英;;利用有調拼音模型改進語音識別系統(tǒng)的穩(wěn)健性[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

10 陳立偉;趙春暉;;一種抗噪聲語音識別系統(tǒng)的設計[A];第二屆全國信息獲取與處理學術會議論文集[C];2004年

中國重要報紙全文數據庫 前10條

1 平遠;多語種交談式語音識別系統(tǒng)[N];北京電子報;2000年

2 張群英;IBM新中文語音識別系統(tǒng)動口不動手[N];中國計算機報;2000年

3 ;e-t@lk語音識別系統(tǒng)亮相中國[N];國際商報;2000年

4 北大企研中心研究部 科強 楚天 一清;我惟一 我存在[N];中國計算機報;2001年

5 ;集成信息技術提高物流精準度[N];現代物流報;2008年

6 吳德強;機器人出國當導游[N];北京科技報;2004年

7 本報記者 操秀英;手機當道 電腦讓路?[N];科技日報;2007年

8 本報記者 齊芳 通訊員 發(fā)強;中科院聲學所:探索聲音的奧秘[N];光明日報;2004年

9 宋玉慧;“傻瓜家電”在沈走俏[N];中國電子報;2002年

10 特約撰稿人 朱麗亞 本報記者 潘峰;黃學東人生路上總是快一步[N];中國高新技術產業(yè)導報;2003年

中國碩士學位論文全文數據庫 前10條

1 飛龍;蒙古語語音識別系統(tǒng)的研究與優(yōu)化[D];內蒙古大學;2009年

2 王坤卿;小詞匯量語音識別系統(tǒng)[D];中國石油大學;2010年

3 魏力;嵌入式語音識別系統(tǒng)的研究[D];武漢理工大學;2006年

4 肖翠萍;小波變換在語音識別系統(tǒng)的研究與實現[D];吉林大學;2004年

5 賀寬;車載多媒體語音識別系統(tǒng)設計[D];武漢理工大學;2008年

6 斯蕓蕓;嵌入式語音識別系統(tǒng)的設計與實現[D];重慶大學;2012年

7 高朝煌;非特定人漢語連續(xù)數字語音識別系統(tǒng)的研究與實現[D];西安電子科技大學;2011年

8 周艷萍;機器人嵌入式語音識別系統(tǒng)設計與開發(fā)[D];華南理工大學;2012年

9 龐陟儒;支持向量機語音識別系統(tǒng)的數據分析預選取算法研究[D];太原理工大學;2013年

10 葉亮亮;基于拼音音元的語音識別系統(tǒng)研究與設計[D];重慶大學;2013年

,

本文編號:725533

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/725533.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶eece9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com