天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏語連續(xù)語音識別技術(shù)研究及系統(tǒng)實(shí)現(xiàn)

發(fā)布時間:2017-04-29 23:14

  本文關(guān)鍵詞:藏語連續(xù)語音識別技術(shù)研究及系統(tǒng)實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:語音識別的主要目的就是將人類發(fā)出的語音信號轉(zhuǎn)換成對應(yīng)的文本序列,或者是計(jì)算機(jī)能夠理解的指令信息,實(shí)現(xiàn)人機(jī)自然的交互。語音識別包含許多的核心技術(shù),比如:高斯混合模型、隱馬爾可夫模型、梅爾頻率倒譜系數(shù)、多元文法語言模型、判別性訓(xùn)練和各種自適應(yīng)訓(xùn)練技術(shù)。本文主要研究了隱馬爾科夫模型及其在藏語連續(xù)語音識別中的應(yīng)用。藏語屬于漢藏語系的藏緬語族藏語支,主要有衛(wèi)藏、康巴、安多三種方言。藏文是一種多音節(jié)的拼音文字,每個音節(jié)有若干音素組成,在組詞發(fā)音方面有復(fù)雜的規(guī)則。本文結(jié)合藏語自身的特點(diǎn),建立以音素為聲學(xué)單元的隱馬爾科夫模型集,并對訓(xùn)練得到的單音素聲學(xué)模型和三音素聲學(xué)模型進(jìn)行識別率對比分析,音素識別率從68.71%提高到69.39%,音節(jié)識別率從23.44%提高到42.07%。說明上下文相關(guān)建模方法考慮了前后音的協(xié)同發(fā)音現(xiàn)象,從而使模型更能準(zhǔn)確的描述語音?紤]到藏語語音語料庫不斷增加的情況,我們引入種子模型方法用于聲學(xué)模型的訓(xùn)練,以獲得高精度的聲學(xué)模型。在當(dāng)前藏語語料比較匱乏的情況,本文還研究了基于sparse auto-encoder的英藏跨語言語音識別方法。在跨語言語音識別中,發(fā)音特征被視為最通用的語音屬性。通常使用有監(jiān)督的方式來訓(xùn)練多層感知器(MLPs)來檢測發(fā)音特征。本文中我們引入一種以半監(jiān)督方式訓(xùn)練sparse auto-encoder模型的方法,用來檢測基于發(fā)音特征的藏語語音屬性,并將其應(yīng)用到跨語言語音識別中。最后,本文采用離線訓(xùn)練的方法提前訓(xùn)練好上下文相關(guān)的三音素聲學(xué)模型,并將準(zhǔn)備好的發(fā)音詞典、三音素列表等一并移植到linux系統(tǒng)中。然后,使用QT對HTX工具進(jìn)行二次開發(fā),實(shí)現(xiàn)了藏語連續(xù)語音識別系統(tǒng)。
【關(guān)鍵詞】:語音識別 隱馬爾科夫模型 藏語發(fā)音特征屬性 聲學(xué)模型 跨語文
【學(xué)位授予單位】:中央民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
  • 摘要3-5
  • ABSTRACT5-12
  • 第一章 緒論12-17
  • 1.1 語音識別概述12-13
  • 1.2 語音識別技術(shù)的發(fā)展13-15
  • 1.2.1 國外語音識別發(fā)展13-14
  • 1.2.2 國內(nèi)語音識別發(fā)展14-15
  • 1.3 藏語語音識別研究現(xiàn)狀15
  • 1.4 本文主要內(nèi)容及結(jié)構(gòu)15-17
  • 第二章 語音識別基本原理17-30
  • 2.1 語音信號預(yù)處理18
  • 2.2 語音信號的特征提取18-22
  • 2.2.1 語音信號預(yù)加重19
  • 2.2.2 加窗分幀處理19
  • 2.2.3 語音的端點(diǎn)檢測19-20
  • 2.2.4 梅爾頻率倒譜系數(shù)(MFCC)20-22
  • 2.3 聲學(xué)模型22-29
  • 2.3.1 隱馬爾科夫模型(HMM)22-25
  • 2.3.2 HMM模型的三個問題25
  • 2.3.3 HMM三個基本算法25-29
  • 2.4 語言模型29
  • 2.5 本章小結(jié)29-30
  • 第三章 基于HTK的藏語連續(xù)語音識別聲學(xué)模型建模30-42
  • 3.1 HTK工具介紹30
  • 3.2 語音庫的建立30-31
  • 3.3 建模單元的選擇31-32
  • 3.4 HMM聲學(xué)模型建模32-40
  • 3.4.1 數(shù)據(jù)準(zhǔn)備32-35
  • 3.4.2 monophones模型訓(xùn)練35-37
  • 3.4.3 triphones模型訓(xùn)練37-38
  • 3.4.4 種子模型38-39
  • 3.4.5 識別測試39-40
  • 3.5 識別結(jié)果與分析40-41
  • 3.6 本章小結(jié)41-42
  • 第四章 基于sparse auto-encoder的英藏跨語言語音識別研究方法42-52
  • 4.1 引言42-43
  • 4.2 英語和藏語的AF-to-Phone映射43-46
  • 4.3 跨語言音素識別框架46
  • 4.4 sparse auto-encoder算法46-48
  • 4.5 實(shí)驗(yàn)與結(jié)果分析48-50
  • 4.6 本章小結(jié)50-52
  • 第五章 藏語拉薩話連續(xù)語音識別系統(tǒng)的實(shí)現(xiàn)52-56
  • 5.1 語音識別系統(tǒng)架構(gòu)52-53
  • 5.2 藏語拉薩話語音識別系統(tǒng)實(shí)現(xiàn)53-55
  • 5.3 本章小結(jié)55-56
  • 第六章 總結(jié)與展望56-58
  • 6.1 總結(jié)56
  • 6.2 展望56-58
  • 參考文獻(xiàn)58-62
  • 致謝62-63
  • 攻讀碩士期間發(fā)表的學(xué)術(shù)論文目錄63

【引證文獻(xiàn)】

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 孫輝;徐明星;燕鵬舉;吳文虎;;電話語音數(shù)據(jù)庫的收集和標(biāo)注[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年


  本文關(guān)鍵詞:藏語連續(xù)語音識別技術(shù)研究及系統(tǒng)實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。



本文編號:335804

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/335804.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5dbaa***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
久久老熟女一区二区三区福利| 亚洲黄片在线免费小视频| 人妻内射精品一区二区| 内射精品欧美一区二区三区久久久| 午夜福利大片亚洲一区| 精品香蕉一区二区在线| 久久精品少妇内射毛片| 一区二区在线激情视频| 中文字幕亚洲人妻在线视频| 国产一区欧美午夜福利| 超碰在线免费公开中国黄片| 日本国产欧美精品视频| 国产精品日本女优在线观看| 午夜亚洲精品理论片在线观看| 欧美日本道一区二区三区| 韩国激情野战视频在线播放| 美国欧洲日本韩国二本道| 久热在线视频这里只有精品| 日韩国产精品激情一区| 精品人妻一区二区四区| 色婷婷成人精品综合一区| 日韩欧美第一页在线观看| 老司机精品视频在线免费看| 欧美色欧美亚洲日在线| 中文字幕五月婷婷免费 | 爽到高潮嗷嗷叫之在现观看| 日韩精品中文字幕亚洲| 东北女人的逼操的舒服吗| 日本午夜精品视频在线观看| 麻豆欧美精品国产综合久久| 亚洲视频偷拍福利来袭| 日本欧美一区二区三区就| 亚洲最新中文字幕一区| 日本视频在线观看不卡| 福利专区 久久精品午夜| 亚洲一区二区三区国产| 亚洲精品一区二区三区日韩| 99亚洲综合精品成人网色播| 国产欧美日韩精品一区二区| 色哟哟精品一区二区三区| 麻豆欧美精品国产综合久久|