天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學習的藏語拉薩方言語音識別的研究

發(fā)布時間:2017-08-16 12:22

  本文關鍵詞:基于深度學習的藏語拉薩方言語音識別的研究


  更多相關文章: 藏語語音識別 深度學習 長短時記憶網絡 隱馬爾可夫模型 Tandem特征


【摘要】:讓機器聽懂人類的話、根據人類的命令完成工作,這是許多科研人員多年來的努力方向。近些年隨著計算機計算能力的提高以及大數據的出現,深度學習算法在各個領域取得了廣泛的應用。深度學習網絡是一種含有多隱含層的人工神經網絡,在提取特征時,具有比傳統(tǒng)聲學特征提取器更好的表達能力。許多研究已經將深度學習算法應用到了語音識別系統(tǒng)當中,但是這種深度學習算法目前只應用于主流語言的語音識別中,還沒有引入到藏語等少數民族語言的語音識別中。本文在藏語拉薩方言語音識別中引入深度學習算法,設計了面向藏語語音識別的語料庫,采用深度學習模型--長短時記憶網絡模型作為藏語聲學特征提取器,然后應用隱馬爾可夫模型(Hidden Markov Model,HMM)進行識別。論文主要工作與創(chuàng)新如下:1.建立了一個面向藏語語音識別的藏語語料庫。首先設計了一個包含51個藏語常見字的文本語料,在對比了藏語與漢語的發(fā)音特點后,借助現有的漢語普通話標注方案SAMPA-SC,設計了藏語拉薩方言標注方案SAMPA-T,最后對藏語語料進行了錄音和標注(4人參與錄音,每人每個字讀30遍,共6120個樣本)。2.搭建了一個基于深度學習網絡的藏語聲學特征提取器。采用深度學習模型--長短時記憶(Long Short Term Memory,LSTM)網絡模型,并將這種網絡應用在藏語語音識別當中作為聲學特征提取器。利用該網絡輸出語料庫中51個字的后驗概率,并將這51維輸出激活與39維MFCC特征結合后經過PCA(Principal Component Analysis)算法降維,提取最重要的40維Tandem特征,然后將這些特征輸入給HMM進行訓練與識別。3.實現了結合長短時記憶網絡與HMM的藏語語音識別。應用長短時記憶網絡作為藏語聲學特征提取器,然后應用HMM進行藏語識別。實驗結果表明,在本文建立的語料庫測試集中,本文提出的藏語語音識別方法能夠達到80.56%的識別率。
【關鍵詞】:藏語語音識別 深度學習 長短時記憶網絡 隱馬爾可夫模型 Tandem特征
【學位授予單位】:西北師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 引言9-13
  • 1.1 研究背景及意義9
  • 1.2 研究現狀9-11
  • 1.2.1 語音識別發(fā)展歷史及研究現狀9-11
  • 1.2.2 藏語語音識別的研究現狀11
  • 1.3 本論文的結構11-12
  • 1.4 本章小結12-13
  • 第2章 藏語識別原理13-20
  • 2.1 藏語語音識別系統(tǒng)結構13
  • 2.2 語音信號處理與分析13-19
  • 2.2.1 語音信號的數字化處理14
  • 2.2.2 預處理14-15
  • 2.2.3 特征提取15-19
  • 2.3 本章小結19-20
  • 第3章 基于HMM的語音識別研究20-27
  • 3.1 HMM基本原理20-21
  • 3.2 HMM模型的三個問題21-26
  • 3.2.1 概率計算22-23
  • 3.2.2 最優(yōu)狀態(tài)序列搜索23-24
  • 3.2.3 參數估計24-26
  • 3.3 本章小結26-27
  • 第4章 深度學習模型27-36
  • 4.1 深度學習簡介27-28
  • 4.2 深度學習和淺層學習28-29
  • 4.3 深度學習的結構29-30
  • 4.4 遞歸神經網絡30-35
  • 4.4.1 多層感知器30-31
  • 4.4.2 遞歸神經網絡31-32
  • 4.4.3 長短時記憶網絡32-35
  • 4.5 本章小結35-36
  • 第5章 LSTM-HMM模型的藏語語音識別實驗36-49
  • 5.1 藏語發(fā)音介紹36-39
  • 5.1.1 藏文的介紹36-37
  • 5.1.2 藏語拉薩方言拼音的聲韻母37-38
  • 5.1.3 藏語的聲調38-39
  • 5.2 語音樣本庫的建立39-44
  • 5.2.1 文本語料庫的設計39
  • 5.2.2 語音語料的錄制39-41
  • 5.2.3 語料的切分和標注41-44
  • 5.3 語音數據特征提取44-45
  • 5.4 遞歸神經網絡配置45-47
  • 5.5 實驗結果47-48
  • 5.6 本章小結48-49
  • 第6章 總結與展望49-51
  • 6.1 論文總結49
  • 6.2 下一步的工作展望49-51
  • 參考文獻51-55
  • 攻讀學位期間的研究成果55-56
  • 致謝56

【相似文獻】

中國期刊全文數據庫 前10條

1 郭遠瓊;提高語音識別率點滴[J];電腦技術;2000年03期

2 邢文;語音識別[J];個人電腦;2000年02期

3 ;語音識別的真相[J];個人電腦;2001年12期

4 ;語音識別漸入佳境[J];個人電腦;2002年03期

5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期

6 ;語音識別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農業(yè)圖書情報學刊;2004年03期

8 韓紀慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學習技術[J];電聲技術;2004年09期

9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期

10 韓紀慶;張磊;鄭鐵然;;網絡環(huán)境下的語音識別方法[J];計算機科學;2005年01期

中國重要會議論文全文數據庫 前10條

1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學術年會論文集[C];2009年

3 李楨;高萬林;歐文浩;徐山川;;基于關鍵詞語音識別的農業(yè)信息語音服務系統(tǒng)的研究與實現[A];中國農業(yè)工程學會電氣信息與自動化專業(yè)委員會、中國電機工程學會農村電氣化分會科技與教育專委會2010年學術年會論文摘要[C];2010年

4 張冰;龍長才;羅海風;;熟悉掩蔽音背景下的目標語音識別[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過零周期轉移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉換[A];第三屆全國人機語音通訊學術會議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學術會議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應方法研究[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

中國重要報紙全文數據庫 前10條

1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年

2 閆婷;語音識別 理想與現實的距離[N];計算機世界;2007年

3 劉喜喜;語音識別將把鼠標鍵盤打入冷宮?[N];中國計算機報;2008年

4 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年

5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年

6 雨夏;語音識別重在應用[N];計算機世界;2001年

7 ;語音識別企業(yè)應用前景光明[N];計算機世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年

9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年

10 張彤;語音識別融入統(tǒng)一通信[N];網絡世界;2008年

中國博士學位論文全文數據庫 前10條

1 許金普;農產品市場信息采集的語音識別魯棒性方法研究[D];中國農業(yè)科學院;2015年

2 包希日莫;面向蒙古語的語音識別聲學建模研究[D];內蒙古大學;2016年

3 吳斌;語音識別中的后處理技術研究[D];北京郵電大學;2008年

4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應用技術研究[D];華南理工大學;2010年

5 孫f,

本文編號:683257


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/683257.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶a537a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com