天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于雙向循環(huán)神經(jīng)網(wǎng)絡的藏語語音識別研究

發(fā)布時間:2022-02-21 20:57
  隨著智能手機的出現(xiàn),終端的應用便成為了當今技術的發(fā)展潮流。蘋果公司在智能手機里引入了語音識別的技術,掀起了人機交互的熱潮。在人們的互相溝通中語音是最直接最方便的交流方式,比起鼠標,鍵盤這些設備,語音是最快捷也是最受歡迎的輸入方法。由于傳統(tǒng)的語音識別模型對非特定人和復雜多變的語音不能夠很好識別和目前語音識別方面對藏語的研究較少,所以本文的研究是基于雙向循環(huán)神經(jīng)網(wǎng)絡的藏語語音識別研究,雙向循環(huán)神經(jīng)網(wǎng)絡傾向處理序列性數(shù)據(jù),利用雙向循環(huán)神經(jīng)網(wǎng)絡進行藏語語音識別,可以提高語音的穩(wěn)定性和準確率。本文的研究內(nèi)容如下:1)語音獲取。從語料庫中截取一段音頻作為輸入,輸入到語音系統(tǒng)中。2)預處理。語音信號的預處理操作分別是預加重,分幀,加窗,預處理首先要對語音進行抗混疊濾波的處理,這是因為人們本身也會對語音造成影響,這個操作是盡可能的降低頻率折疊導致虛假頻率的成分;其次,人們說話時會產(chǎn)生口唇輻射,通過進行預加重,提高高頻分辨率;語音信號的特點是短時平穩(wěn),所以預加重后面要進行分幀加窗。預處理操作能夠進一步提高語音識別的識別率。3)特征提取,F(xiàn)在能夠選用的提取方式可選范圍較大,此次研究圍繞的提取方式是基于快速... 

【文章來源】:青海師范大學青海省

【文章頁數(shù)】:50 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀與發(fā)展前景
    1.3 主要內(nèi)容
    1.4 論文結(jié)構(gòu)
第二章 語音識別的預處理
    2.1 語音識別系統(tǒng)
    2.2 語音的預處理
        2.2.1 預加重
        2.2.2 分幀加窗
        2.2.3 短時時域分析
        2.2.4 短時頻域分析
        2.2.5 端點檢測
    2.3 本章小結(jié)
第三章 語音識別的特征提取
    3.1 引言
    3.2 快速傅立葉變換定義
        3.2.1 傅立葉變換
        3.2.2 快速傅立葉變換
        3.2.3 Mel頻率倒譜系數(shù)
    3.3 MFCC特征提取
    3.4 本章小結(jié)
第四章 基于雙向循環(huán)神經(jīng)網(wǎng)絡的聲學建模
    4.1 引言
    4.2 循環(huán)神經(jīng)網(wǎng)絡
        4.2.1 循環(huán)神經(jīng)網(wǎng)絡的模型結(jié)構(gòu)
        4.2.2 循環(huán)神經(jīng)網(wǎng)絡的訓練方法
        4.2.3 長短時神經(jīng)網(wǎng)絡
    4.3 雙向循環(huán)神經(jīng)網(wǎng)絡
        4.3.1 雙向循環(huán)網(wǎng)絡的模型結(jié)構(gòu)
        4.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡的訓練方法
    4.4 本章小節(jié)
第五章 基于雙向循環(huán)神經(jīng)網(wǎng)絡的藏語語音識別
    5.1 TensorFlow簡介
    5.2 基于雙向循環(huán)神經(jīng)網(wǎng)絡的藏語語音識別系統(tǒng)
        5.2.1 語料庫的介紹
        5.2.2 藏語語音預處理
        5.2.3 藏語語音特征提取
        5.2.4 CTC算法
    5.3 實驗結(jié)果
        5.3.1 系統(tǒng)性能受到不同參數(shù)的影響
        5.3.2 基于雙向循環(huán)神經(jīng)網(wǎng)絡藏語語音識別系統(tǒng)性能
    5.4 本章小結(jié)
第六章 總結(jié)與展望
    6.1 本文工作總結(jié)
    6.2 本文工作展望
參考文獻
致謝
個人簡歷
在校期間的研究成果


【參考文獻】:
期刊論文
[1]基于循環(huán)神經(jīng)網(wǎng)絡的語音識別研究[J]. 唐美麗,胡瓊,馬廷淮.  現(xiàn)代電子技術. 2019(14)
[2]基于DNN的低資源語音識別特征提取技術[J]. 秦楚雄,張連海.  自動化學報. 2017(07)
[3]基于深度學習神經(jīng)網(wǎng)絡的孤立詞語音識別的研究[J]. 王山海,景新幸,楊海燕.  計算機應用研究. 2015(08)
[4]基于層次稀疏DBN的瓶頸特征提取方法[J]. 王一,楊俊安,劉輝,柳林.  模式識別與人工智能. 2015(02)
[5]深度學習神經(jīng)網(wǎng)絡在語音識別中的應用[J]. 劉豫軍,夏聰.  網(wǎng)絡安全技術與應用. 2014(12)
[6]卷積神經(jīng)網(wǎng)絡在語音識別中的應用[J]. 張晴晴,劉勇,王智超,潘接林,顏永紅.  網(wǎng)絡新媒體技術. 2014(06)
[7]基于LDA-MFCC的藏語語音特征提取技術研究[J]. 普次仁,頓珠次仁.  西藏大學學報(自然科學版). 2014(01)
[8]說話人識別中MFCC參數(shù)提取的改進[J]. 胡政權,曾毓敏,宗原,李夢超.  計算機工程與應用. 2014(07)
[9]用于噪聲魯棒性語音識別的子帶能量規(guī)整感知線性預測系數(shù)[J]. 蔡尚,金鑫,高圣翔,潘接林,顏永紅.  聲學學報. 2012(06)
[10]基于HMM和新型前饋型神經(jīng)網(wǎng)絡的語音識別研究[J]. 馮宏偉,薛蕾.  計算機工程與設計. 2010(24)

碩士論文
[1]基于深度學習的藏語非特定人連續(xù)語音識別研究[D]. 周楠.中央民族大學 2017
[2]藏語語音深度特征提取及語音識別研究[D]. 劉曉鳳.中央民族大學 2016
[3]基于嵌入式語音識別系統(tǒng)的研究[D]. 宋艷.西安科技大學 2011
[4]量子智能算法及其在語音識別中的應用[D]. 陳蘭.南京郵電大學 2011
[5]基于特定人小詞匯量藏語語音特征值提取的研究[D]. 德慶卓瑪.西藏大學 2010
[6]基于神經(jīng)網(wǎng)絡的語音識別研究[D]. 王偉臻.浙江大學 2008
[7]一種基于RBF神經(jīng)網(wǎng)絡的命令集語音識別系統(tǒng)研究[D]. 曾敏.廣西大學 2007
[8]噪聲環(huán)境下語音特征提取前端處理及優(yōu)化幀算法研究[D]. 孫穎.太原理工大學 2007
[9]基于HMM噪聲背景下的語音識別方法的研究[D]. 黃湘松.哈爾濱工程大學 2005



本文編號:3638026

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3638026.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c546f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com