基于深度神經網絡的安多藏語語音識別
【學位單位】:青海師范大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TN912.34;TP183
【部分圖文】:
研究現(xiàn)狀包括兩個階段:設計階段和決策階段,語料庫建設、預處理、特征提取、模型訓獲取、預處理、特征提取、分類決策等。環(huán)節(jié),因此,下文主要介紹特征提取和模語音信號 語音特征知語音信號 語音特征分類決策模型訓練
圖 1-1 藏語三大方言的地理分布范圍間的發(fā)音差異較大,但文字是統(tǒng)一的。藏文字母和 4 個元音字母。30 個輔音字母為: ,4個元音字母為: 。按照下組合構成字符;字符通過左右組合構成音最小的語音單位,也是最小的語義單位。音節(jié)以及句子。書寫時,用專門的分隔符― ‖把相鄰 。音主要有以下幾方面的特點:1)安多方言復沒有聲調;3)安多方言有送氣清擦音聲母;方言無復元音;6)安多方言無長元音;7)安言在發(fā)音上有較多獨特的地方。因此,本文的
能在訓練樣本集中觀測到它們的值,因此工神經網絡具有非常重要的作用,目的是將網絡可以任意逼近任何非線性函數(shù)。常見數(shù)將取值為 的數(shù)映射到 之如圖 2-2 所示:
【參考文獻】
相關期刊論文 前10條
1 王山海;景新幸;楊海燕;;基于深度學習神經網絡的孤立詞語音識別的研究[J];計算機應用研究;2015年08期
2 王一;楊俊安;劉輝;柳林;;基于層次稀疏DBN的瓶頸特征提取方法[J];模式識別與人工智能;2015年02期
3 張晴晴;劉勇;王智超;潘接林;顏永紅;;卷積神經網絡在語音識別中的應用[J];網絡新媒體技術;2014年06期
4 普次仁;頓珠次仁;;基于LDA-MFCC的藏語語音特征提取技術研究[J];西藏大學學報(自然科學版);2014年01期
5 陳斌;張連海;牛銅;屈丹;李弼程;;基于MCE準則的語音識別特征線性判別分析[J];自動化學報;2014年06期
6 蔡尚;金鑫;高圣翔;潘接林;顏永紅;;用于噪聲魯棒性語音識別的子帶能量規(guī)整感知線性預測系數(shù)[J];聲學學報;2012年06期
7 黃浩;李兵虎;吾守爾·斯拉木;;區(qū)分性模型組合中基于決策樹的聲學上下文建模方法[J];自動化學報;2012年09期
8 王彪;;基于LPCC參數(shù)的語音識別系統(tǒng)[J];電子設計工程;2012年07期
9 伊·達瓦;匂坂芳典;中村哲;;語料資源缺乏的連續(xù)語音識別方法的研究[J];自動化學報;2010年04期
10 劉雅琴;智愛娟;;幾種語音識別特征參數(shù)的研究[J];計算機技術與發(fā)展;2009年12期
相關碩士學位論文 前5條
1 周楠;基于深度學習的藏語非特定人連續(xù)語音識別研究[D];中央民族大學;2017年
2 劉曉鳳;藏語語音深度特征提取及語音識別研究[D];中央民族大學;2016年
3 張宇聰;基于深度學習的藏語拉薩方言語音識別的研究[D];西北師范大學;2016年
4 崔天宇;基于HMM的語音識別系統(tǒng)的研究與實現(xiàn)[D];吉林大學;2016年
5 德慶卓瑪;基于特定人小詞匯量藏語語音特征值提取的研究[D];西藏大學;2010年
本文編號:2857502
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2857502.html