天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于稀疏編碼的藏語語音識別研究

發(fā)布時(shí)間:2020-06-13 21:41
【摘要】:相對于漢語和英語等大語種語音識別,藏語語音識別研究始于2005年,起步較晚,且不同語種間存在差異,采用新技術(shù)以提升藏語語音識別系統(tǒng)性能,將成為藏語語音識別研究領(lǐng)域亟待解決的問題。針對藏語單音節(jié)識別系統(tǒng),本研究主要進(jìn)行了以下工作:1.特征提取。以梅爾頻率倒譜系數(shù)作為輸入的卷積神經(jīng)網(wǎng)絡(luò)可同時(shí)獲取時(shí)序信息和空間位置信息。實(shí)驗(yàn)中提取了兩類特征,即靜態(tài)與動態(tài)的梅爾頻率倒譜系數(shù)。2.稀疏編碼。為了盡可能地消除特征間的相關(guān)性,減少與分類無關(guān)的信息,使用稀疏編碼獲取兩種梅爾頻率倒譜系數(shù)的稀疏表示。稀疏編碼采用K-SVD算法。3.分類器設(shè)計(jì)。以多維矩陣作為輸入的卷積神經(jīng)網(wǎng)絡(luò)可保持輸入數(shù)據(jù)維數(shù)不變。為了捕捉空間位置特征,選擇卷積神經(jīng)網(wǎng)絡(luò)作為分類器。4.基于稀疏編碼的藏語語音識別系統(tǒng)。該系統(tǒng)將稀疏表示后的梅爾頻率倒譜系數(shù)輸入卷積神經(jīng)網(wǎng)絡(luò)用以識別藏語單音節(jié)語音。本研究將稀疏編碼與卷積神經(jīng)網(wǎng)絡(luò)兩種技術(shù)相結(jié)合,以改善語音識別系統(tǒng)性能。通過實(shí)驗(yàn)得出以下結(jié)論:1.相對于深度神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)更適合處理高維數(shù)據(jù);2.動態(tài)梅爾頻率倒譜系數(shù)和稀疏編碼可提升藏語語音識別系統(tǒng)性能;3.本系統(tǒng)可用于藏語語音識別任務(wù)。本研究主要貢獻(xiàn)是將稀疏編碼與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合構(gòu)成基于稀疏編碼的藏語語音識別系統(tǒng)以進(jìn)行藏語語音識別。
【圖文】:

序列,激活函數(shù),收斂速度,實(shí)線


該網(wǎng)絡(luò)是一種深度前饋神經(jīng)網(wǎng)絡(luò),包含兩種不同的層間流動[38]。HDNN 可以在不損失準(zhǔn)確率的前提。隨后,Lu L. 使用序列判別訓(xùn)練準(zhǔn)則和說話人自適應(yīng)[39]。積神經(jīng)網(wǎng)絡(luò) 是一種典型的深度學(xué)習(xí)結(jié)構(gòu),是計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)系結(jié)構(gòu)之一。Krizhevsky A. 等人提出了一種 CNN,將任務(wù)[40]。激活函數(shù)為 的神經(jīng)元稱為線性。由圖 1-1 可知,,用 ReLU 的 DNN 比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(神nh 或 sigmoid)的訓(xùn)練時(shí)間要快數(shù)倍。該神經(jīng)網(wǎng)絡(luò)由 連接層組成,某些卷積層之后連接最大池化層,最后使訓(xùn)練更快,使用非常高效的 GPU 實(shí)現(xiàn)卷積運(yùn)算。為了擬合,在全連接層后加了一層“Dropout”層。在 ILSVR用該模型的變體,獲得了大賽第一名。

平面圖,平面,概念,引入時(shí)間


圖 1-2 三正交平面?臻g域中引入時(shí)間概念面,即在空間域中引入時(shí)間概念,首先,用 C處理;然后,匯總?cè)齻(gè)平面的處理結(jié)果;最(圖 1-3)。文獻(xiàn)[42]還證明了時(shí)間域中提取具有互補(bǔ)性。
【學(xué)位授予單位】:青海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN912.34

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王輝;趙悅;劉曉鳳;徐曉娜;周楠;許彥敏;;基于深度特征學(xué)習(xí)的藏語語音識別[J];東北師大學(xué)報(bào)(自然科學(xué)版);2015年04期

2 王山海;景新幸;楊海燕;;基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別的研究[J];計(jì)算機(jī)應(yīng)用研究;2015年08期

3 陳斌;牛銅;張連海;李弼程;屈丹;;聲學(xué)模型區(qū)分性訓(xùn)練中的動態(tài)加權(quán)數(shù)據(jù)選取方法[J];自動化學(xué)報(bào);2014年12期

4 陳斌;張連海;牛銅;屈丹;李弼程;;基于MCE準(zhǔn)則的語音識別特征線性判別分析[J];自動化學(xué)報(bào);2014年06期

5 黃浩;李兵虎;吾守爾·斯拉木;;區(qū)分性模型組合中基于決策樹的聲學(xué)上下文建模方法[J];自動化學(xué)報(bào);2012年09期

6 韓志艷;王健;倫淑嫻;;基于遺傳小波神經(jīng)網(wǎng)絡(luò)的語音識別分類器設(shè)計(jì)[J];計(jì)算機(jī)科學(xué);2010年11期

7 吳婭輝;劉剛;郭軍;;基于模型混淆度的模型組合算法研究[J];自動化學(xué)報(bào);2009年05期

8 張震;王化清;;語音信號特征提取中Mel倒譜系MFCC的改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2008年22期

9 劉宇紅;劉橋;任強(qiáng);;基于模糊聚類神經(jīng)網(wǎng)絡(luò)的語音識別方法[J];計(jì)算機(jī)學(xué)報(bào);2006年10期

10 朱小燕,王昱,徐偉;基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語音識別模型[J];計(jì)算機(jī)學(xué)報(bào);2001年02期



本文編號:2711782

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2711782.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶60b0c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com